Skip to content

Red Neuronal partícipe del proyecto "Reconocimiento de cantos de aves" del programa de SS "Desarrollo de sistemas inteligentes usando deep learning" en el Laboratorio L52+, dirigido por el Dr. Ivan Vladimir Meza Ruiz en el IIMAS, UNAM.

Notifications You must be signed in to change notification settings

sebastianalamina/BirdsNN

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Reconocimiento de cantos de aves 🐦🔉👂

El proyecto Reconocimiento de cantos de aves es uno de los varios proyectos del Laboratorio L52+, enfocados en el Procesamiento del Lenguaje Natural (NLP) mediante técnicas de inteligencia artificial, aprendizaje profundo, aprendizaje automático, y ciencia de datos.

Estructura del proyecto 🗂️

  • El archivo Birds NN.ipynb es el notebook de Jupyter con la red neuronal propuesta.

  • El archivo execute_nn.sh es un script en shell que ejecuta el notebook en segundo plano (y aún cuando el usuario de la máquina no esté loggeado) sin restricciones sobre el tiempo de ejecución, arrojando el resultado dentro de runs/notebooks/ con el año, mes, día, hora y minuto del comienzo de la ejecución.

  • El archivo execute_stats.sh es un script en shell que levanta un servidor de Jupyter (para visualizar las ejecuciones dentro de runs/notebooks/) y otro servidor de Tensorboard (para visualizar las estadísticas obtenidas de runs/tensorboard/).

    • NOTA: Al terminar de analizar las estadísticas de Tensorboard, es necesario cerrar este servidor. Una opción es recordar/anotar el PID del servidor de Tensorboard (que se imprime en la consola al iniciar el servidor) y terminar este proceso al finalizar.
  • La carpeta runs/ incluye los archivos resultantes de ejecutar el notebook.

    • runs/models/ almacena los parámetros ajustables (i.e. pesos y sesgos) del modelo de PyTorch, en caso de que se desee cargar y probar algún modelo en particular mediante la función load_state_dict de PyTorch.
    • runs/notebooks/ almacena los notebooks ejecutados en segundo plano con nbconvert, mostrando la salida de las celdas ejecutadas.
    • runs/python_objects/ almacena distintos objetos de Python (mediante su módulo nativo pickle) para su cargado dentro del notebook.
    • runs/tensorboard/ almacena los archivos que el SummaryWriter escribe para la visualización de estadísticas en Tensorboard.

Documentación 📖

  • Éste es un tutorial de L52+ sobre la biblioteca Librosa para el procesamiento de audios.

  • Este apartado de la documentación de nbconvert explica cómo utilizar esta herramienta para la ejecución en segundo plano de un notebook de Jupyter, limitando cierto tiempo de ejecución, arrojando el resultado en un archivo, manejando posibles errores, etc.

  • Este artículo muestra cómo trabajar con ambientes de Python dentro de Jupyter.

  • Este artículo explica el procesamiento de los audios; cómo se clasifican a partir de sus archivos nativos, pasando por sus conversiones a espectrogramas, por capas neuronales convolucionales, y por clasificadores lineales.

  • Este artículo explica la clasificación de cantos de aves usando una Red Neuronal Siamesa, y detalla una arquitectura similar a la de este proyecto.

  • La figura 1, de este paper que explica la identificación de aves mediante una Red Neuronal Siamesa, ejemplifica el uso de capas convolucionales (con sus respectivos kernels, paddings, poolings, etc.) y capas lineales para la clasificación de una entrada.

  • Este paper detalla (especialmente en su figura 1) el flujo de una arquitectura que determina qué tan similares son dos archivos de audio.

  • Este artículo explica la técnica t-SNE para la visualización de datos multidimensionales en TensorBoard.

  • Este artículo teoriza sobre las curvas ROC y AUC.

Autores 👥

About

Red Neuronal partícipe del proyecto "Reconocimiento de cantos de aves" del programa de SS "Desarrollo de sistemas inteligentes usando deep learning" en el Laboratorio L52+, dirigido por el Dr. Ivan Vladimir Meza Ruiz en el IIMAS, UNAM.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published