Este repositorio de github contiene material para el workshop "Introduccion a Machine Learning y Deep Learning" dentro de la RIIAA '19. Este taller desarollara conceptos basicos de machine learning usnado como base los datos de simulacion usando para el decusbrimiento del boson de Higgs. No te preocupes, no necesitas saber fisica para trabajar con estos datos, pero podria ser util. Los datos de este taller estan descritos en https://higgsml.lal.in2p3.fr/files/2014/04/documentation_v1.8.pdf y estan basados en el Kaggle challenge: https://www.kaggle.com/c/higgs-boson.
La mayoría de las prácticas de los talleres se desarrollarán en Python 3.7+ usando la biblioteca Tensorflow 2.0, que adopta Keras como interfaz de alto nivel para construir y entrenar redes neuronales.
Cosas para preparar
- Una laptop.
- Este repositorio de GitHub clonado y actualizado antes del taller.
- Un sentido aventurero en los datos.
- Un ambiente Python 3.7+ con Anaconda (ver opciones 1 y 2 abajo).
Los talleres serán impartidos usando notebooks de Jupyter, documentos con código ejecutable, texto, ecuaciones, visualizaciones, imágenes y demás material. Los notebooks se pueden crear y ejecutar en la nube vía Google Colab (opción 1) o de manera local en tu computadora a través de Jupyter Notebooks (opción 2).
Colab es un servicio de Google para ejecutar notebooks en la nube. Provee ambientes de Python 2 y 3 con CPUs, GPUs y TPUs. ¡Y es gratis! Solo necesitas tener una cuenta de Google o crear una.
Recomendamos que elijas un ambiente con Python 3 y GPU. Para activarlo:
- Abre el menú
Entorno de ejecución
- Elige la opción
Restablecer todos los entornos de ejecución...
. - Vuelve a abrir
Entorno de ejecución
- Elige
Cambiar tipo de entorno de ejecución
- Selecciona Python 3 como
Tipo de ejecución
y GPU de la lista deAcelerador por hardware
La siguiente captura de pantalla ilustra este proceso.
En Colab puedes crear un nuevo notebook, subir uno existente desde tu computadora o importarlo de Google Drive o GitHub.
Para tener la versión de Python 3.7+ y todas las bibliotecas instaladas en cualquier plataforma, recomendamos que uses Anaconda y generes un ambiente con el archivo environment.yml
de este repositorio usando una terminal y el comando:
conda env create -n riiaa19 -f environment_cpu.yml
Cambia el nombre riia19
por tu nombre favorito para el ambiente. Si cuentas con un GPU Nvidia y deseas aprovecharlo cambia el archivo environment_cpu.yml
a environment_gpu.yml
.
Para activar el ambiente que creaste, en una terminal ingresa el comando
conda activate riiaa19
Una vez activado, puedes ejecutar la aplicación de Jupyter Notebook
jupyter notebook
Este comando abrirá una pestaña o ventana en tu navegador web, como se muestra en la siguiente captura de pantalla:
Al igual que en Google Colab, puedes crear un nuevo notebook seleccionando el botón New
y posteriormente Python 3
. De forma alternativa, puedes abrir uno existente seleccionando el archivo del notebook (con extensión .ipynb
) dentro del directorio donde ejecutaste Jupyter Notebook. Con el botón Upload
agregas archivos que se encuentran en otra parte de tu computadora a este directorio. Para cerrar Jupyter Notebook, presiona el botón Quit
y posteriormente cierra la pestaña o ventana de tu navegador web.
Para desactivar el ambiente riiaa19
de Anaconda simplemente haz
conda deactivate