Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Magic loop para modelado #30

Open
C1587S opened this issue Apr 29, 2020 · 2 comments
Open

Magic loop para modelado #30

C1587S opened this issue Apr 29, 2020 · 2 comments
Assignees
Labels
enhancement New feature or request

Comments

@C1587S
Copy link
Collaborator

C1587S commented Apr 29, 2020

Pensar en la implementación de magic loop para ser ejecutado en luigi, conservando atomicidad de las tareas en el orquestador (que se ejecute una sola cosa en cada task).

  • Los tasks de modelo deben guardar todos los hiper-parametros que el modelo utiliza (incluyendo los que están por default en sklearn)
  • Si se ejecutan varios modelos a la vez, los metadatos de sus combinaciones deben quedar guardados (también sus pickles).
  • Empezar a ver implementación tanto en sklearn tradicional y también en su versión paralelizada utilizando pyspark.
@C1587S C1587S added the enhancement New feature or request label Apr 29, 2020
@C1587S C1587S added this to the Schema Modeling milestone Apr 29, 2020
@C1587S
Copy link
Collaborator Author

C1587S commented Apr 29, 2020

Propuesta 1

  • Crear un task para cada tipo de modelo entrenado. Esto, con el fin de tener más orden sobre el guardado de los hiper-parametros que utilizan estos por individual.
    Observación: dato que hay un solo schema modelling que guarda los mismos metadatos en una tabla para todos los tipos de modelos, lo óptimo sería guardar los hiperparametros del modelo como una lista, en una columna correspondiente a dicha variable.
  • Implementar el loop en bash, aprovechando los parametros de las tareas luigi para probar combinaciones y tener un mejor control atómico del guardado de los metadatos.

@dvilla88
Copy link
Collaborator

dvilla88 commented May 6, 2020

¿Como serian las predicciones ahora? Nota (mismo modelo para todos los distritos)
Distrito - Dia

¿Para grupo de referencia que sugerencia nos das?
Distrito de referencia donde haya mas registros

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

5 participants