Este repositorio contiene las transcripciones de las versiones estenográficas de los informes diarios sobre Coronavirus en México desde el inicio de los mismos en Febrero 2020 organizados en CSVs.
El objetivo de este repositorio es mostrar el alcance de análisis de datos aplicado a temas de interés público en México.
Buscamos que personas con interés en análisis, creación de visualizaciones y con un sentido de curiosidad en datos, cuenten con una base de datos actualizada constantemente con la que se pueda generar contenido que promueva el aprendizaje.
Si observas que este repositorio no ha sido actualizado, solo menciónanos en Twitter ( @nostrodata ) para actualizarlo a la brevedad :)
Las transcripciones se encuentran ordenadas con la siguiente estructura:
— Folder ( año )
— Folder ( mes-año )
— Folder ( día del mes )
— Folder ( csv_por_participante )
— CSV's de las intervenciones de cada participante.
— Folder ( wordmaps_por_participante )
— PNG's de mapas de las palabras mas usadas por cada participante.
— CSV de la transcripción completa con todos los participantes.
— PNG de mapa de las palabras mas usadas por todos los participantes.
En los archivos CSV's se incluye una columna con nombre: "Sentimiento" cuyo objetivo es agregar una métrica de sentimiento al texto del renglón del CSV. Por ahora, este dato esta en 0s y NO es válido ni representativo del sentmiento del texto en el renglón. POR FAVOR IGNORA este dato.
El repositorio contiene la licencia: "Creative Commons Attribution Share Alike 4.0 International" que puede ser encontrada en este repositorio en el archivo LICENSE.md y en el siguiente hipervínculo: https://creativecommons.org/licenses/by-sa/4.0/
Si utilizas alguno de los archivos en este repositorio, solo te pedimos nos menciones:
- @nostrodata
- https://www.nostrodata.com