Hace aproximadamente un mes, IBM reveló un nuevo un nuevo conjunto de herrramientas diseñado para desarrolladores y científicos de datos que ayuda a detectar tendencias dentro de la pandemia que se vive a día de hoy.

Utilizando Jupyter Notebooks, este kit de herramientas está diseñado para realizar análisis en profundidad de la información obtenida desde fuentes oficiales respecto al Covid-19. Por ejemplo, un usuario podría analizar datos a nivel de condado en Estados Unidos para encontrar correlaciones entre los niveles de pobreza y los niveles de infección.

La solución agrega y limpia datos de fuentes autorizadas, formateándolos para el análisis con herramientas como Pandas y Scikit-Learn. Para los condados de los Estados Unidos por ejemplo, IBM se basa en los datos del COVID-19 Data Repository, administrado por el Center of Systems Science and Engineering (CSSE) en la Johns Hopkins University. Con el fin de complementar, el conjunto de herramientas utiliza además datos del New York Times Coronavirus (Covid-19) Data.

Al ser open-source, los desarrolladores y los científicos de datos pueden contribuir directamente a las herramientas utilizadas para el análisis al hacer pull-request en el repositorio de Github (indicado al final de la página)

IBM ha creado también canales de procesamiento de datos (data pipelines) como se muestra en la imagen de aquí abajo, donde un usuario puede construir un canal de procesamiento de datos para series temporales de un condado. Aquí, cada caja representa un Jupyter Notebook y el usuario puede enviarlos a la nube para que a partir de ahi todos estos Notebooks se ejecuten en Kubeflow Pipelines y los resultados se guarden en el almacenamiento de objetos del proveedor de la nube.


ibm-covid-19-pipeline.png
Ilustración que da cuenta del funcionamiento de las pipelines o canales de procesamiento en Jupyter

IBM menciona además que cree en la importancia de democratizar las tecnologías, apoyando a los desarrolladores con la información y herramientas más actualizadas con el fin de que se tomen mejores decisiones que favorezcan a los ciudadanos.

Referencias