Presentación:
La ciencia de datos es la rama de la computación que se encarga de entender, procesar y extraer valor a partir de los datos. Hoy en día existen innumerables fuentes de datos y herramientas para recolectar datos, desde el log de un website hasta la estructura de una Red Social pasando por bases de datos en todo tipo de formatos y pertenecientes a los más diversos dominios. Particularmente el sector público recolecta grandes cantidades de datos de las personas u organismos del país. Los censos, pagos, impuestos, declaraciones juradas, formularios, entre otros, son elementos que contienen una gran cantidad de información. Ahora la pregunta es: ¿qué se hace o qué se puede hacer con esos datos? Este curso da una introducción a la ciencia de datos basándose en los fundamentos de cómo los datos se pueden entender, procesar y extraer valor orientado en los entes públicos. Además, enseña a cómo utilizar las herramientas para que cada participante pueda introducirse en el mundo de las ciencia de datos.
Objetivos:
Se espera que las y los participantes logren:
- Introducirse en los temas teóricos y prácticos que engloba la Ciencia de Datos.
- Aprender cómo encarar un proyecto de Ciencia de Datos.
- Conocer herramientas útiles para el manejo de datos.
- Comprender el panorama actual de los algoritmos de predicción y recomendación.
Perfil del participante:
Trabajadoras y trabajadores de la administración pública.
Temario:
Unidad 1: Fundamentos de la Ciencia de Datos
Introducción a la Ciencia de Datos
Fundamentos de la Ciencia de Datos
Datos en los organismos públicos y privados
Casos de éxito y fracaso de la Ciencia de Datos en el mundo.
Unidad 2: Proyectos de Ciencia de Datos
Cómo abordar un proyecto de Ciencia de Datos
Regresión, Clasificación, Sistemas de Recomendación e Identificación de patrones
Tópicos de la Ciencia de Datos en la Administración Pública
Obtener y depurar los datos
Detectar y eliminar anomalías
Formateo de los datos.
Unidad 3: Visualización
Elementos de la Visualización
Objetivos
Principios básicos
Principios de Tufte
Gráficos discretos vs continuos.
Gráficos 3D
Manipulación malintencionada de los gráficos en la política.
Unidad 4: Proyecto de Ciencia de Datos
Paso a paso cómo abordar un proyecto de ciencia de datos
Introducción a Machine Learning
Manipulación de datos
Práctica de formateo de datos
Visualizaciones para el análisis exploratorio.
Visualizaciones para la comunicación de resultados
Entrenamiento de varios algoritmos de Machine Learning.
Comisiones:
COMISIÓN | FECHA DE REALIZACIÓN | CIERRE DE INSCRIPCIÓN | DOCENTE | ESTADO / SEDE |
---|---|---|---|---|
IN-NS-51368 | Del 29/08/2023 al 18/09/2023 | Inscripción cerrada | Autogestionado | Cerrada (Campus Virtual INAP) |
COMISIÓN | FECHA DE REALIZACIÓN | CIERRE DE INSCRIPCIÓN | DOCENTE | ESTADO / SEDE |