Actividad 01
Estaciones de Limpieza: Datos Sucios
Prepara cuatro estaciones con datasets problemáticos: valores faltantes, duplicados, atípicos y tipos erróneos. Los grupos rotan cada 10 minutos, aplican técnicas de limpieza en Python o Excel y registran cambios en un informe compartido. Al final, comparan resultados en plenaria.
¿Cómo la limpieza de datos mejora la calidad y fiabilidad de los modelos de Machine Learning?
Consejo de FacilitaciónDurante 'Estaciones de Limpieza', prepare datasets impresos con errores marcados en colores diferentes para que los estudiantes identifiquen patrones de problemas y no se enfoquen en detalles aislados.
Qué observarPresentar a los estudiantes un pequeño conjunto de datos (ej. 5 filas, 3 columnas) con errores evidentes (valores faltantes, duplicados, un valor atípico). Pedirles que identifiquen los problemas y propongan una solución específica para cada uno, justificando su elección.