Skip to content
Tecnología · 3o de Preparatoria

Ideas de aprendizaje activo

Preprocesamiento y Exploración de Datos

El preprocesamiento y exploración de datos requiere manipulación manual y observación crítica, habilidades que se desarrollan mejor con actividades prácticas. Los estudiantes necesitan experimentar con datos reales para entender por qué la limpieza y transformación son esenciales antes de cualquier análisis. El formato de estaciones y desafíos grupales motiva la participación activa y el aprendizaje colaborativo.

Aprendizajes Esperados SEPSEP EMS: Análisis y Visualización de DatosSEP EMS: Preparación de Datos
30–50 minParejas → Toda la clase4 actividades

Actividad 01

Actividad Mantel45 min · Grupos pequeños

Estaciones de Limpieza: Datos Sucios

Prepara cuatro estaciones con datasets problemáticos: valores faltantes, duplicados, atípicos y tipos erróneos. Los grupos rotan cada 10 minutos, aplican técnicas de limpieza en Python o Excel y registran cambios en un informe compartido. Al final, comparan resultados en plenaria.

¿Cómo la limpieza de datos mejora la calidad y fiabilidad de los modelos de Machine Learning?

Consejo de FacilitaciónDurante 'Estaciones de Limpieza', prepare datasets impresos con errores marcados en colores diferentes para que los estudiantes identifiquen patrones de problemas y no se enfoquen en detalles aislados.

Qué observarPresentar a los estudiantes un pequeño conjunto de datos (ej. 5 filas, 3 columnas) con errores evidentes (valores faltantes, duplicados, un valor atípico). Pedirles que identifiquen los problemas y propongan una solución específica para cada uno, justificando su elección.

ComprenderAnalizarEvaluarAutoconcienciaHabilidades de Relación
Generar Clase Completa

Actividad 02

Actividad Mantel35 min · Parejas

Exploración Guiada: Histogramas y Correlaciones

Proporciona un dataset limpio de ventas o clima. En parejas, generan visualizaciones con bibliotecas como Pandas y Matplotlib, calculan estadísticas descriptivas e identifican tres patrones o anomalías. Presentan hallazgos en un tablero digital grupal.

¿De qué manera la exploración de datos revela patrones, anomalías y relaciones entre variables?

Consejo de FacilitaciónEn 'Exploración Guiada', entregue una plantilla de preguntas guía para que las parejas discutan cómo interpretar histogramas y matrices de correlación antes de generar sus propios gráficos.

Qué observarPlantear la siguiente pregunta al grupo: 'Si un modelo de Machine Learning predice resultados erróneos consistentemente, ¿cuáles son las primeras tres causas relacionadas con el preprocesamiento de datos que investigarían y por qué?' Fomentar la discusión y el debate sobre la jerarquía de problemas.

ComprenderAnalizarEvaluarAutoconcienciaHabilidades de Relación
Generar Clase Completa

Actividad 03

Actividad Mantel50 min · Grupos pequeños

Ingeniería de Features: Desafío Competitivo

Divide la clase en equipos para transformar un dataset crudo creando nuevas variables, como ratios o categorías. Evalúan impacto en un modelo simple de regresión. Votan por la mejor ingeniería basada en precisión.

¿Por qué la ingeniería de características es crucial para el rendimiento de un modelo?

Consejo de FacilitaciónPara el 'Desafío Competitivo', asigne roles específicos en cada equipo (ej. codificador, analista, presentador) y rotelos cada 10 minutos para asegurar participación equitativa.

Qué observarEntregar a cada estudiante una tarjeta con el nombre de una técnica de preprocesamiento (ej. Imputación, Normalización, Codificación One-Hot). Pedirles que escriban una breve descripción de cuándo y por qué usarían esa técnica, y un ejemplo concreto de su aplicación.

ComprenderAnalizarEvaluarAutoconcienciaHabilidades de Relación
Generar Clase Completa

Actividad 04

Actividad Mantel30 min · Individual

Exploración Individual: Mi Dataset Personal

Cada estudiante selecciona un dataset público, lo limpia paso a paso y genera un reporte de exploración con gráficos. Comparte uno o dos insights en una galería de clase virtual.

¿Cómo la limpieza de datos mejora la calidad y fiabilidad de los modelos de Machine Learning?

Consejo de FacilitaciónEn 'Exploración Individual', pida a los estudiantes que documenten cada paso de su exploración en un cuaderno de laboratorio para fomentar la metacognición y el registro de decisiones.

Qué observarPresentar a los estudiantes un pequeño conjunto de datos (ej. 5 filas, 3 columnas) con errores evidentes (valores faltantes, duplicados, un valor atípico). Pedirles que identifiquen los problemas y propongan una solución específica para cada uno, justificando su elección.

ComprenderAnalizarEvaluarAutoconcienciaHabilidades de Relación
Generar Clase Completa

Plantillas

Plantillas que acompañan estas actividades de Tecnología

Úsalas, edítalas, imprímelas o compártelas.

Algunas notas para enseñar esta unidad

Enseñe este tema con un enfoque basado en problemas: los estudiantes deben experimentar fallos para valorar el preprocesamiento. Evite explicar todas las técnicas antes de la práctica, ya que la necesidad de soluciones surgirá de los errores observados. La investigación guiada y el debate en parejas funcionan mejor que las clases expositivas. La repetición de limpieza en diferentes datasets ayuda a internalizar que no hay una solución única.

Al finalizar las actividades, los estudiantes demuestran habilidad para identificar errores en datos, justificar sus soluciones de limpieza y transformar variables para mejorar la calidad del dataset. También explican patrones mediante visualizaciones y correlaciones, usando lenguaje técnico preciso. La reflexión sobre el impacto de sus decisiones en el análisis final es clave.


Cuidado con estas ideas erróneas

  • Durante 'Estaciones de Limpieza', muchos estudiantes asumirán que los datos están correctos si no ven valores faltantes obvios.

    Pida a los estudiantes que comparen las estadísticas descriptivas antes y después de su limpieza, destacando cómo errores no evidentes (como duplicados o valores atípicos leves) distorsionan el promedio o la desviación estándar.

  • Durante 'Exploración Guiada', algunos creerán que un histograma perfectamente simétrico indica datos limpios.

    Use el ejercicio para mostrar cómo valores atípicos en los extremos pueden deformar la simetría sin ser evidentes, y pida a los estudiantes que identifiquen estos casos en sus gráficos.

  • Durante el 'Desafío Competitivo', los equipos pueden suponer que más datos siempre mejoran un modelo, incluso sin preprocesamiento.

    Exija a cada equipo que registre métricas de calidad del dataset (como varianza explicada o error de imputación) antes y después de sus transformaciones, para que vean evidencia cuantitativa de la mejora.


Metodologías usadas en este resumen