Correlación y Regresión Lineal Simple
Los estudiantes analizan la relación entre dos variables cuantitativas utilizando el coeficiente de correlación y la regresión lineal.
Acerca de este tema
La correlación y regresión lineal simple ayudan a los estudiantes de IV Medio a analizar la relación entre dos variables cuantitativas. El coeficiente de correlación de Pearson, r, mide la fuerza y dirección de esa relación lineal: valores cercanos a 1 indican correlación positiva fuerte, cercanos a -1 negativa fuerte, y 0 ausencia de relación lineal. La regresión lineal genera la ecuación y = mx + b, donde m es la pendiente y b la ordenada al origen, para predecir valores de una variable según la otra. Este enfoque resalta que la correlación no implica causalidad, un principio esencial para evitar interpretaciones erróneas.
En las Bases Curriculares de MINEDUC, este tema se integra en Estadística Descriptiva Avanzada del segundo semestre, alineado con los objetivos de Probabilidad y Estadística (OA MAT 4°M) y Modelamiento Matemático. Los estudiantes trabajan con gráficos de dispersión, interpretan datos reales como consumo de agua y temperatura o rendimiento escolar y horas de estudio, desarrollando habilidades para modelar fenómenos cotidianos y tomar decisiones informadas.
El aprendizaje activo beneficia este tema porque los conceptos son abstractos y dependen de patrones en datos. Actividades prácticas con mediciones propias, software como GeoGebra y discusiones grupales hacen visibles las relaciones lineales, fortalecen la intuición estadística y mejoran la capacidad para cuestionar causalidad.
Preguntas Clave
- ¿Cómo se cuantifica la fuerza y dirección de la relación lineal entre dos variables?
- ¿Por qué la correlación no implica causalidad?
- ¿Cómo se utiliza la regresión lineal para predecir el valor de una variable a partir de otra?
Objetivos de Aprendizaje
- Calcular el coeficiente de correlación de Pearson (r) para cuantificar la fuerza y dirección de la relación lineal entre dos variables cuantitativas.
- Interpretar el valor del coeficiente de correlación (r) en el contexto de datos reales, distinguiendo entre correlación fuerte, débil y nula.
- Determinar la ecuación de la recta de regresión lineal simple (y = mx + b) a partir de un conjunto de datos y explicar el significado de la pendiente (m) y la ordenada al origen (b).
- Utilizar la ecuación de regresión lineal para predecir el valor de una variable dependiente basándose en el valor de una variable independiente.
- Criticar afirmaciones que confunden correlación con causalidad, explicando por qué la asociación entre dos variables no garantiza una relación causa-efecto.
Antes de Empezar
Por qué: Es fundamental que los estudiantes manejen la lectura e interpretación de tablas de datos y la construcción y análisis de gráficos (barras, líneas, circulares) para poder trabajar con gráficos de dispersión y tablas de datos numéricos.
Por qué: Comprender la pendiente y la ordenada al origen de una función lineal es esencial para entender y aplicar la ecuación de la recta de regresión lineal.
Por qué: El cálculo de la recta de regresión y la interpretación de la correlación a menudo se basan en conceptos relacionados con promedios y la dispersión de los datos.
Vocabulario Clave
| Coeficiente de Correlación de Pearson (r) | Medida estadística que cuantifica la fuerza y dirección de la relación lineal entre dos variables cuantitativas. Varía entre -1 (correlación lineal negativa perfecta) y +1 (correlación lineal positiva perfecta), con 0 indicando ausencia de relación lineal. |
| Recta de Regresión Lineal Simple | Ecuación de la forma y = mx + b que representa la mejor aproximación lineal a la relación entre dos variables, utilizada para predecir el valor de 'y' (variable dependiente) a partir del valor de 'x' (variable independiente). |
| Pendiente (m) | En la recta de regresión, representa el cambio promedio en la variable dependiente (y) por cada unidad de cambio en la variable independiente (x). |
| Ordenada al Origen (b) | En la recta de regresión, es el valor predicho de la variable dependiente (y) cuando la variable independiente (x) es igual a cero. |
| Gráfico de Dispersión | Representación gráfica de datos que utiliza puntos para mostrar la relación entre dos variables cuantitativas. Permite visualizar patrones, tendencias y la posible existencia de una relación lineal. |
Cuidado con estas ideas erróneas
Idea errónea comúnLa correlación alta siempre indica causalidad.
Qué enseñar en su lugar
La correlación mide asociación lineal, no causa-efecto; factores externos pueden influir. Discusiones grupales con ejemplos reales como número de bomberos y daños por fuego ayudan a los estudiantes a diferenciar mediante debate activo y análisis compartido.
Idea errónea comúnSi r es cercano a 0, no hay relación alguna.
Qué enseñar en su lugar
r=0 indica ausencia de relación lineal, pero puede haber no lineal. Actividades de exploración con gráficos en parejas permiten visualizar curvas ocultas y ajustar modelos, corrigiendo esta visión limitada.
Idea errónea comúnLa recta de regresión predice perfectamente cualquier valor.
Qué enseñar en su lugar
La recta minimiza errores promedio, pero predicciones tienen incertidumbre según r². Prácticas con intervalos de confianza en grupos pequeños hacen tangible la variabilidad residual.
Ideas de aprendizaje activo
Ver todas las actividadesEnseñanza entre Pares: Datos corporales y correlación
Los estudiantes miden alturas y pesos de compañeros en pares. Calculan el coeficiente r con calculadora gráfica o Excel, grafican la dispersión y discuten la fuerza de la relación. Finalmente, comparan resultados con la clase.
Grupos pequeños: Regresión con datos deportivos
Cada grupo selecciona datos públicos de goles vs. tiros en fútbol chileno. Ajustan la recta de regresión en software, predicen valores y evalúan el ajuste con r². Presentan hallazgos y limitaciones.
Clase completa: Simulación de causalidad
Proyecta ejemplos espurios como helados y ahogados. La clase vota por causalidad, calcula r y discute por qué correlación no implica causa. Registra conclusiones en pizarra compartida.
Individual: Predicciones personales
Cada estudiante elige dos variables de su vida diaria, recolecta 15 datos, calcula regresión y predice un valor futuro. Comparte en foro virtual para retroalimentación.
Conexiones con el Mundo Real
- Economistas y analistas financieros utilizan la correlación y regresión para estudiar la relación entre variables como el precio de las acciones y los indicadores económicos, o el gasto en publicidad y las ventas de un producto, para tomar decisiones de inversión y estrategia.
- En agronomía, se aplica la regresión lineal para predecir el rendimiento de cultivos (variable dependiente) en función de la cantidad de fertilizante o agua utilizada (variables independientes), optimizando así las prácticas agrícolas y los recursos.
- Profesionales de la salud pública analizan la correlación entre factores de riesgo (ej. tabaquismo) y la incidencia de enfermedades (ej. cáncer de pulmón) para diseñar campañas de prevención y políticas de salud más efectivas.
Ideas de Evaluación
Presente a los estudiantes un gráfico de dispersión con una nube de puntos claramente lineal (positiva o negativa). Pida que calculen el coeficiente de correlación (r) usando una calculadora o software y que interpreten su valor en una frase. Luego, solicite que determinen la ecuación de la recta de regresión y expliquen qué significa la pendiente en el contexto del gráfico.
Plantee el siguiente escenario: 'Se observa una alta correlación positiva entre la venta de helados y el número de ahogamientos en verano. ¿Significa esto que comer helado causa ahogamientos?'. Guíe la discusión para que los estudiantes identifiquen la variable oculta (temperatura) y expliquen por qué la correlación no implica causalidad, utilizando ejemplos concretos.
Entregue a cada estudiante un par de variables (ej. horas de estudio y nota en un examen). Pida que formulen una hipótesis sobre la posible relación lineal, que predigan cómo sería el coeficiente de correlación (positivo, negativo, cercano a 0) y que escriban una posible ecuación de regresión lineal que describa esta relación. Deben justificar brevemente su predicción.
Preguntas frecuentes
¿Qué mide exactamente el coeficiente de correlación de Pearson?
¿Cómo se interpreta la ecuación de regresión lineal simple?
¿Por qué la correlación no implica causalidad en regresión?
¿Cómo el aprendizaje activo ayuda a enseñar correlación y regresión lineal?
Plantillas de planificación para Matemática
Modelo 5E
El Modelo 5E estructura la planeación en cinco fases: Enganchar, Explorar, Explicar, Elaborar y Evaluar. Guía a los estudiantes desde la curiosidad hasta la comprensión profunda.
Planificador de UnidadUnidad de Matemáticas
Planifica una unidad de matemáticas con coherencia conceptual: de la comprensión intuitiva a la fluidez procedimental y la aplicación en contexto. Cada sesión se apoya en la anterior dentro de una secuencia conectada.
RúbricaRúbrica de Matemáticas
Crea una rúbrica que evalúa la resolución de problemas, el razonamiento matemático y la comunicación junto con la exactitud de los procedimientos. Los estudiantes reciben retroalimentación sobre cómo piensan, no solo sobre si obtuvieron la respuesta correcta.
Más en Estadística Descriptiva Avanzada
Medidas de Tendencia Central y Posición
Los estudiantes revisan y aplican medidas como la media, mediana, moda, cuartiles y percentiles para describir conjuntos de datos.
2 methodologies
Medidas de Dispersión
Los estudiantes calculan e interpretan el rango, la varianza, la desviación estándar y el coeficiente de variación.
2 methodologies
Representaciones Gráficas Avanzadas
Los estudiantes construyen e interpretan histogramas, diagramas de caja y bigotes, y gráficos de dispersión.
2 methodologies
Uso de Software Estadístico
Los estudiantes utilizan herramientas de software (ej. Excel, Geogebra, R) para realizar análisis estadísticos y generar gráficos.
2 methodologies