¿Cuál es la diferencia entre la evaluación para el aprendizaje y la evaluación del aprendizaje?

La evaluación del aprendizaje (sumativa) mide lo que los estudiantes han logrado al final de una unidad o curso: un examen final, una calificación, un boletín de notas. La evaluación para el aprendizaje (formativa) ocurre durante la instrucción y está diseñada para modificar lo que sucede a continuación. El objetivo no es registrar una puntuación, sino generar información que docentes y estudiantes puedan utilizar de inmediato.

¿La evaluación para el aprendizaje reemplaza las calificaciones?

No. La EpA y la calificación sumativa tienen propósitos distintos y coexisten en la mayoría de las aulas. La EpA genera retroalimentación momento a momento que orienta la instrucción; las calificaciones reportan el logro frente a un estándar. Muchas escuelas utilizan la EpA de forma intensiva durante una unidad y luego asignan una única calificación sumativa al final. Ambos sistemas son complementarios, no excluyentes.

¿Cuánto tiempo adicional requiere la evaluación para el aprendizaje en la planificación de clases?

Bien implementada, la EpA reduce el tiempo de re-enseñanza al detectar concepciones erróneas de forma temprana, por lo que el costo neto suele ser negativo. Los boletos de salida toman de dos a tres minutos para diseñar y cinco minutos para revisar. El think-pair-share y el llamado en frío no requieren ninguna planificación adicional, ya que están integrados en la dinámica de la clase. La inversión inicial se concentra en redactar intenciones de aprendizaje e indicadores de logro claros, algo que una buena planificación de clases ya exige.

¿Puede funcionar la evaluación para el aprendizaje en grupos numerosos?

Sí. Técnicas para toda la clase, como pizarras individuales, señales de pulgares arriba/abajo, tarjetas de semáforo y herramientas de votación digital (Mentimeter, Kahoot, Google Forms), permiten al docente obtener una lectura rápida del grupo sin corrección individual. Los recorridos de galería y el chalk-talk producen artefactos escritos que pueden analizarse rápidamente para identificar patrones.

¿Qué dice la investigación sobre el tamaño del efecto de la EpA en el aprendizaje?

La revisión de 250 estudios realizada por Paul Black y Dylan Wiliam en 1998 encontró tamaños de efecto de entre 0,4 y 0,7 desviaciones estándar, lo que equivale a aproximadamente 2 meses de aprendizaje adicional por año. La síntesis Visible Learning de John Hattie (2009) ubica la evaluación formativa con un tamaño de efecto de 0,90, uno de los más altos de cualquier intervención instruccional.

Evaluación para el Aprendizaje (EpA) - Wiki Pedagógica

Definición

La Evaluación para el Aprendizaje (EpA) es la práctica de utilizar evidencia de la comprensión del estudiante, recopilada de forma continua durante la instrucción, para ajustar la enseñanza y el aprendizaje en tiempo real. Su propósito no es medir ni registrar, sino generar información accionable que tanto docentes como estudiantes utilicen para cerrar la brecha entre el desempeño actual y el objetivo de aprendizaje.

El Assessment Reform Group (1999) definió la EpA como "el proceso de buscar e interpretar evidencia para que sea utilizada por los estudiantes y sus docentes para decidir dónde se encuentran los estudiantes en su aprendizaje, hacia dónde deben ir y cuál es la mejor manera de llegar allí." Tres preguntas están en el núcleo de esa definición: ¿Dónde está el estudiante ahora? ¿Hacia dónde va? ¿Cuál es el mejor paso siguiente? Cada estrategia de EpA responde al menos una de ellas.

La EpA está estrechamente relacionada con la evaluación formativa, pero pone un énfasis más fuerte en la agencia del estudiante. Mientras que la evaluación formativa puede describir cualquier verificación de bajo riesgo, la EpA exige específicamente que la evidencia recopilada sea compartida y actuada por los propios estudiantes, no solo registrada por el docente.

Contexto Histórico

El marco moderno de la EpA surgió de una revisión realizada en 1998 por Paul Black y Dylan Wiliam, en ese entonces en el King's College London. Su artículo "Inside the Black Box: Raising Standards Through Classroom Assessment" sintetizó 250 estudios publicados entre 1988 y 1997 y concluyó que la evaluación formativa, cuando se implementaba con retroalimentación de alta calidad e involucramiento del estudiante, producía tamaños de efecto de 0,4 a 0,7 desviaciones estándar. En sus palabras, eso equivalía a mover a un estudiante del percentil 50 a aproximadamente el percentil 65 al 75.

La expresión "evaluación para el aprendizaje" fue popularizada por el Assessment Reform Group (ARG), un consorcio de investigación del Reino Unido activo de 1989 a 2010 que incluyó a Black, Wiliam, Mary James y Bethan Marshall, entre otros. Su publicación de 1999 "Assessment for Learning: Beyond the Black Box" nombró el concepto, lo distinguió de la evaluación sumativa y estableció diez principios que las escuelas podían usar como marco de referencia.

Black y Wiliam continuaron con "Assessment and Classroom Learning" (1998, Assessment in Education) y el texto orientado a docentes "Working Inside the Black Box" (2002), que introdujo estrategias específicas y aplicables: técnicas de cuestionamiento, retroalimentación que impulsa el aprendizaje, compartir objetivos de aprendizaje con los estudiantes, y evaluación entre pares y autoevaluación. Para 2004, la EpA había sido adoptada como política oficial en Inglaterra, Escocia y Gales, y se había extendido a Australia, Nueva Zelanda, Canadá y Escandinavia.

Las raíces intelectuales son anteriores a los años noventa. El modelo de aprendizaje por dominio de Benjamin Bloom (1968) demostró que los estudiantes que recibían verificaciones formativas y retroalimentación correctiva antes de pasar a nuevo material lograban niveles significativamente más altos. La zona de desarrollo próximo de Vygotsky (1978) proporcionó una base teórica: la instrucción efectiva debe apuntar a la brecha entre lo que un estudiante puede hacer de manera independiente y lo que puede hacer con apoyo. La EpA es, en la práctica, el mecanismo para encontrar y cerrar esa brecha de forma continua.

Principios Clave

Compartir Intenciones de Aprendizaje e Indicadores de Logro

Los estudiantes aprenden con mayor eficacia cuando saben qué se supone que deben aprender y cómo luce un trabajo de calidad. Compartir intenciones de aprendizaje ("Al final de esta clase, podrás...") no es lo mismo que anunciar una actividad. Los indicadores de logro describen evidencia observable de comprensión: "Puedes explicar por qué el ciclo del agua es más rápido en las regiones tropicales usando al menos dos variables climáticas." Cuando los estudiantes internalizan este estándar, pueden monitorear su propio progreso en lugar de adivinar las expectativas del docente.

Preguntas en el Aula que Generan Evidencia

Las preguntas de bajo orden centradas en la memoria ("¿En qué año comenzó la Revolución Francesa?") confirman el recuerdo, pero no revelan nada sobre la comprensión. La EpA requiere preguntas que pongan en evidencia el razonamiento: "¿Por qué crees que el Tercer Estado fue más volátil que el Segundo?" Técnicas como el tiempo de espera (mínimo tres segundos después de plantear una pregunta), el llamado en frío aleatorio y las políticas de no levantar la mano garantizan que la evidencia provenga de todos los estudiantes, no solo de quienes se ofrecen voluntariamente. El objetivo es obtener datos diagnósticos, no un desempeño para la galería.

Retroalimentación que Impulsa el Aprendizaje

La retroalimentación efectiva dentro de la EpA le indica al estudiante específicamente qué ha hecho bien, qué necesita mejorar y cómo hacerlo. Una investigación de Kluger y DeNisi (1996), que abarcó 2.500 experimentos, encontró que la retroalimentación enfocada en la tarea y el siguiente paso elevaba el desempeño de manera consistente; la retroalimentación centrada en la persona (calificaciones, elogios, ego) frecuentemente lo deprimía. La retroalimentación en educación funciona como instrucción, no como evaluación. Comentarios como "Tu argumento es claro, pero solo citaste una fuente , busca una más que apoye tu planteamiento desde un ángulo diferente" le dan al estudiante una acción concreta.

Evaluación entre Pares

Los estudiantes que evalúan el trabajo de sus compañeros consolidan su propia comprensión de los indicadores de logro mientras generan retroalimentación para otro. Dylan Wiliam subraya que la evaluación entre pares requiere capacitación explícita: los estudiantes deben aprender a dar retroalimentación específica y centrada en la tarea, en lugar de elogios o críticas genéricas. La dimensión social tiene un beneficio adicional: la retroalimentación de un par suele recibirse con mayor disposición que la del docente, porque conlleva menos peso evaluativo.

Autoevaluación y Autorregulación

La autoevaluación es el componente de mayor impacto de la EpA porque construye el hábito de monitorear la comprensión de manera independiente del docente. Las técnicas incluyen la autocalificación con semáforo (rojo: no entiendo; amarillo: tengo dudas; verde: entiendo), los diarios reflexivos y la autoevaluación estructurada frente a los indicadores de logro. Con el tiempo, la autoevaluación desarrolla la conciencia metacognitiva: los estudiantes que pueden juzgar con precisión su propia comprensión están mejor posicionados para autorregular su aprendizaje.

Aplicación en el Aula

Boletos de Salida (Todos los Niveles)

Un boleto de salida es una respuesta escrita breve a una pregunta específica, que se completa en los últimos tres a cinco minutos de clase y se entrega antes de que los estudiantes salgan. Un docente de ciencias podría preguntar: "Dibuja y etiqueta el ciclo del agua. Encierra en un círculo la etapa en la que tienes menos confianza." El docente revisa los boletos antes de la siguiente clase, los clasifica en tres grupos (comprensión sólida, comprensión parcial, concepción errónea) y ajusta la apertura de la próxima clase en consecuencia. Los boletos de salida consumen casi ningún tiempo instruccional y aportan más información diagnóstica que los exámenes al final de la unidad, porque llegan mientras la corrección aún es posible.

El think-pair-share se describe habitualmente como una técnica de participación, pero funciona como herramienta de evaluación formativa cuando se usa de manera deliberada. Durante la fase de "compartir", el docente escucha no para obtener respuestas correctas, sino para captar la variedad de razonamientos en el grupo. Un docente de historia que aplica think-pair-share sobre las causas de la Primera Guerra Mundial escuchará de cinco a ocho explicaciones distintas en cuatro minutos, suficiente para saber si los estudiantes confunden causas inmediatas y estructurales, si están recurriendo a las fuentes asignadas y qué parejas necesitan intervención directa antes de avanzar.

Recorrido de Galería para el Diagnóstico en Tiempo Real

Un recorrido de galería exhibe el trabajo o los problemas de los estudiantes por el salón y pide a los estudiantes que roten para leer, responder y construir sobre el pensamiento de los demás. Para el docente, crea una muestra distribuida de la comprensión que puede analizarse en minutos. Un docente de matemáticas que exhibe seis enfoques distintos de los estudiantes para el mismo problema de álgebra puede usar el recorrido de galería para abrir una discusión grupal sobre por qué tres enfoques funcionan y tres no, sin señalar a ningún estudiante individualmente. Esto pone en evidencia concepciones erróneas a escala, en un formato de bajo riesgo.

Chalk-Talk para Evidencia Formativa Escrita

El chalk-talk es una discusión silenciosa y escrita en la que los estudiantes responden a un tema central publicado en papel rotafolio o en una pizarra. Como todas las contribuciones son visibles, el docente puede leer la comprensión colectiva del grupo de un vistazo y agregar preguntas de seguimiento directamente sobre el papel. A diferencia de la discusión verbal, el chalk-talk produce un artefacto permanente que puede fotografiarse y revisarse. Funciona especialmente bien con temas en los que los estudiantes dudan en hablar en voz alta (asuntos controvertidos, áreas donde temen equivocarse) y con grupos donde unas pocas voces dominantes suelen silenciar a los estudiantes más reservados.

Evidencia Investigativa

La revisión fundacional de Black y Wiliam de 1998 estableció la base de evidencia: en 250 estudios, las aulas que implementaron prácticas de evaluación formativa superaron consistentemente a las aulas de control por 0,4 a 0,7 desviaciones estándar. La revisión fue notable por su alcance y por haber incorporado contextos nacionales, niveles de grado y áreas disciplinares diversos.

El proyecto Visible Learning de John Hattie (2009), un metaanálisis de más de 800 metaanálisis que abarca 80 millones de estudiantes, ubica la evaluación formativa con un tamaño de efecto de 0,90, muy por encima del umbral de 0,40 que Hattie identifica como "punto bisagra" para el crecimiento esperado en un año. La retroalimentación específicamente obtiene un puntaje de 0,73. Estos se encuentran entre los tamaños de efecto más altos de cualquier intervención instruccional, incluyendo la integración tecnológica, la agrupación por habilidades y la extensión del horario escolar.

Un estudio de 2011 realizado por Ruiz-Primo y Furtak (Universidad de Colorado) observó a docentes de ciencias de secundaria y codificó su comportamiento de cuestionamiento frente a los resultados de aprendizaje en pre y postpruebas. Los docentes que usaron evaluación formativa informal, elicitando el pensamiento del estudiante, reconociendo la evidencia y utilizándola para responder, produjeron ganancias significativamente mayores que quienes no lo hicieron, incluso controlando el conocimiento previo del estudiante.

La investigación de Cowie y Bell (1999, publicada en Assessment in Education) distinguió la EpA planificada de la EpA interactiva. La EpA planificada implica instrumentos deliberados (boletos de salida, pre-evaluaciones). La EpA interactiva ocurre espontáneamente en el diálogo: un docente que detecta confusión en la pregunta de un estudiante y ajusta su explicación en el momento. Ambas producen ganancias en el aprendizaje, pero la EpA interactiva es más difícil de capacitar y se sostiene solo cuando los docentes tienen un conocimiento profundo del contenido y relaciones sólidas con sus estudiantes.

La limitación honesta: gran parte de la investigación sobre la EpA se basa en el autorreporte del docente o en medidas de resultados a corto plazo. Los estudios de retención a largo plazo son menos frecuentes. Algunos metaanálisis confunden la retroalimentación formativa de alta calidad con la evaluación de bajo riesgo frecuente, lo que infla los tamaños de efecto. La evidencia sobre los mecanismos centrales de la EpA es sólida; la evidencia sobre protocolos de implementación específicos es más variable.

Concepciones Erróneas Frecuentes

La EpA es solo hacer pruebas con mayor frecuencia. Las pruebas de bajo riesgo frecuentes pueden ser un componente de la EpA, y la práctica de recuperación sí apoya la retención. Pero la EpA no se define por la frecuencia de las verificaciones, sino por lo que se hace con la información. Una prueba que se registra en el libro de calificaciones y se devuelve sin retroalimentación no es EpA. Una conversación abierta en la que el docente plantea una pregunta, escucha la respuesta y ajusta de inmediato la siguiente explicación sí es EpA, aunque nada haya quedado escrito.

Compartir intenciones de aprendizaje significa leer el objetivo de una diapositiva. Publicar "El estudiante podrá: analizar las causas de la Primera Guerra Mundial" satisface un requisito formal, pero no ayuda a los estudiantes a aprender. Compartir una intención de aprendizaje significa hacerla significativa: discutir cómo se ve el análisis en comparación con la descripción, co-construir indicadores de logro con los estudiantes, retomar la intención a mitad de clase para verificar el avance. Las palabras en la pizarra importan mucho menos que lo que los estudiantes comprenden sobre el objetivo.

La EpA beneficia principalmente a los estudiantes con dificultades. La EpA produce ganancias en todo el espectro de rendimiento, pero la investigación muestra de manera consistente las mayores ganancias en estudiantes de menor rendimiento. Esto tiene sentido intuitivo: los estudiantes que ya comprenden el material dependen menos de los ajustes del docente. Sin embargo, enmarcar la EpA como una estrategia de remediación la subestima. Los estudiantes de alto rendimiento se benefician sustancialmente de una retroalimentación que extiende su pensamiento más allá de los indicadores mínimos de logro y de las prácticas de autoevaluación que construyen hábitos de aprendizaje independiente.

Conexión con el Aprendizaje Activo

La EpA y el aprendizaje activo son sistemas mutuamente reforzantes. El aprendizaje activo genera la evidencia observable que la EpA requiere; la EpA le da al docente una manera fundamentada de responder a lo que el aprendizaje activo revela.

El think-pair-share ejemplifica esta relación. La técnica obliga a cada estudiante a construir una respuesta antes de escuchar la explicación del docente, lo que pone en evidencia el conocimiento previo y las concepciones erróneas que de otro modo permanecerían invisibles. Un docente que escucha durante la fase de pares y amplifica selectivamente ciertas respuestas durante la fase de compartir está practicando la EpA interactiva: usando la evidencia para moldear la dirección de la discusión grupal en tiempo real.

El chalk-talk produce un registro escrito del pensamiento colectivo que funciona como artefacto formativo. A diferencia de una discusión verbal, el docente puede revisar simultáneamente toda la gama de respuestas de los estudiantes, identificar patrones en los malentendidos y diseñar una secuencia de seguimiento específica. El silencio del chalk-talk también garantiza que los estudiantes más callados del grupo contribuyan con evidencia, un problema persistente con las técnicas verbales de EpA que favorecen a los respondedores rápidos y seguros.

Los recorridos de galería convierten el trabajo de los estudiantes en datos visibles públicamente. Cuando los estudiantes exhiben su razonamiento y sus compañeros lo anotan, el docente obtiene un panorama distribuido de la comprensión del grupo sin necesidad de conferencias individuales. Los artefactos resultantes pueden informar no solo la siguiente clase, sino también qué estudiantes necesitan intervención en grupos pequeños y cuáles están listos para actividades de extensión.

En un nivel más profundo, el aprendizaje activo y la EpA comparten una premisa común: los estudiantes no son receptores pasivos de la instrucción, sino constructores activos de comprensión. La EpA hace visible esa construcción; el aprendizaje activo crea las condiciones en las que ocurre.

Para profundizar en la dimensión de la retroalimentación en la EpA, ver Retroalimentación en Educación. Para el componente orientado al estudiante, ver Autoevaluación.

Fuentes

Black, P., & Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education: Principles, Policy & Practice, 5(1), 7–74.
Black, P., & Wiliam, D. (1998). Inside the Black Box: Raising Standards Through Classroom Assessment. King's College London School of Education.
Assessment Reform Group. (1999). Assessment for Learning: Beyond the Black Box. University of Cambridge School of Education.
Hattie, J. (2009). Visible Learning: A Synthesis of Over 800 Meta-Analyses Relating to Achievement. Routledge.

Evaluación para el Aprendizaje (EpA)

Definición

Contexto Histórico

Principios Clave

Compartir Intenciones de Aprendizaje e Indicadores de Logro

Preguntas en el Aula que Generan Evidencia

Retroalimentación que Impulsa el Aprendizaje

Evaluación entre Pares

Autoevaluación y Autorregulación

Aplicación en el Aula

Boletos de Salida (Todos los Niveles)

Recorrido de Galería para el Diagnóstico en Tiempo Real

Chalk-Talk para Evidencia Formativa Escrita

Evidencia Investigativa

Concepciones Erróneas Frecuentes

Conexión con el Aprendizaje Activo

Fuentes

Preguntas Frecuentes

Conceptos Relacionados

Artículos Relacionados

Estrategias de Codiseño para Dominar la Planeación por Proyectos en Educación Básica

La Evaluación Formativa es la Clave del Éxito en la Nueva Escuela Mexicana

Las Metodologías Activas de la NEM son la Clave del Aprendizaje Significativo en Secundaria

Metodologías Relacionadas

Pensar-Emparejar-Compartir

Diálogo Silencioso

Paseo por la Galería

Definición

Contexto Histórico

Principios Clave

Compartir Intenciones de Aprendizaje e Indicadores de Logro

Preguntas en el Aula que Generan Evidencia

Retroalimentación que Impulsa el Aprendizaje

Evaluación entre Pares

Autoevaluación y Autorregulación

Aplicación en el Aula

Boletos de Salida (Todos los Niveles)

Think-Pair-Share como Motor de la EpA

Recorrido de Galería para el Diagnóstico en Tiempo Real

Chalk-Talk para Evidencia Formativa Escrita

Evidencia Investigativa

Concepciones Erróneas Frecuentes

Conexión con el Aprendizaje Activo

Fuentes

Preguntas Frecuentes

Conceptos Relacionados

Artículos Relacionados

Estrategias de Codiseño para Dominar la Planeación por Proyectos en Educación Básica

La Evaluación Formativa es la Clave del Éxito en la Nueva Escuela Mexicana

Las Metodologías Activas de la NEM son la Clave del Aprendizaje Significativo en Secundaria

Metodologías Relacionadas

Pensar-Emparejar-Compartir

Diálogo Silencioso

Paseo por la Galería