Definición
La evaluación formativa es cualquier actividad de evaluación que se lleva a cabo durante el proceso de aprendizaje con el propósito explícito de informar la enseñanza y mejorar el aprendizaje del estudiante antes de que este concluya. No es un examen ni una calificación — es una conversación continua entre docente y aprendiz sobre dónde se encuentra el aprendizaje y hacia dónde debe dirigirse.
La definición canónica proviene de la síntesis de Paul Black y Dylan Wiliam de 1998: la evaluación es formativa cuando la evidencia del aprendizaje del estudiante se obtiene, se interpreta y se utiliza para tomar decisiones sobre los próximos pasos de la enseñanza. En ese bucle de retroalimentación participan tres actores — el docente, los compañeros y el propio aprendiz — y los tres pueden iniciarlo. Un docente que revisa las tarjetas de salida a la puerta, dos estudiantes que comparan su razonamiento durante un think-pair-share, y un aprendiz que coteja su borrador con una lista de criterios de éxito están todos poniendo en práctica la evaluación formativa.
La palabra "formativa" captura la lógica temporal: esta evaluación forma al aprendiz mientras la formación aún es posible. En contraste, la evaluación sumativa mide lo que el aprendiz ha logrado una vez finalizada la enseñanza. Ambas cumplen propósitos esenciales, pero confundirlas — calificando el trabajo formativo o tratando las puntuaciones sumativas como retroalimentación accionable — debilita a las dos.
Contexto Histórico
Los cimientos intelectuales de la evaluación formativa recorren varias décadas de investigación cognitiva y educativa, mucho antes de que el término se generalizase.
La obra de Benjamin Bloom sobre el aprendizaje de dominio de 1969 introdujo la idea central: si los estudiantes reciben retroalimentación correctiva en puntos de control regulares durante la enseñanza, el rendimiento mejora de forma sustancial. Bloom observó que la tutoría individual producía resultados dos desviaciones estándar por encima de la enseñanza convencional en el aula. Atribuyó la diferencia, en gran medida, a la supervisión constante del tutor y a sus ajustes en tiempo real. La evaluación formativa, en el marco de Bloom, era una aproximación en el aula al bucle de retroalimentación del tutor.
Michael Scriven acuñó el término "evaluación formativa" en 1967, aplicado originalmente al desarrollo curricular y no a la evaluación del estudiante. Lee Cronbach extendió el concepto al aprendizaje del estudiante poco después. Sin embargo, fue el trabajo de Paul Black y Dylan Wiliam en el King's College London en 1998 el que elevó la evaluación formativa a prioridad investigadora en la práctica docente. Su artículo de revisión "Inside the Black Box", publicado en el Phi Delta Kappan, sintetizó 250 estudios y encontró tamaños del efecto de entre 0,4 y 0,7, suficientes para desplazar a un estudiante medio del percentil 50 al aproximadamente el 70. La escala y accesibilidad de la revisión lo convirtieron en uno de los artículos más citados de la investigación educativa.
Wiliam continuó desarrollando el marco a través del Assessment Reform Group en el Reino Unido, y su libro de 2011 Embedded Formative Assessment tradujo la investigación en rutinas estructuradas de aula que los docentes podían adoptar sin revisar por completo el currículo. El trabajo paralelo de John Hattie, cuyo metaanálisis de 2009 Visible Learning agregó los resultados de 800 metaanálisis, confirmó de forma independiente la primacía de la retroalimentación — se situó entre las influencias de mayor efecto sobre el rendimiento en su síntesis.
Principios Clave
El Bucle de Retroalimentación se Cierra
La evaluación formativa solo funciona cuando la evidencia del aprendizaje modifica realmente lo que sucede a continuación. Recoger datos y archivarlos es monitorización, no evaluación formativa. La característica definitoria es que la información regresa a la enseñanza: el docente vuelve a explicar un concepto confuso, acelera el ritmo sobre contenidos que los estudiantes ya dominan o rediseña una tarea que no generó el pensamiento previsto. Si el bucle de retroalimentación no se cierra, la evaluación no fue formativa — independientemente de la herramienta utilizada.
La Retroalimentación Apunta a la Brecha
La retroalimentación formativa eficaz identifica la distancia entre la comprensión actual del estudiante y el objetivo de aprendizaje, y proporciona información que ayuda a salvarla. Este es el marco articulado por Sadler (1989) y posteriormente sistematizado por el modelo de retroalimentación de Hattie y Timperley de 2007. La retroalimentación que se limita a marcar una respuesta como incorrecta ofrece un veredicto sin una dirección. La que nombra lo que el estudiante hizo, lo que exige el objetivo y cuál es el siguiente paso concreto le da tracción.
Los Objetivos de Aprendizaje Deben ser Transparentes
Los estudiantes no pueden autoevaluarse, responder a la retroalimentación ni aprender de sus compañeros a menos que sepan a qué están apuntando. La evaluación formativa depende de objetivos de aprendizaje claros, específicos y accesibles para el estudiante. Cuando los docentes comparten no solo la tarea sino los criterios de éxito, y ayudan a los estudiantes a interiorizar cómo es "cumplir el estándar" mediante ejemplos trabajados o documentos de referencia, la retroalimentación formativa se vuelve accionable en lugar de confusa.
La Coevaluación y la Autoevaluación Amplían la Retroalimentación
Ningún docente puede generar retroalimentación significativa e individualizada para cada estudiante en cada tarea. La coevaluación y la autoevaluación escalan el sistema de retroalimentación sin escalar la carga de trabajo del docente, y conllevan sus propios beneficios de aprendizaje. Cuando los estudiantes evalúan el trabajo de un compañero con arreglo a criterios compartidos, practican el pensamiento analítico que exige el objetivo de aprendizaje. Cuando los estudiantes valoran honestamente su propio trabajo, desarrollan la conciencia metacognitiva que predice el éxito académico a largo plazo (Zimmerman, 2002).
Las Bajas Apuestas Protegen la Evidencia Honesta
Si los estudiantes creen que sus respuestas formativas serán calificadas, actúan en lugar de revelar. Las calificaciones asociadas al trabajo formativo suprimen los errores honestos que son más útiles para un docente que ajusta su enseñanza. La investigación muestra de forma consistente que eliminar las calificaciones de las actividades formativas — y explicar explícitamente a los estudiantes que los errores son esperados y útiles — mejora tanto la calidad de la evidencia recogida como la disposición de los estudiantes a asumir riesgos intelectuales (Butler, 1988).
Aplicación en el Aula
Educación Primaria: La Comprobación con Semáforo
Una docente de tercer curso de primaria presenta una nueva estrategia de multiplicación. En una pausa natural de la sesión, pide a los estudiantes que levanten una tarjeta roja, amarilla o verde (o que muestren los dedos): el verde significa "lo tengo claro", el amarillo "no estoy seguro" y el rojo "estoy perdido". Recorre el aula en cuestión de segundos. Lleva a los estudiantes con tarjeta roja a un grupo pequeño para modelar de nuevo, mientras los de tarjeta verde trabajan en una tarea de ampliación. Los de tarjeta amarilla se emparejan para comparar sus enfoques. La docente ha diferenciado la enseñanza en menos de un minuto utilizando evidencia del aula, no intuición.
Educación Secundaria: La Galería de Pizarras para el Mapeo de Argumentos
Una docente de primero de la ESO pide a los estudiantes que escriban sus tesis en pizarras individuales y las levanten simultáneamente. Recorre la fila y comprueba de inmediato que aproximadamente un tercio del grupo ha escrito frases temáticas en lugar de afirmaciones argumentables. En lugar de corregir cada cuaderno, selecciona tres ejemplos anónimos — uno sólido, uno parcial y uno poco desarrollado — y lleva a cabo un breve análisis colectivo. Los estudiantes revisan sus pizarras. La docente ha recogido evidencia de cada estudiante y ha redirigido la enseñanza sin ninguna calificación.
Educación Superior y Formación del Profesorado: El Papel de Un Minuto
Una formadora de docentes detiene el taller quince minutos antes de terminar y plantea dos preguntas: "¿Cuál es lo más importante que has aprendido hoy?" y "¿Qué pregunta tienes todavía?" Los participantes escriben durante dos minutos y entregan los papeles. La formadora los lee esa tarde y abre la siguiente sesión respondiendo a las tres preguntas pendientes más frecuentes. Los participantes comprenden que su confusión es anticipada y valorada; la formadora sabe por dónde empezar la próxima vez.
Los tickets de salida son una de las implementaciones más prácticas de este principio en todos los niveles educativos — un indicador estructurado al final de la sesión que genera evidencia accionable en menos de cinco minutos.
Evidencia Investigadora
La revisión de Black y Wiliam de 1998 estableció la base de evidencia fundacional. Al sintetizar aproximadamente 250 estudios, encontraron que una evaluación formativa bien implementada producía tamaños del efecto de entre 0,4 y 0,7, con los efectos más fuertes observados en los estudiantes de bajo rendimiento. Esto es relevante: la evaluación formativa no es una estrategia que beneficie principalmente a los aprendices que ya tienen un alto rendimiento. Los mecanismos que identificaron incluyeron objetivos de aprendizaje más claros, retroalimentación más rica y mayor apropiación del aprendizaje por parte del estudiante.
El artículo de Hattie y Timperley de 2007 "The Power of Feedback", publicado en Review of Educational Research, metaanalizó 196 estudios con 6.972 tamaños del efecto y encontró un tamaño del efecto medio de 0,79 para la retroalimentación — una de las influencias instruccionales más fuertes de toda la síntesis. De forma crítica, hallaron que la retroalimentación dirigida al yo ("eres un buen estudiante") era en gran medida ineficaz. La retroalimentación dirigida a la tarea, al proceso y a las estrategias de autorregulación del aprendiz produjo las ganancias más importantes.
Kingsley y Grabner-Hagen (2015) examinaron herramientas digitales de evaluación formativa en aulas de primaria y secundaria, y comprobaron que la retroalimentación inmediata — disponible a través de sistemas de respuesta en el aula — producía mejores resultados de aprendizaje que la retroalimentación escrita diferida, siempre que los estudiantes dispusieran de orientación suficiente para actuar sobre lo recibido. La rapidez de la retroalimentación importa, pero solo cuando va acompañada de claridad.
El metaanálisis de Kingston y Nash de 2011, publicado en Educational Measurement: Issues and Practice, merece ser señalado por su honestidad intelectual: encontró tamaños del efecto menores (aproximadamente 0,20) que la síntesis de Black y Wiliam. Kingston y Nash atribuyeron la diferencia a la calidad de los estudios y a la fidelidad de la implementación. Una evaluación formativa con implementación débil produce resultados débiles. La investigación respalda la práctica, pero no de forma acrítica — la ejecución importa.
Concepciones Erróneas Frecuentes
La evaluación formativa equivale a exámenes frecuentes. Los cuestionarios de bajo riesgo pueden cumplir propósitos formativos, pero la evaluación formativa se define por lo que ocurre con la evidencia, no por el formato del instrumento. Un docente que propone un cuestionario de cinco preguntas y luego continúa con la siguiente sesión independientemente de los resultados ha realizado un cuestionario, no una evaluación formativa. Por el contrario, un debate rico en clase en el que el docente escucha atentamente y ajusta el rumbo del día en función de lo que dicen los estudiantes es altamente formativo — sin necesidad de ningún cuestionario.
La evaluación formativa es solo responsabilidad del docente. Esta concepción reduce la evaluación formativa a una tarea de supervisión realizada sobre los estudiantes en lugar de un proceso colaborativo en el que participan. Cuando los estudiantes aprenden a evaluar su propia comprensión, a establecer objetivos de aprendizaje y a dar retroalimentación útil a sus compañeros, se convierten en participantes activos en su propio progreso de aprendizaje. La coevaluación, en particular, genera retroalimentación en un volumen y frecuencia que ningún docente puede igualar por sí solo, y el acto de evaluar el trabajo ajeno profundiza la comprensión del propio evaluador.
Los resultados de la evaluación formativa deberían registrarse en el libro de calificaciones. Calificar el trabajo formativo confunde su propósito diagnóstico con el propósito evaluador de la evaluación sumativa. Cuando los estudiantes saben que cada respuesta será puntuada, protegen su expediente en lugar de revelar su pensamiento. La evidencia formativa más útil a menudo proviene de la comprensión incompleta, los caminos equivocados y las ideas a medio formar — exactamente lo que las calificaciones penalizan. Mantener separados los registros formativos y sumativos protege la seguridad psicológica que requiere una evidencia formativa honesta.
Conexión con el Aprendizaje Activo
La evaluación formativa y el aprendizaje activo se refuerzan mutuamente: el aprendizaje activo genera evidencia observable del pensamiento, y la evaluación formativa ofrece a docentes y estudiantes un mecanismo para usar esa evidencia. Sin retroalimentación formativa, el aprendizaje activo puede ser estimulante pero carecer de dirección; sin estructuras de aprendizaje activo, la evaluación formativa carece de la evidencia rica que necesita para ser útil.
El think-pair-share es uno de los vehículos de evaluación formativa más potentes de uso común. Cuando los estudiantes se emparejan para debatir una pregunta antes de compartirla con el grupo, el docente circula y escucha — recogiendo evidencia en tiempo real de lo que los estudiantes comprenden, lo que confunden y lo que les resulta genuinamente difícil. La fase de puesta en común revela qué ideas están extendidas y cuáles son idiosincrásicas. El docente puede ajustar la enseñanza sobre la marcha en función de lo que han sacado a la luz las parejas.
La galería de trabajo transforma la evidencia formativa en un artefacto físico que la clase puede examinar colectivamente. Cuando los grupos exponen su trabajo en las paredes y rotan por él, tanto el docente como los estudiantes pueden ver el abanico de respuestas del grupo. El docente obtiene datos de evaluación rápida sobre todo el grupo; los estudiantes calibran su propia comprensión frente a la de sus compañeros. Las anotaciones que los estudiantes añaden durante la rotación son en sí mismas evidencia formativa.
El chalk talk — el protocolo de escritura colaborativa en silencio — genera un registro visible del pensamiento del estudiante sin las presiones sociales del debate verbal. Los estudiantes escriben preguntas y respuestas directamente en papel compartido o en una pizarra. El docente puede fotografiar la conversación y revisarla como dato formativo, mientras los estudiantes observan dónde converge y diverge el pensamiento de sus compañeros con respecto al suyo propio.
El concepto de evaluación para el aprendizaje proporciona el marco filosófico más amplio que une estas prácticas. Donde la evaluación formativa nombra la práctica técnica, la evaluación para el aprendizaje nombra la orientación: la evaluación utilizada no para clasificar o certificar, sino para apoyar al aprendiz en su progreso.
Fuentes
- Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. Phi Delta Kappan, 80(2), 139–148.
- Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81–112.
- Wiliam, D. (2011). Embedded Formative Assessment. Solution Tree Press.
- Sadler, D. R. (1989). Formative assessment and the design of instructional systems. Instructional Science, 18(2), 119–144.