Definición
Los criterios de éxito son descripciones explícitas de lo que los estudiantes deben hacer, producir o demostrar para mostrar que han alcanzado un objetivo de aprendizaje. Donde un objetivo de aprendizaje nombra el destino («los estudiantes comprenderán el ciclo del agua»), los criterios de éxito describen la evidencia de llegada: lo que un estudiante puede decir, escribir, dibujar, explicar o realizar para demostrar que se ha alcanzado la comprensión.
La distinción importa. Los objetivos viven en el nivel de la intención planificadora del profesor. Los criterios viven en el nivel del resultado observable del estudiante. Cuando los criterios son claros, los estudiantes pueden monitorizar su propio progreso durante una tarea, autocorregirse antes de la entrega y buscar ayuda específica en lugar de una vaga tranquilización. Cuando los criterios están ausentes o se dejan implícitos, solo el profesor sabe cómo es lo «bueno»: una desventaja estructural que afecta de forma desproporcionada a los estudiantes que carecen del capital cultural para descifrar por sí solos las expectativas académicas.
Los criterios de éxito pueden ser de producto (que describen un artefacto terminado), de proceso (que describen los pasos o estrategias utilizados) o actitudinales (que describen comportamientos colaborativos o hábitos de pensamiento). En la práctica, la mayoría de las lecciones eficaces combinan al menos dos tipos.
Contexto histórico
El uso sistemático de los criterios de éxito en las aulas creció a partir del movimiento de evaluación para el aprendizaje que se aceleró a finales de los años noventa. La revisión de Paul Black y Dylan Wiliam de 1998 «Inside the Black Box», publicada por el King's College de Londres, sintetizó evidencia de 250 estudios y concluyó que las prácticas de evaluación formativa, incluida la transparencia de los objetivos de aprendizaje para los estudiantes, producían tamaños de efecto de entre 0,4 y 0,7, entre los más altos de cualquier intervención educativa estudiada a esa escala.
Shirley Clarke, investigadora y profesional con base en el Reino Unido que colaboró extensamente con Black y Wiliam, fue quien más hizo para operacionalizar los criterios de éxito como práctica de aula. Su libro de 2001 Unlocking Formative Assessment y el posterior Formative Assessment in Action (2005) proporcionaron a los profesores marcos concretos para escribir, compartir y coconstruir criterios con los estudiantes. Clarke introdujo el término emparejado «learning intentions and success criteria» (LISC), que se convirtió en vocabulario estándar en las aulas del Reino Unido, Australia y Nueva Zelanda a lo largo de los años 2000.
La síntesis de John Hattie en Visible Learning (2009), que abarca más de 800 metaanálisis, situó la «claridad docente» —de la cual los criterios de éxito explícitos son un componente central— en un tamaño de efecto de 0,75, muy por encima del punto de inflexión de 0,40 que Hattie usó para denotar un impacto significativo. Esto le dio a la práctica un sólido respaldo empírico en un momento en que la enseñanza basada en evidencia estaba ganando tracción institucional. El trabajo de Jan Chappuis, en particular Seven Strategies of Assessment for Learning (2009, Educational Testing Service), extendió la práctica de los criterios de éxito a los contextos norteamericanos y la vinculó directamente con la autoevaluación del estudiante.
Principios clave
Los criterios deben ser observables y verificables
Un criterio de éxito solo es funcional si un estudiante (o profesor) puede mirar un trabajo y determinar si se ha cumplido. «Comprender a Shakespeare» no supera esta prueba. «Explicar cómo el uso del aparte por parte de Yago crea ironía dramática para el público» sí la supera. La pregunta operativa al redactar criterios es: ¿podría un estudiante de doce años autoevaluarse con esto sin consultar al profesor? Si la respuesta es no, el criterio sigue estando redactado en el nivel de la intención del profesor en lugar del nivel de la evidencia del estudiante.
Los criterios son distintos de las tareas
Un error frecuente es confundir la tarea («escribe una carta persuasiva») con los criterios de éxito para esa tarea. Las tareas describen lo que los estudiantes harán. Los criterios describen las cualidades que debe tener el trabajo. La misma tarea puede servir a múltiples conjuntos de criterios según lo que priorice la lección: un día, los criterios pueden centrarse en elementos estructurales (tesis, evidencia, contraargumento); otro día, en elecciones lingüísticas (verbos modales, vocabulario emotivo). Mantener esta distinción clara evita que los criterios se conviertan en una lista de comprobación de pasos procedimentales en lugar de descriptores de calidad.
Los criterios deben compartirse antes de comenzar el trabajo
Los criterios compartidos después de una tarea se convierten en un esquema de calificación. Su valor pedagógico reside enteramente en dar a los estudiantes un objetivo cognitivo mientras aún están tomando decisiones. La investigación de Clarke (2005) encontró que los estudiantes en aulas donde los criterios se compartían antes de la tarea mostraban tasas significativamente más altas de autocorrección durante la tarea y producían retroalimentación entre pares más específica que los estudiantes que recibían los criterios solo en el momento de la entrega.
La coconstrucción genera apropiación metacognitiva
Los estudiantes que ayudan a generar criterios de éxito desarrollan una conciencia metacognitiva más sólida de cómo es la calidad. Una rutina habitual de coconstrucción: el profesor presenta dos o tres muestras anónimas de una tarea completada (una sólida, una débil, una intermedia), pide a los estudiantes que identifiquen qué las diferencia y facilita una discusión en clase que saca a la superficie los criterios subyacentes. El profesor luego refina y formaliza lo que los estudiantes articulan. Este proceso lleva más tiempo que simplemente enunciar los criterios, pero el trabajo cognitivo de distinguir la calidad genera un juicio transferible que los estudiantes aplican a trabajos futuros.
Los criterios deben conectarse explícitamente con el objetivo
Cada criterio debe remitir al objetivo de aprendizaje establecido. Si un criterio no puede rastrearse hasta un objetivo, o bien está midiendo algo irrelevante (por ejemplo, la pulcritud cuando el objetivo es el razonamiento matemático), o bien revela que el objetivo estaba subespecificado. Esta verificación de alineación es también una disciplina de planificación: redactar criterios de éxito precisos obliga a los profesores a ser exactos sobre lo que realmente quieren que los estudiantes aprendan, no solo sobre lo que quieren que hagan.
Aplicación en el aula
Primaria: Escritura inicial, 2.º curso
Un profesor de 2.º curso que trabaja la escritura de recuentos publica tres criterios visuales de éxito en la pizarra junto con iconos comprensibles para los estudiantes: un reloj (los eventos en orden cronológico), un bocadillo de diálogo (usa conectores temporales: primero, luego, después, finalmente) y una cara (escrito en primera persona, «yo»). Antes de que los estudiantes escriban, el profesor lee cada criterio en voz alta, modela un párrafo de su propio recuento y pide a los estudiantes que identifiquen dónde aparece cada criterio en su escritura. Los estudiantes redactan de forma independiente, usando una copia impresa de los criterios para autoevaluarse antes de compartir con un compañero. Los criterios son fijos; la tarea, un recuento de una excursión escolar, proporciona el contexto.
Educación secundaria: Ensayo analítico, 2.º de ESO (Historia)
Un profesor de historia que prepara a los estudiantes para escribir un ensayo de análisis de fuentes coconstruye los criterios con la clase. Proyecta dos ensayos anónimos de un curso anterior y pregunta: «¿Qué hace más sólido al ensayo más sólido?» Los estudiantes identifican que cita directamente de la fuente, explica lo que muestra la cita (en lugar de simplemente repetirla) y considera el propósito del autor. El profesor añade un criterio que los estudiantes no detectan: considerar las limitaciones de la fuente en función de cuándo y por qué fue creada. Los criterios acordados definitivamente —citar, explicar, contextualizar, evaluar la procedencia— se registran en un documento compartido. Los estudiantes los consultan durante la redacción y los utilizan para dar retroalimentación escrita a un compañero.
Bachillerato: Resolución de problemas matemáticos, 1.º de Bachillerato
Un profesor de matemáticas utiliza criterios de proceso junto a criterios de producto para un problema de probabilidad de varios pasos. Los criterios de producto especifican la forma correcta de la respuesta (fracción exacta, simplificada). Los criterios de proceso especifican: muestra todos los pasos claramente, enuncia la regla que se aplica antes de aplicarla, verifica la respuesta frente a las restricciones del problema. Esto separa el razonamiento matemático del mero cálculo, lo que permite al profesor diagnosticar si los errores provienen de lagunas conceptuales o de deslices procedimentales, información fundamental para planificar la siguiente sesión.
Evidencia investigadora
La metarrevisión de Black y Wiliam de 1998 («Inside the Black Box», Phi Delta Kappan) sigue siendo la base de evidencia fundacional. Sintetizando 250 estudios, encontraron que los objetivos de aprendizaje claros compartidos con los estudiantes, combinados con retroalimentación formativa regular frente a esos objetivos, producían tamaños de efecto de 0,4 a 0,7, con las mayores ganancias apareciendo de forma consistente entre los estudiantes de menor rendimiento, reduciendo las brechas de logro en lugar de simplemente elevar los promedios.
El artículo de Hattie y Timperley de 2007 «The Power of Feedback» (Review of Educational Research, 77(1), 81-112) analizó 196 estudios que abarcaban más de 6.000 tamaños de efecto. Su modelo identifica tres preguntas de retroalimentación: ¿Hacia dónde voy? ¿Cómo voy? ¿Qué hago a continuación? Los criterios de éxito responden directamente a la primera pregunta haciendo explícito el objetivo, lo que encontraron como un prerrequisito para que las funciones de retroalimentación segunda y tercera operen. Sin un objetivo claro, la retroalimentación sobre «cómo voy» carece de dirección.
El trabajo longitudinal de Shirley Clarke en escuelas de primaria del Reino Unido (recogido en Formative Assessment in Action, 2005, Hodder Murray) documentó resultados cualitativos y cuantitativos en aulas que adoptaron la práctica emparejada LISC a lo largo de tres años. Los profesores informaron de que compartir los criterios reducía el volumen de preguntas procedimentales fuera de tarea («¿Es suficientemente largo esto?», «¿Está bien así?») e incrementaba las preguntas sustantivas sobre el contenido y la calidad, un cambio que liberaba un tiempo instruccional significativo.
Una limitación que merece reconocerse: la mayor parte de la investigación sobre criterios de éxito es cuasiexperimental, realizada en entornos de aula naturalistas en lugar de ensayos controlados aleatorizados. Las estimaciones del tamaño de efecto varían considerablemente según la asignatura, el grupo de edad y la forma en que se implementaron los criterios. La investigación respalda la práctica de forma sólida, pero no especifica un formato, frecuencia o método de generación óptimos para todos los contextos.
Concepciones erróneas frecuentes
Los criterios de éxito son lo mismo que las instrucciones
Los estudiantes (y algunos profesores) confunden los criterios con los pasos procedimentales de una tarea. «Escribe tres párrafos, incluye un título, usa mayúsculas» describe el formato de la tarea, no la calidad del aprendizaje. Los criterios de éxito responden a una pregunta diferente: no «¿qué debo hacer?» sino «¿qué debe mostrar mi trabajo?» Las instrucciones son necesarias, pero no le dicen al estudiante cómo es lo bueno, solo qué debe contener el producto acabado a nivel superficial. La prueba: los criterios deben seguir siendo significativos aunque cambie el formato de la tarea.
Más criterios equivale a más claridad
Proporcionar ocho o diez criterios para una sola tarea rara vez ayuda a los estudiantes y con frecuencia los paraliza. La investigación sobre la carga cognitiva (Sweller, 1988) es directamente relevante aquí: cuando la propia lista de criterios se convierte en una carga para la memoria de trabajo, los estudiantes dedican su atención a gestionar la lista en lugar de aplicarla a su trabajo. Tres a cinco criterios, priorizados según lo que más valora la lección, producen mejores resultados que las listas de comprobación exhaustivas. La investigación sobre claridad docente llega a la misma conclusión: la especificidad y el enfoque superan a la exhaustividad.
Compartir los criterios elimina el desafío o la creatividad
Una preocupación persistente entre los profesores, especialmente en artes y humanidades, es que los criterios explícitos restringen el pensamiento original. La evidencia no respalda esta preocupación. La investigación de Clarke en el aula encontró que los estudiantes que recibían criterios claros de calidad en escritura creativa producían trabajos más variados y ambiciosos, no menos, porque comprendían desde y hacia dónde estaban variando. Los criterios establecen el suelo, no el techo. La idea errónea generalmente refleja criterios redactados al nivel del formato («incluye una metáfora») en lugar del nivel de la calidad («crea una imagen que haga sentir al lector el contraste entre las dos ideas»): un problema de redacción, no una cuestión conceptual sobre los criterios.
Conexión con el aprendizaje activo
Los criterios de éxito no son meramente una herramienta de evaluación; son un prerrequisito para un aprendizaje activo significativo. Los estudiantes no pueden participar en una autoevaluación productiva, en la retroalimentación entre pares ni en la reflexión metacognitiva sin una imagen compartida y explícita de la calidad. En el momento en que los criterios son visibles, los estudiantes pueden realizar el trabajo cognitivo que anteriormente solo el profesor podía hacer.
En la práctica de evaluación formativa, los criterios de éxito anclan cada estrategia principal. Las fichas de salida solo son significativas cuando están vinculadas a criterios con los que los estudiantes pueden autoevaluarse. La retroalimentación entre pares se vuelve sustantiva cuando ambas partes comparten un lenguaje común para la calidad. La autorregulación —la capacidad de monitorizar, evaluar y ajustar el propio trabajo— depende de tener un modelo interiorizado de cómo es lo «bueno», que los criterios ayudan a construir con el tiempo.
La conexión con metodologías específicas de aprendizaje activo es directa. En el pensar-compartir en pareja, pedir a los estudiantes que primero se autoevalúen frente a los criterios antes de compartir centra la discusión en pareja en las lagunas sustantivas en lugar de la confusión procedimental. En el aprendizaje basado en proyectos, los criterios de éxito coconstruidos en el lanzamiento del proyecto establecen estándares compartidos que los equipos de estudiantes pueden usar para evaluar prototipos y borradores a lo largo del ciclo de indagación. En el seminario socrático, los criterios de discusión (por ejemplo, «construye sobre el punto de un hablante anterior», «usa evidencia del texto») hacen visibles y autoevaluables los estándares de comportamiento del discurso académico de calidad para los estudiantes que aún no son fluentes en ese registro.
La relación entre los criterios de éxito y los objetivos de aprendizaje es arquitectónica: los objetivos definen el aprendizaje previsto; los criterios definen su evidencia. Juntos constituyen lo que Hattie denomina el elemento «visible» del aprendizaje visible: un aula en la que tanto el profesor como el estudiante pueden articular hacia dónde se dirige el aprendizaje y cómo será cuando llegue.
Fuentes
-
Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. Phi Delta Kappan, 80(2), 139–148.
-
Clarke, S. (2005). Formative Assessment in Action: Weaving the Elements Together. Hodder Murray.
-
Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81–112.
-
Chappuis, J. (2009). Seven Strategies of Assessment for Learning. Educational Testing Service.