Definición

Los criterios de éxito son descripciones explícitas de lo que los estudiantes deben hacer, producir o demostrar para mostrar que han alcanzado un objetivo de aprendizaje. Mientras que un objetivo de aprendizaje nombra el destino ("los estudiantes comprenderán el ciclo del agua"), los criterios de éxito describen la evidencia de llegada: lo que un estudiante puede decir, escribir, dibujar, explicar o realizar para demostrar que se ha alcanzado la comprensión.

La distinción importa. Los objetivos viven en el nivel de la intención de planeación del docente. Los criterios viven en el nivel del producto observable del estudiante. Cuando los criterios son claros, los estudiantes pueden monitorear su propio progreso durante una tarea, autocorregirse antes de entregar y buscar ayuda específica en lugar de una tranquilidad vaga. Cuando los criterios están ausentes o implícitos, solo el docente sabe cómo se ve "lo bueno", una desventaja estructural que afecta de manera desproporcionada a los estudiantes que carecen del capital cultural para descifrar las expectativas académicas por sí solos.

Los criterios de éxito pueden ser basados en el producto (que describen un artefacto terminado), basados en el proceso (que describen los pasos o estrategias utilizados) o actitudinales (que describen comportamientos colaborativos o hábitos mentales). En la práctica, la mayoría de las lecciones efectivas combinan al menos dos tipos.

Contexto histórico

El uso sistemático de los criterios de éxito en las aulas creció a partir del movimiento de evaluación para el aprendizaje que se aceleró a finales de los años noventa. La revisión de Paul Black y Dylan Wiliam de 1998, "Inside the Black Box", publicada por King's College London, sintetizó evidencia de 250 estudios y concluyó que las prácticas de evaluación formativa, incluida la transparencia de las metas de aprendizaje para los estudiantes, produjeron tamaños de efecto de entre 0.4 y 0.7, entre los más altos de cualquier intervención educativa estudiada a esa escala.

Shirley Clarke, investigadora y docente del Reino Unido que colaboró extensamente con Black y Wiliam, fue quien más hizo por operacionalizar los criterios de éxito como práctica de aula. Su libro de 2001 Unlocking Formative Assessment y el posterior Formative Assessment in Action (2005) dieron a los docentes marcos concretos para escribir, compartir y co-construir criterios con los estudiantes. Clarke introdujo el término pareado "intenciones de aprendizaje y criterios de éxito" (LISC, por sus siglas en inglés), que se convirtió en vocabulario estándar en las aulas de Reino Unido, Australia y Nueva Zelanda durante la primera década del siglo XXI.

La síntesis de Visible Learning de John Hattie (2009), basada en más de 800 metaanálisis, situó la "claridad docente", de la cual los criterios de éxito explícitos son un componente central, con un tamaño de efecto de 0.75, muy por encima del punto de inflexión de 0.40 que Hattie usó para denotar un impacto significativo. Esto otorgó a la práctica un sólido respaldo empírico en un momento en que la enseñanza basada en evidencia ganaba tracción institucional. El trabajo de Jan Chappuis, particularmente Seven Strategies of Assessment for Learning (2009, Educational Testing Service), extendió la práctica de los criterios de éxito a contextos norteamericanos y la vinculó directamente con la autoevaluación de los estudiantes.

Principios clave

Los criterios deben ser observables y verificables

Un criterio de éxito solo es funcional si un estudiante (o docente) puede mirar un trabajo y determinar si se ha cumplido. "Comprender a Shakespeare" no supera esta prueba. "Explicar cómo el uso del aparte por parte de Yago crea ironía dramática para el público" sí la supera. La pregunta operativa al escribir criterios es: ¿podría un estudiante de 12 años autoevaluarse con esto sin consultar al docente? Si la respuesta es no, el criterio aún está escrito al nivel de la intención del docente y no de la evidencia del estudiante.

Los criterios son distintos de las tareas

Un error común es confundir la tarea ("escribir una carta persuasiva") con los criterios de éxito para esa tarea. Las tareas describen lo que los estudiantes harán. Los criterios describen las cualidades que debe tener el trabajo. La misma tarea puede servir a múltiples conjuntos de criterios según lo que priorice la lección: un día, los criterios podrían enfocarse en elementos estructurales (afirmación, evidencia, contraargumento); otro día, en elecciones lingüísticas (verbos modales, vocabulario emotivo). Mantener clara esta distinción evita que los criterios se conviertan en una lista de verificación de pasos procedimentales en lugar de descriptores de calidad.

Los criterios deben compartirse antes de comenzar el trabajo

Los criterios compartidos después de una tarea se convierten en un esquema de calificación. Su valor pedagógico reside enteramente en darle a los estudiantes una meta cognitiva mientras aún toman decisiones. La investigación de Clarke (2005) encontró que los estudiantes en aulas donde los criterios se compartían antes de la tarea mostraron tasas significativamente más altas de autocorrección durante la tarea y produjeron retroalimentación entre pares más específica que los estudiantes que recibieron los criterios solo al momento de la entrega.

La co-construcción genera apropiación metacognitiva

Los estudiantes que ayudan a generar criterios de éxito desarrollan una conciencia metacognitiva más sólida sobre cómo se ve la calidad. Una rutina común de co-construcción: el docente presenta dos o tres muestras anónimas de una tarea completada (una sólida, una débil, una intermedia), pide a los estudiantes que identifiquen qué las separa y facilita una discusión grupal que saca a la superficie los criterios subyacentes. El docente luego refina y formaliza lo que los estudiantes articulan. Este proceso toma más tiempo que simplemente enunciar los criterios, pero el trabajo cognitivo de distinguir la calidad genera un juicio transferible que los estudiantes aplican a trabajos futuros.

Los criterios deben conectarse explícitamente con el objetivo

Cada criterio debe remitir al objetivo de aprendizaje declarado. Si un criterio no puede rastrearse hasta un objetivo, está midiendo algo irrelevante (por ejemplo, la prolijidad cuando el objetivo es el razonamiento matemático) o revela que el objetivo estaba subespecificado. Esta verificación de alineación también es una disciplina de planeación: escribir criterios de éxito precisos obliga a los docentes a ser exactos sobre lo que realmente quieren que los estudiantes aprendan, no solo sobre lo que quieren que hagan.

Aplicación en el aula

Primaria: Escritura inicial, 2.° grado

Un docente de 2.° grado que escribe una lección sobre escritura de recuentos publica tres criterios de éxito visuales en la pizarra junto a íconos amigables para los estudiantes: un reloj (eventos en orden cronológico), un globo de diálogo (usa conectores temporales: primero, luego, después, finalmente) y una cara (escrito en primera persona — "yo"). Antes de que los estudiantes escriban, el docente lee cada criterio en voz alta, modela un párrafo de su propio recuento y pide a los estudiantes que identifiquen dónde aparece cada criterio en su escritura. Los estudiantes luego redactan de forma independiente, usando una copia impresa de los criterios para autoevaluarse antes de compartir con un compañero. Los criterios son fijos; la tarea, un recuento de una salida escolar, proporciona el contexto.

Secundaria: Ensayo analítico, 8.° grado de Historia

Un docente de historia que prepara a los estudiantes para escribir un ensayo de análisis de fuentes co-construye los criterios con el grupo. Proyecta dos ensayos anónimos de un año anterior y pregunta: "¿Qué hace que el ensayo más sólido sea mejor?" Los estudiantes identifican que cita directamente de la fuente, explica lo que muestra la cita (en lugar de simplemente reiterarla) y considera el propósito del autor. El docente agrega un criterio que los estudiantes no detectan: considerar las limitaciones de la fuente dado cuándo y por qué fue creada. Los criterios acordados finales, citar, explicar, contextualizar, evaluar la procedencia, se colocan en un documento compartido. Los estudiantes los consultan durante la redacción y los usan para dar retroalimentación escrita a un compañero.

Preparatoria: Resolución de problemas matemáticos, 11.° grado

Un docente de matemáticas usa criterios de proceso junto con criterios de producto para un problema de probabilidad de varios pasos. Los criterios de producto especifican la forma correcta de la respuesta (fracción exacta, simplificada). Los criterios de proceso especifican: mostrar todo el procedimiento con claridad, enunciar la regla que se aplica antes de aplicarla, verificar la respuesta frente a las restricciones del problema. Esto separa el razonamiento matemático del mero cálculo, permitiendo al docente diagnosticar si los errores provienen de vacíos conceptuales o de fallas procedimentales, información crítica para planear la siguiente clase.

Evidencia de investigación

La meta-revisión de Black y Wiliam de 1998 ("Inside the Black Box," Phi Delta Kappan) sigue siendo la base de evidencia fundamental. Al sintetizar 250 estudios, encontraron que las metas de aprendizaje claras compartidas con los estudiantes, combinadas con retroalimentación formativa regular frente a esas metas, produjeron tamaños de efecto de 0.4 a 0.7, con las mayores ganancias apareciendo de manera consistente entre los estudiantes de menor rendimiento, reduciendo las brechas de logro en lugar de simplemente elevar los promedios.

El artículo de Hattie y Timperley de 2007, "The Power of Feedback" (Review of Educational Research, 77(1), 81–112), analizó 196 estudios con más de 6,000 tamaños de efecto. Su modelo identifica tres preguntas de retroalimentación: ¿A dónde voy? ¿Cómo voy? ¿Qué sigue? Los criterios de éxito responden directamente a la primera pregunta al hacer explícita la meta, lo que encontraron como requisito previo para que operen las funciones de retroalimentación segunda y tercera. Sin una meta clara, la retroalimentación sobre "cómo voy" no tiene dirección.

El trabajo longitudinal de Shirley Clarke en escuelas primarias del Reino Unido (documentado en Formative Assessment in Action, 2005, Hodder Murray) registró resultados cualitativos y cuantitativos en aulas que adoptaron la práctica LISC pareada durante tres años. Los docentes reportaron que compartir los criterios redujo el volumen de preguntas procedimentales fuera de tarea ("¿Es suficientemente largo esto?", "¿Está bien así?") e incrementó las preguntas sustantivas sobre el contenido y la calidad, un cambio que liberó tiempo instruccional significativo.

Vale la pena reconocer una limitación: la mayor parte de la investigación sobre criterios de éxito es cuasi-experimental, realizada en entornos de aula naturalistas en lugar de ensayos controlados aleatorios. Las estimaciones de tamaño de efecto varían considerablemente según la materia, el grupo de edad y cómo se implementaron los criterios. La investigación respalda la práctica de manera sólida, pero no especifica un formato, frecuencia o método de generación óptimos para todos los contextos.

Conceptos erróneos comunes

Los criterios de éxito son lo mismo que las instrucciones

Los estudiantes (y algunos docentes) confunden los criterios con los pasos procedimentales de una tarea. "Escribir tres párrafos, incluir un título, usar mayúsculas" describe el formato de la tarea, no la calidad del aprendizaje. Los criterios de éxito responden una pregunta diferente: no "¿qué debo hacer?" sino "¿qué debe mostrar mi trabajo?" Las instrucciones son necesarias, pero no le dicen a un estudiante cómo se ve lo bueno, solo qué debe contener el producto terminado a nivel superficial. La prueba: los criterios deben seguir siendo significativos incluso si cambia el formato de la tarea.

Más criterios significa más claridad

Proporcionar ocho o diez criterios para una sola tarea rara vez ayuda a los estudiantes y con frecuencia los paraliza. La investigación sobre carga cognitiva (Sweller, 1988) es directamente relevante aquí: cuando la lista de criterios se convierte en una carga para la memoria de trabajo, los estudiantes gastan su atención en administrar la lista en lugar de aplicarla a su trabajo. Tres a cinco criterios, priorizados según lo que más valora la lección, producen mejores resultados que listas de verificación exhaustivas. La investigación sobre claridad docente llega a la misma conclusión: la especificidad y el enfoque superan a la exhaustividad.

Compartir los criterios elimina el desafío o la creatividad

Una preocupación persistente entre los docentes, particularmente en artes y humanidades, es que los criterios explícitos limitan el pensamiento original. La evidencia no respalda esta preocupación. La investigación en aulas de Clarke encontró que los estudiantes a quienes se les daban criterios claros de calidad en escritura creativa producían trabajos más variados y ambiciosos, no menos, porque comprendían desde dónde y hacia dónde variaban. Los criterios establecen el piso, no el techo. El concepto erróneo generalmente refleja criterios escritos al nivel del formato ("incluir una metáfora") en lugar del nivel de la calidad ("crear una imagen que haga sentir al lector el contraste entre las dos ideas"), un problema de redacción, no uno conceptual sobre los criterios.

Conexión con el aprendizaje activo

Los criterios de éxito no son meramente una herramienta de evaluación; son un requisito previo para el aprendizaje activo significativo. Los estudiantes no pueden participar en una autoevaluación productiva, retroalimentación entre pares o reflexión metacognitiva sin una imagen compartida y explícita de la calidad. En el momento en que los criterios son visibles, los estudiantes pueden realizar el trabajo cognitivo que antes solo el docente podía hacer.

En la práctica de evaluación formativa, los criterios de éxito anclan cada estrategia principal. Las boletas de salida son significativas solo cuando están vinculadas a criterios contra los cuales los estudiantes pueden autoevaluarse. La retroalimentación entre pares se vuelve sustantiva cuando ambas partes comparten un lenguaje común para la calidad. La autorregulación, la capacidad de monitorear, evaluar y ajustar el propio trabajo, depende de tener un modelo interiorizado de cómo se ve "lo bueno", que los criterios ayudan a construir con el tiempo.

La conexión con metodologías específicas de aprendizaje activo es directa. En el pensar-compartir en pares, hacer que los estudiantes primero se autoevalúen frente a los criterios antes de compartir enfoca la discusión en pareja en vacíos sustantivos en lugar de confusión procedimental. En el aprendizaje basado en proyectos, los criterios de éxito co-construidos al lanzar el proyecto establecen estándares compartidos que los equipos de estudiantes pueden usar para evaluar prototipos y borradores a lo largo del ciclo de indagación. En el seminario socrático, los criterios de discusión (por ejemplo, "construye sobre el punto de un hablante anterior", "usa evidencia del texto") hacen visibles y autoevaluables los estándares conductuales del discurso académico de calidad para los estudiantes que aún no dominan ese registro.

La relación entre los criterios de éxito y los objetivos de aprendizaje es arquitectónica: los objetivos definen el aprendizaje previsto; los criterios definen su evidencia. Juntos constituyen lo que Hattie llama el elemento "visible" del aprendizaje visible: un aula donde tanto el docente como el estudiante pueden articular hacia dónde se dirige el aprendizaje y cómo se verá cuando llegue.

Fuentes

  1. Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. Phi Delta Kappan, 80(2), 139–148.

  2. Clarke, S. (2005). Formative Assessment in Action: Weaving the Elements Together. Hodder Murray.

  3. Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81–112.

  4. Chappuis, J. (2009). Seven Strategies of Assessment for Learning. Educational Testing Service.