Définition

Les critères de réussite sont des descriptions explicites de ce que les élèves doivent faire, produire ou démontrer pour montrer qu'ils ont atteint un objectif d'apprentissage. Là où un objectif d'apprentissage nomme la destination (« les élèves comprendront le cycle de l'eau »), les critères de réussite décrivent les preuves de l'arrivée : ce qu'un élève peut dire, écrire, dessiner, expliquer ou réaliser pour attester qu'il a effectivement compris.

Cette distinction est fondamentale. Les objectifs relèvent du niveau de l'intention planificatrice de l'enseignant. Les critères relèvent du niveau de ce que l'élève produit de façon observable. Lorsque les critères sont clairs, les élèves peuvent suivre leur propre progression pendant une tâche, se corriger avant de rendre leur travail et solliciter une aide ciblée plutôt que de vagues encouragements. En l'absence de critères — ou lorsque ceux-ci restent implicites — seul l'enseignant sait à quoi ressemble le « bien » : un désavantage structurel qui pénalise de manière disproportionnée les élèves qui ne disposent pas du capital culturel nécessaire pour décoder par eux-mêmes les attentes académiques.

Les critères de réussite peuvent être axés sur le produit (décrivant un artefact fini), sur le processus (décrivant les étapes ou stratégies utilisées) ou sur les attitudes (décrivant les comportements collaboratifs ou les habitudes de pensée). En pratique, la plupart des leçons efficaces combinent au moins deux de ces types.

Contexte historique

L'utilisation systématique des critères de réussite en classe s'est développée à partir du mouvement de l'évaluation au service de l'apprentissage, qui a pris de l'ampleur à la fin des années 1990. La synthèse de Paul Black et Dylan Wiliam en 1998, « Inside the Black Box », publiée par le King's College de Londres, a compilé les résultats de 250 études et conclu que les pratiques d'évaluation formative — notamment rendre les objectifs d'apprentissage transparents pour les élèves — produisaient des tailles d'effet comprises entre 0,4 et 0,7, parmi les plus élevées jamais enregistrées pour une intervention éducative à cette échelle.

Shirley Clarke, chercheuse et praticienne britannique qui a collaboré étroitement avec Black et Wiliam, est celle qui a le plus contribué à opérationnaliser les critères de réussite comme pratique de classe. Son livre de 2001, Unlocking Formative Assessment, puis Formative Assessment in Action (2005), ont fourni aux enseignants des cadres concrets pour rédiger, partager et co-construire des critères avec les élèves. Clarke a introduit le binôme « intentions d'apprentissage et critères de réussite » (LISC), qui est devenu un vocabulaire standard dans les classes britanniques, australiennes et néo-zélandaises au cours des années 2000.

La synthèse de John Hattie, Visible Learning (2009), fondée sur plus de 800 méta-analyses, a placé la « clarté de l'enseignant » — dont les critères de réussite explicites sont un élément central — à une taille d'effet de 0,75, bien au-dessus du seuil de 0,40 qu'Hattie utilise pour indiquer un impact significatif. Cela a conféré à la pratique une solide assise empirique au moment précis où l'enseignement fondé sur les preuves gagnait en légitimité institutionnelle. Les travaux de Jan Chappuis, notamment Seven Strategies of Assessment for Learning (2009, Educational Testing Service), ont étendu la pratique des critères de réussite aux contextes nord-américains et l'ont directement reliée à l'auto-évaluation des élèves.

Principes clés

Les critères doivent être observables et vérifiables

Un critère de réussite n'est fonctionnel que si un élève (ou un enseignant) peut examiner un travail et déterminer s'il est atteint. « Comprendre Shakespeare » ne passe pas ce test. « Expliquer comment l'usage des apartés par Iago crée une ironie dramatique pour le public » le passe. La question opérationnelle lors de la rédaction des critères est la suivante : un élève de collège pourrait-il s'auto-évaluer sur cette base sans consulter l'enseignant ? Si la réponse est non, le critère est encore rédigé au niveau de l'intention de l'enseignant, et non au niveau de la preuve attendue de l'élève.

Les critères sont distincts des tâches

Une erreur fréquente consiste à confondre la tâche (« rédiger une lettre de persuasion ») et les critères de réussite associés. Les tâches décrivent ce que les élèves vont faire. Les critères décrivent les qualités que le travail doit posséder. La même tâche peut servir plusieurs ensembles de critères selon ce que la leçon cherche à valoriser : un jour, les critères peuvent porter sur des éléments structurels (thèse, arguments, contre-argument) ; un autre, sur les choix linguistiques (verbes modaux, vocabulaire connoté). Maintenir cette distinction évite que les critères ne deviennent une liste de vérification d'étapes procédurales plutôt que des descripteurs de qualité.

Les critères doivent être partagés avant que le travail ne commence

Des critères communiqués après une tâche se résument à un barème de correction. Leur valeur pédagogique tient entièrement au fait qu'ils donnent aux élèves un cap cognitif pendant qu'ils prennent encore des décisions. Les recherches de Clarke (2005) ont montré que les élèves dont les enseignants partageaient les critères avant la tâche présentaient des taux nettement plus élevés d'auto-correction en cours de travail et produisaient une rétroaction entre pairs plus ciblée que les élèves n'ayant reçu les critères qu'au moment de la remise.

La co-construction favorise l'appropriation métacognitive

Les élèves qui participent à l'élaboration des critères de réussite développent une conscience métacognitive plus affirmée de ce qu'est la qualité. Une routine de co-construction courante : l'enseignant présente deux ou trois exemples anonymes d'une tâche réalisée (un fort, un faible, un intermédiaire), invite les élèves à identifier ce qui les distingue, et anime une discussion collective qui fait émerger les critères sous-jacents. L'enseignant affine et formalise ensuite ce que les élèves ont formulé. Ce processus prend plus de temps que d'énoncer simplement les critères, mais le travail cognitif de distinction de la qualité développe un jugement transférable que les élèves appliquent à leurs travaux futurs.

Les critères doivent être explicitement reliés à l'objectif

Chaque critère doit pouvoir être rattaché à l'objectif d'apprentissage énoncé. Si un critère ne peut être relié à un objectif, il mesure soit quelque chose d'accessoire (par exemple, la propreté quand l'objectif porte sur le raisonnement mathématique), soit il révèle que l'objectif était insuffisamment précisé. Cette vérification d'alignement est aussi une discipline de planification : rédiger des critères de réussite rigoureux oblige les enseignants à être précis sur ce qu'ils veulent réellement que les élèves apprennent, et non seulement sur ce qu'ils veulent qu'ils fassent.

Application en classe

École primaire : écriture de récit, CE1

Un enseignant de CE1 travaillant sur le récit affiche trois critères de réussite visuels au tableau, accompagnés d'icônes accessibles aux élèves : une horloge (les événements se suivent dans l'ordre chronologique), une bulle de dialogue (emploi de connecteurs temporels : d'abord, ensuite, puis, enfin) et un visage (rédigé à la première personne — « Je »). Avant d'écrire, l'enseignant lit chaque critère à voix haute, rédige un paragraphe de son propre récit en le modélisant, et demande aux élèves d'identifier où chaque critère apparaît dans son texte. Les élèves rédigent ensuite de façon autonome, en utilisant une copie imprimée des critères pour s'auto-évaluer avant de partager leur travail avec un camarade. Les critères sont fixes ; la tâche — un récit d'une sortie de classe — fournit le contexte.

Collège : dissertation analytique, 4e Histoire

Un professeur d'histoire préparant les élèves à l'analyse de sources co-construit les critères avec la classe. Il projette deux dissertations anonymes d'une cohorte précédente et pose la question : « Qu'est-ce qui rend la dissertation la plus solide meilleure ? » Les élèves identifient qu'elle cite directement la source, explique ce que la citation montre (plutôt que de la paraphraser), et prend en compte l'intention de l'auteur. L'enseignant ajoute un critère que les élèves n'ont pas relevé : considérer les limites de la source en tenant compte du moment et des raisons de sa création. Les critères finaux convenus — citer, expliquer, contextualiser, évaluer la provenance — sont consignés dans un document partagé. Les élèves s'y réfèrent lors de la rédaction et les utilisent pour donner une rétroaction écrite à un camarade.

Lycée : résolution de problèmes en mathématiques, Terminale

Un professeur de mathématiques utilise des critères de processus en complément de critères de produit pour un problème de probabilités à plusieurs étapes. Les critères de produit précisent la forme correcte de la réponse (fraction exacte, simplifiée). Les critères de processus précisent : présenter clairement tous les calculs intermédiaires, énoncer la règle appliquée avant de l'appliquer, vérifier la réponse au regard des contraintes du problème. Cette distinction sépare le raisonnement mathématique du simple calcul, permettant à l'enseignant de déterminer si les erreurs proviennent de lacunes conceptuelles ou de défaillances procédurales — une information essentielle pour planifier la leçon suivante.

Données probantes

La méta-synthèse de Black et Wiliam en 1998 (« Inside the Black Box », Phi Delta Kappan) demeure la base de données probantes fondamentale. En synthétisant 250 études, ils ont constaté que des objectifs d'apprentissage clairs partagés avec les élèves, associés à une rétroaction formative régulière par rapport à ces objectifs, produisaient des tailles d'effet de 0,4 à 0,7 — les gains les plus importants apparaissant systématiquement chez les élèves les moins performants, ce qui réduisait les écarts de réussite plutôt que de simplement élever les moyennes.

L'article de Hattie et Timperley en 2007, « The Power of Feedback » (Review of Educational Research, 77(1), 81–112), a analysé 196 études portant sur plus de 6 000 tailles d'effet. Leur modèle identifie trois questions de rétroaction : Où vais-je ? Comment est-ce que je progresse ? Que faire ensuite ? Les critères de réussite répondent directement à la première question en rendant l'objectif explicite — ce qu'ils identifient comme un prérequis pour que les deuxième et troisième fonctions de rétroaction puissent opérer. Sans cible claire, la rétroaction sur « comment est-ce que je progresse » n'a pas d'orientation.

Les travaux longitudinaux de Shirley Clarke dans des écoles primaires britanniques (rapportés dans Formative Assessment in Action, 2005, Hodder Murray) ont documenté des résultats qualitatifs et quantitatifs dans des classes ayant adopté la pratique LISC sur trois ans. Les enseignants ont signalé que le partage des critères réduisait le volume de questions procédurales hors-sujet (« C'est assez long ? », « C'est juste ? ») et augmentait les questions substantielles sur le contenu et la qualité — un changement qui a libéré un temps d'enseignement significatif.

Une limite mérite d'être soulignée : la plupart des recherches sur les critères de réussite sont quasi-expérimentales, conduites en contexte naturel de classe plutôt que dans le cadre d'essais contrôlés randomisés. Les estimations de taille d'effet varient considérablement selon la discipline, le groupe d'âge et la façon dont les critères ont été mis en œuvre. Les recherches soutiennent solidement la pratique, mais ne précisent pas un format, une fréquence ou une méthode de génération optimaux pour tous les contextes.

Idées reçues courantes

Les critères de réussite sont identiques aux consignes

Les élèves — et certains enseignants — confondent les critères et les étapes procédurales d'une tâche. « Rédigez trois paragraphes, ajoutez un titre, utilisez des majuscules » décrit le format de la tâche, pas la qualité de l'apprentissage. Les critères de réussite répondent à une question différente : non pas « que dois-je faire ? » mais « que doit montrer mon travail ? ». Les consignes sont nécessaires, mais elles n'indiquent pas à un élève à quoi ressemble le « bien » — seulement ce que le travail fini doit contenir en surface. Le test : les critères doivent rester significatifs même si le format de la tâche change.

Plus il y a de critères, plus la clarté est grande

Fournir huit ou dix critères pour une seule tâche aide rarement les élèves et les paralyse souvent. Les recherches sur la charge cognitive (Sweller, 1988) sont directement pertinentes ici : lorsque la liste de critères elle-même devient une charge pour la mémoire de travail, les élèves consacrent leur attention à gérer la liste plutôt qu'à l'appliquer à leur travail. Trois à cinq critères, hiérarchisés selon ce que la leçon valorise le plus, produisent de meilleurs résultats que des listes exhaustives. Les recherches sur la clarté de l'enseignant aboutissent à la même conclusion : la spécificité et la concentration l'emportent sur l'exhaustivité.

Partager les critères supprime le défi ou la créativité

Une inquiétude persistante chez les enseignants — particulièrement dans les arts et les lettres — est que des critères explicites contraignent la pensée originale. Les données ne corroborent pas cette crainte. Les recherches de Clarke en classe ont montré que les élèves disposant de critères clairs pour la qualité en écriture créative produisaient des travaux plus variés et plus ambitieux, pas moins, parce qu'ils comprenaient de quoi ils s'écartaient et vers quoi ils tendaient. Les critères fixent le plancher, pas le plafond. Cette idée reçue reflète généralement des critères rédigés au niveau du format (« inclure une métaphore ») plutôt qu'au niveau de la qualité (« créer une image qui fait ressentir au lecteur le contraste entre les deux idées ») — il s'agit d'un problème de rédaction, non d'un problème conceptuel sur les critères eux-mêmes.

Lien avec l'apprentissage actif

Les critères de réussite ne sont pas simplement un outil d'évaluation ; ils sont un prérequis à un apprentissage actif significatif. Les élèves ne peuvent pas s'engager dans une auto-évaluation productive, une rétroaction entre pairs ou une réflexion métacognitive sans une représentation partagée et explicite de la qualité. Dès que les critères sont visibles, les élèves peuvent effectuer un travail cognitif qui relevait auparavant uniquement de l'enseignant.

Dans la pratique de l'évaluation formative, les critères de réussite ancrent toutes les grandes stratégies. Les billets de sortie ne sont significatifs que s'ils sont rattachés à des critères que les élèves peuvent s'auto-évaluer. La rétroaction entre pairs devient substantielle lorsque les deux parties partagent un langage commun pour la qualité. L'autorégulation — la capacité à surveiller, évaluer et ajuster son propre travail — repose sur un modèle intériorisé de ce qu'est le « bien », que les critères contribuent à construire au fil du temps.

Le lien avec des méthodologies d'apprentissage actif spécifiques est direct. Dans le think-pair-share, inviter les élèves à d'abord s'auto-évaluer par rapport aux critères avant de partager concentre la discussion en binôme sur des lacunes substantielles plutôt que sur des confusions procédurales. Dans l'apprentissage par projets, des critères de réussite co-construits au lancement du projet établissent des standards partagés que les équipes d'élèves peuvent utiliser pour évaluer leurs prototypes et ébauches tout au long du cycle d'investigation. Dans le séminaire socratique, des critères de discussion (par exemple, « s'appuie sur le propos d'un intervenant précédent », « s'appuie sur une preuve tirée du texte ») rendent visibles et auto-évaluables les standards comportementaux du discours académique de qualité pour les élèves qui ne maîtrisent pas encore ce registre.

La relation entre les critères de réussite et les objectifs d'apprentissage est architecturale : les objectifs définissent l'apprentissage visé ; les critères définissent ses preuves. Ensemble, ils constituent ce qu'Hattie appelle l'élément « visible » de l'apprentissage visible — une classe où l'enseignant comme l'élève peuvent exprimer où se dirige l'apprentissage et à quoi il ressemblera lorsqu'il sera accompli.

Sources

  1. Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. Phi Delta Kappan, 80(2), 139–148.

  2. Clarke, S. (2005). Formative Assessment in Action: Weaving the Elements Together. Hodder Murray.

  3. Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81–112.

  4. Chappuis, J. (2009). Seven Strategies of Assessment for Learning. Educational Testing Service.