Définition
L'évaluation par les pairs est une pratique éducative structurée dans laquelle les élèves évaluent le travail, la performance ou la compréhension de leurs camarades à partir de critères prédéfinis. L'élève évaluateur produit des commentaires écrits, des notations, ou les deux, et l'élève évalué utilise cette rétroaction pour réviser ou réfléchir. Contrairement à une rétroaction informelle entre pairs — « ça me semble bien » — l'évaluation par les pairs structurée exige des critères explicites, un processus défini et généralement une forme de responsabilisation.
Le concept s'inscrit dans le domaine plus large de l'évaluation formative : une évaluation dont la fonction première est d'améliorer l'apprentissage plutôt que de le mesurer en vue d'une note. Keith Topping, dont la méta-analyse de 1998 à l'Université de Dundee demeure la revue de référence du domaine, a défini l'évaluation par les pairs comme « un dispositif permettant aux apprenants d'examiner et de déterminer le niveau, la valeur ou la qualité du produit ou de la performance d'autres apprenants de statut égal ». Cette définition met en lumière deux caractéristiques essentielles : le jugement évaluatif qu'elle implique, et l'égalité de statut social entre évaluateur et évalué.
L'évaluation par les pairs se distingue de l'auto-évaluation, dans laquelle les élèves évaluent leur propre travail, bien que les deux pratiques soient souvent associées. Elle se distingue également de l'apprentissage coopératif, qui structure l'interdépendance au sein d'un groupe pour créer un produit commun. L'évaluation par les pairs peut avoir lieu dans des structures coopératives, mais elle fonctionne comme un acte réflexif à part entière — et non comme une simple composante du travail de groupe.
Contexte historique
Les racines intellectuelles de l'évaluation par les pairs remontent aux années 1960 et 1970, lorsque les psychologues cognitifs ont commencé à remettre en question le modèle passif d'apprentissage qui dominait les écoles. Le modèle d'apprentissage par maîtrise de Bloom (1968) a établi que la rétroaction formative au sein des cycles d'apprentissage était essentielle à la progression des élèves — une prémisse qui faisait de la rétroaction par les pairs un outil naturel.
La pratique a acquis ses premières bases de recherche systématique dans l'enseignement supérieur au cours des années 1980 et 1990. Nancy Falchikov à l'Université Napier fut parmi les premières chercheuses à étudier la notation par les pairs de façon systématique, rapportant en 1986 que les élèves pouvaient produire des notes fiablement proches de celles des enseignants lorsqu'ils étaient formés avec des critères explicites. La revue de Topping en 1998 dans la Review of Educational Research a consolidé les données issues de 109 études, établissant que l'évaluation par les pairs produisait des gains réguliers en termes de réussite scolaire, de conscience métacognitive et de qualité des rétroactions écrites que les élèves pouvaient générer.
La revue phare de Paul Black et Dylan Wiliam en 1998, « Inside the Black Box » (publiée dans le Phi Delta Kappan), a reconfiguré toute la conversation. Leur analyse de 250 études a conclu que les pratiques d'évaluation formative, incluant l'évaluation par les pairs et l'auto-évaluation, produisaient certaines des plus grandes tailles d'effet jamais documentées dans la recherche en éducation, en particulier pour les élèves les moins performants. Leurs travaux ont fait passer l'évaluation par les pairs d'une technique de niche dans l'enseignement supérieur à une pratique courante dans les écoles du monde entier.
David Nicol et Debra Macfarlane-Dick ont enrichi cette base avec un modèle théorique publié en 2006 dans Studies in Higher Education, soutenant que la rétroaction par les pairs est surtout précieuse non parce qu'elle informe le destinataire, mais parce qu'elle développe chez l'évaluateur la capacité à surveiller et réguler son propre apprentissage.
Principes clés
Les critères doivent être explicites avant le début de l'évaluation
L'évaluation par les pairs ne produit une rétroaction fiable et utile que lorsque l'évaluateur et l'évalué comprennent tous deux ce que signifie la qualité avant que l'évaluation ne commence. Des critères présentés uniquement après la remise du travail fonctionnent comme un jugement après coup. Des critères co-construits avec les élèves avant une tâche servent d'échafaudage d'apprentissage tout au long de la production. Des recherches d'Andrade et Du (2005) ont montré que les élèves qui avaient participé à l'élaboration des grilles produisaient un travail nettement meilleur que ceux qui avaient reçu la même grille passivement. L'acte d'articuler la qualité est en lui-même un acte d'apprentissage.
L'évaluateur apprend autant que le destinataire
Un malentendu persistant traite l'évaluation par les pairs comme un mécanisme de transmission de la rétroaction. Les données les plus solides pointent ailleurs : le travail cognitif consistant à appliquer des critères au travail d'autrui oblige l'évaluateur à s'engager activement avec des standards qu'il pourrait autrement survoler. L'analyse de Topping en 1998 a documenté ce bénéfice pour l'évaluateur dans plusieurs matières. Les élèves invités à évaluer un argument doivent d'abord construire une représentation mentale de ce qu'est un argument solide — c'est cette construction qui constitue l'apprentissage.
La formation et les exemples modélisés sont incontournables
Sans préparation, les élèves se rabattent sur des éloges vagues (« bon travail ») ou des critiques abruptes sans explication. Ni l'un ni l'autre n'aide le destinataire. Les programmes efficaces d'évaluation par les pairs consacrent un temps d'enseignement explicite à la littératie de la rétroaction : ce qui rend une rétroaction précise, ce qui la rend actionnable, comment distinguer la description de l'évaluation. La pratique courante consiste à analyser des exemples forts et faibles de rétroaction par les pairs avant que les élèves ne rédigent les leurs.
L'anonymat est un outil, pas une obligation
L'évaluation par les pairs anonyme réduit la pression sociale et le biais d'amitié dans certains contextes, en particulier lorsque des notes sont en jeu. Mais elle supprime aussi la responsabilisation et peut réduire le soin que les élèves apportent à leurs commentaires écrits. De nombreux praticiens expérimentés utilisent la rétroaction par les pairs identifiée pour les travaux formatifs — où la relation entre donneur et receveur de rétroaction peut elle-même devenir une conversation d'apprentissage — et la révision anonyme lorsque les scores contribuent aux notes.
La fréquence importe plus que l'occasion
Une évaluation par les pairs pratiquée une fois par semestre a un effet durable minimal sur la littératie de la rétroaction ou l'autorégulation. Des chercheurs comme Nicol et Macfarlane-Dick (2006) soutiennent que l'objectif est que les élèves intériorisent les standards évaluatifs — un processus qui exige une exposition répétée à travers différentes tâches et matières. Des cycles de révision par les pairs brefs et fréquents, même des échanges structurés de 10 minutes, développent l'habitude plus efficacement que des événements élaborés ponctuels.
Application en classe
École primaire : listes de critères pour les jeunes scripteurs
En CE1 et CE2, l'évaluation par les pairs fonctionne mieux avec des critères concrets et binaires que les élèves peuvent cocher. Après une courte tâche d'écriture, les élèves échangent leurs feuilles et parcourent une liste de contrôle : « Y a-t-il une majuscule au début ? Y a-t-il un point final ? Peux-tu trouver un mot descriptif ? » L'évaluateur entoure ou coche chaque critère. La rétroaction est suffisamment structurée pour être actionnable et suffisamment précise pour être honnête, sans exiger le langage évaluatif nuancé que les jeunes élèves n'ont pas encore développé.
Le rôle de l'enseignant à ce stade est de modéliser le processus à plusieurs reprises avec des exemples collectifs, en nommant ce qu'il observe et pourquoi cela répond ou non au critère. Cette modélisation n'est pas un échafaudage optionnel — c'est l'enseignement effectif de la littératie de la rétroaction.
Collège et lycée : révision structurée par les pairs d'écrits argumentatifs
Une classe de seconde qui rédige des dissertations analytiques en histoire bénéficie d'une structure de révision par les pairs en deux temps. Dans le premier temps, chaque élève lit la dissertation de son partenaire et souligne la thèse et chaque argument. Dans le second temps, il complète un cadre de rétroaction : « Ton argumentation est la plus solide lorsque… Un endroit où l'argument ne soutient pas pleinement ta thèse est… Une révision concrète que je suggérerais est… » Le cadre prévient les rétroactions vagues sans sur-scripter la réponse.
Rendre le travail avec la rétroaction écrite des pairs avant la remise du brouillon final donne aux élèves un objectif de révision concret. Les études comparant des conditions avec et sans rétroaction préalable à la révision montrent systématiquement des gains de qualité dans les brouillons révisés.
Classe entière : visite de galerie avec annotations par les pairs
Une adaptation de la visite de galerie pour l'évaluation par les pairs place les travaux des élèves autour de la salle. Chaque élève circule avec des post-it de deux couleurs : l'un pour les points forts spécifiques (« utilisation convaincante des données dans le panneau 3 »), l'autre pour des questions ou suggestions précises (« quelle est la source de la statistique au paragraphe 2 ? »). Les élèves reviennent vers leur travail avec un ensemble d'annotations de pairs représentant plusieurs perspectives plutôt que le regard d'un seul évaluateur.
Ce format convient particulièrement bien aux travaux visuels et aux projets, où l'exposition elle-même communique quelque chose sur l'organisation et les choix de présentation que le texte seul ne pourrait pas rendre.
Données probantes
La méta-analyse de Topping en 1998 dans la Review of Educational Research a synthétisé 109 études sur l'évaluation par les pairs à travers les niveaux scolaires et les matières. La revue a montré que l'évaluation par les pairs produisait des effets positifs constants sur la réussite scolaire, avec des tailles d'effet comparables à d'autres interventions formatives bien établies. De manière cruciale, Topping a constaté que les tailles d'effet étaient plus importantes lorsque les critères d'évaluation étaient explicites, lorsque les élèves étaient formés au processus, et lorsque l'évaluation par les pairs était intégrée au programme plutôt qu'ajoutée comme activité ponctuelle.
Falchikov et Goldfinch (2000), également dans la Review of Educational Research, ont réalisé une méta-analyse de 48 études comparant les notes attribuées par les pairs à celles des enseignants. Ils ont constaté que l'accord entre notes de pairs et notes d'enseignants était significativement plus fort lorsque l'évaluation portait sur plusieurs critères (plutôt qu'une notation globale unique), lorsque les critères étaient co-construits avec les élèves et lorsque le travail évalué était bien structuré. Ce résultat répond à une préoccupation fréquente : les notes des pairs peuvent être fiables lorsque les conditions sont réunies.
Van Zundert, Sluijsmans et Van Merrienboer (2010), dans Learning and Instruction, ont examiné des recherches axées sur le processus d'évaluation par les pairs et ont trouvé des données solides montrant que la qualité de la rétroaction par les pairs s'améliore lorsque les évaluateurs reçoivent une formation, lorsque les tâches exigent une évaluation spécifique plutôt que globale, et lorsque la rétroaction est liée à des occasions de révision. Les études qui fournissaient une rétroaction sans opportunité de révision montraient des gains d'apprentissage plus faibles ou négligeables.
Une limite mérite d'être soulignée : la majorité des recherches sur l'évaluation par les pairs ont été menées dans des contextes d'enseignement supérieur. La base de données probantes pour l'évaluation structurée par les pairs à l'école primaire est plus mince et plus mitigée. L'adéquation des critères au niveau scolaire — tant en termes de complexité que de dynamiques sociales — exige un jugement pédagogique attentif, et le transfert généraliste des résultats issus de l'université vers les classes primaires n'est pas justifié.
Idées reçues courantes
L'évaluation par les pairs est un substitut permettant à l'enseignant d'économiser du temps. La rétroaction par les pairs n'est pas une version moins coûteuse ou plus rapide de la rétroaction enseignante — c'est un type d'activité d'apprentissage différent. Utilisée comme stratégie de réduction de charge de travail sans formation ni structure, elle produit des rétroactions de faible qualité qui frustrent les élèves et érodent la confiance dans le processus. Sa valeur réside dans le travail cognitif qu'elle génère pour l'évaluateur. Les enseignants qui mettent bien en œuvre l'évaluation par les pairs investissent généralement un temps d'enseignement important en amont pour former les élèves ; le bénéfice est le développement à long terme du jugement évaluatif, et non une réduction de la charge de correction.
Les élèves ne sont pas qualifiés pour évaluer le travail de leurs camarades. Cette préoccupation est compréhensible, mais repose sur une mauvaise lecture de ce que demande l'évaluation par les pairs. On ne demande pas aux évaluateurs pairs de porter des jugements sommatifs sur les capacités d'un camarade — on leur demande d'appliquer des critères explicites à une pièce de travail spécifique. Lorsque les critères sont clairs et les élèves formés, c'est une tâche à leur portée. La méta-analyse de Falchikov et Goldfinch (2000) a démontré des corrélations entre notes de pairs et notes d'enseignants supérieures à 0,80 dans des études bien conçues.
Les relations positives entre pairs gonfleront les notes, les relations négatives les déprimeront. Les effets d'amitié sont réels, mais contextuels et gérables. Les recherches examinées par Topping (1998) ont montré que ces effets étaient les plus forts dans les tâches d'évaluation non structurées et globales, et les plus faibles lorsque plusieurs critères spécifiques exigeaient une justification individuelle. La soumission anonyme réduit la pression sociale dans les contextes à enjeux élevés. Plus important encore, investir dans la culture du retour d'information — construire des normes de classe autour d'une rétroaction honnête et utile comme forme de respect — transforme progressivement le sens social de l'évaluation par les pairs.
Lien avec l'apprentissage actif
L'évaluation par les pairs est par nature un acte d'apprentissage actif. Appliquer des critères, rédiger des justifications écrites et formuler des jugements évaluatifs exigent de l'élaboration, de l'analyse et de la synthèse — les niveaux supérieurs de la taxonomie de Bloom — plutôt que la réception passive des commentaires de l'enseignant.
L'enseignement par les pairs et l'évaluation par les pairs partagent le même mécanisme sous-jacent : tous deux exigent des élèves qu'ils s'engagent avec le contenu ou les critères à un niveau de profondeur que la simple réception ne peut produire. Dans l'enseignement par les pairs, expliquer un concept oblige l'explicateur à identifier et résoudre les lacunes dans sa propre compréhension. Dans l'évaluation par les pairs, évaluer un travail oblige l'évaluateur à construire une représentation interne de la qualité. Les enseignants qui combinent enseignement par les pairs et révision structurée par les pairs créent une boucle de renforcement où les élèves enseignent à la fois le contenu et évaluent la qualité de l'application respective.
Les visites de galerie offrent un cadre naturel pour l'évaluation par les pairs de travaux visuels ou en format exposition. Des protocoles d'annotation structurés — exigeant des commentaires référencés à des critères spécifiques plutôt que des réactions générales — transforment la visite de galerie d'une exposition en un cycle de rétroaction.
Le remue-méninges en carrousel peut être adapté à l'évaluation par les pairs de brouillons écrits ou d'arguments structurés. Les groupes passent en rotation à travers les travaux des uns et des autres, en ajoutant des commentaires précis à chaque station. Le format multi-évaluateurs signifie que chaque travail reçoit des rétroactions diverses, réduisant le poids que porte tout jugement individuel d'un pair.
Le lien avec la rétroaction en éducation est direct : l'évaluation par les pairs est l'un des contextes les plus efficaces pour développer la littératie de la rétroaction, car les élèves doivent générer activement une rétroaction plutôt que la recevoir passivement. La recherche sur la rétroaction montre systématiquement que l'acte de donner une rétroaction détaillée améliore le travail ultérieur de celui qui la donne — un résultat qui renforce l'argument en faveur de l'intégration de l'évaluation par les pairs dans les cycles d'enseignement réguliers, plutôt que de la traiter comme une activité d'enrichissement occasionnelle.
Sources
-
Topping, K.J. (1998). Peer assessment between students in colleges and universities. Review of Educational Research, 68(3), 249–276.
-
Black, P., & Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education: Principles, Policy & Practice, 5(1), 7–74.
-
Falchikov, N., & Goldfinch, J. (2000). Student peer assessment in higher education: A meta-analysis comparing peer and teacher marks. Review of Educational Research, 70(3), 287–322.
-
Nicol, D.J., & Macfarlane-Dick, D. (2006). Formative assessment and self-regulated learning: A model and seven principles of good feedback practice. Studies in Higher Education, 31(2), 199–218.