Définition

L'évaluation formative désigne toute activité d'évaluation menée au cours du processus d'apprentissage, avec pour objectif explicite d'informer l'enseignement et d'améliorer les apprentissages des élèves avant leur terme. Ce n'est ni un test ni une note — c'est une conversation continue entre l'enseignant et l'apprenant sur l'état des apprentissages et la direction à prendre.

La définition de référence est celle de Paul Black et Dylan Wiliam, formulée dans leur synthèse de 1998 : une évaluation est formative lorsque les preuves de l'apprentissage des élèves sont recueillies, interprétées et utilisées pour prendre des décisions sur les prochaines étapes de l'enseignement. Trois acteurs participent à cette boucle de rétroaction — l'enseignant, les pairs et l'apprenant — et chacun peut en être l'initiateur. Un enseignant qui parcourt les billets de sortie à la porte, deux élèves qui comparent leur raisonnement lors d'un think-pair-share, ou un apprenant qui confronte son brouillon à une liste de critères de réussite : tous pratiquent l'évaluation formative.

Le mot « formative » traduit une logique temporelle : cette évaluation forme l'apprenant pendant que la formation est encore possible. À l'inverse, l'évaluation sommative mesure ce qu'un apprenant a acquis une fois l'enseignement terminé. Les deux répondent à des besoins essentiels, mais les confondre — noter les travaux formatifs ou traiter les résultats sommatifs comme un retour d'information actionnable — affaiblit les deux.

Contexte historique

Les fondements intellectuels de l'évaluation formative s'enracinent dans plusieurs décennies de recherche cognitive et pédagogique, bien avant que le terme lui-même ne se répande.

Les travaux de Benjamin Bloom sur la pédagogie de la maîtrise (1969) ont introduit l'idée centrale : si les élèves reçoivent un retour d'information correctif à intervalles réguliers pendant l'enseignement, les résultats s'améliorent substantiellement. Bloom a observé que le tutorat individuel produisait des résultats supérieurs de deux écarts-types à l'enseignement collectif conventionnel. Il attribuait cet écart en grande partie à la surveillance constante du tuteur et à ses ajustements en temps réel. L'évaluation formative était, dans la conception de Bloom, une approximation en classe de la boucle de rétroaction du tuteur.

Michael Scriven a forgé l'expression « évaluation formative » en 1967, à l'origine appliquée au développement curriculaire plutôt qu'à l'évaluation des élèves. Lee Cronbach a étendu le concept à l'apprentissage des élèves peu après. Mais c'est le travail de Paul Black et Dylan Wiliam au King's College de Londres en 1998 qui a fait de l'évaluation formative une priorité de recherche pour la pratique en classe. Leur article de synthèse « Inside the Black Box », publié dans le Phi Delta Kappan, a analysé 250 études et relevé des tailles d'effet comprises entre 0,4 et 0,7 — suffisantes pour faire progresser un élève moyen du 50e au 70e percentile environ. L'ampleur et l'accessibilité de cette recension en ont fait l'un des articles les plus cités en sciences de l'éducation.

Wiliam a poursuivi le développement du cadre au sein de l'Assessment Reform Group au Royaume-Uni, et son ouvrage de 2011 Embedded Formative Assessment a traduit la recherche en routines structurées que les praticiens pouvaient adopter sans refonte complète du curriculum. Les travaux parallèles de John Hattie, dont la méta-analyse de 2009 Visible Learning agrège les résultats de 800 méta-analyses, ont confirmé indépendamment la primauté du retour d'information — il figure parmi les influences les plus puissantes sur la réussite dans sa synthèse.

Principes fondamentaux

La boucle de rétroaction se ferme

L'évaluation formative ne fonctionne que si les preuves de l'apprentissage modifient effectivement ce qui se passe ensuite. Collecter des données et les classer sans y donner suite, c'est surveiller, pas évaluer de façon formative. Ce qui la caractérise, c'est que l'information boucle vers l'enseignement : l'enseignant reprend un concept difficile, accélère sur du contenu déjà maîtrisé, ou repense une tâche qui n'a pas généré la réflexion attendue. Si la boucle ne se ferme pas, l'évaluation n'était pas formative — quel que soit l'outil utilisé.

Le retour d'information cible l'écart

Un retour d'information formatif efficace identifie l'écart entre la compréhension actuelle de l'élève et l'objectif d'apprentissage, puis fournit les informations permettant de le combler. C'est le cadre articulé par Sadler (1989) et systématisé par le modèle de feedback de Hattie et Timperley (2007). Un retour qui se contente de signaler qu'une réponse est erronée donne un verdict sans direction. Un retour qui nomme ce que l'élève a fait, ce que l'objectif exige, et à quoi ressemble une prochaine étape concrète lui donne prise sur son apprentissage.

Les objectifs d'apprentissage doivent être transparents

Les élèves ne peuvent pas s'autoévaluer, répondre aux retours d'information ou apprendre de leurs pairs s'ils ignorent ce vers quoi ils tendent. L'évaluation formative repose sur des objectifs d'apprentissage clairs, précis et accessibles aux élèves. Lorsque les enseignants partagent non seulement la tâche mais aussi les critères de réussite — et aident les élèves à intérioriser ce que « atteindre le niveau attendu » signifie concrètement, à travers des exemples travaillés ou des productions de référence — le retour d'information formatif devient actionnable plutôt que désorientant.

L'évaluation par les pairs et l'autoévaluation étendent la rétroaction

Aucun enseignant ne peut générer un retour d'information significatif et individualisé pour chaque élève sur chaque tâche. L'évaluation par les pairs et l'autoévaluation démultiplient le système de rétroaction sans alourdir la charge de l'enseignant, et présentent leurs propres bénéfices pédagogiques. Lorsque les élèves évaluent le travail d'un pair à partir de critères partagés, ils exercent la pensée analytique que l'objectif d'apprentissage requiert. Lorsqu'ils évaluent honnêtement leur propre travail, ils développent la conscience métacognitive qui prédit la réussite académique à long terme (Zimmerman, 2002).

Les faibles enjeux protègent l'honnêteté des preuves

Si les élèves pensent que leurs réponses formatives seront notées, ils performent plutôt qu'ils ne révèlent. Les notes attachées aux travaux formatifs étouffent les erreurs honnêtes qui sont les plus utiles à un enseignant souhaitant ajuster son enseignement. La recherche montre de manière constante que supprimer les notes des activités formatives — et expliquer clairement aux élèves que les erreurs sont attendues et utiles — améliore à la fois la qualité des preuves recueillies et la disposition des élèves à prendre des risques intellectuels (Butler, 1988).

Application en classe

École primaire : le feu de signalisation

Une enseignante de CE2 introduit une nouvelle stratégie de multiplication. À une pause naturelle dans la leçon, elle demande aux élèves de lever une carte rouge, jaune ou verte (ou de montrer des doigts) : vert signifie « j'ai compris », jaune « je ne suis pas sûr », rouge « je suis perdu ». Elle parcourt la salle du regard en quelques secondes. Elle réunit les élèves à la carte rouge en petit groupe pour une modélisation supplémentaire, pendant que les élèves à la carte verte travaillent sur une activité d'approfondissement. Les élèves à la carte jaune se mettent en binôme pour comparer leurs approches. L'enseignante a différencié son enseignement en moins d'une minute, à partir de preuves concrètes plutôt que d'intuitions.

Secondaire : la galerie de tableaux blancs pour la cartographie d'arguments

Un enseignant d'anglais de troisième demande aux élèves d'écrire leur thèse sur des mini-tableaux blancs et de les lever simultanément. Il parcourt la rangée et constate immédiatement qu'environ un tiers de la classe a écrit des phrases thématiques plutôt que des affirmations argumentables. Plutôt que de corriger chaque copie, il sélectionne trois exemples anonymes — un solide, un partiel, un insuffisant — et conduit une brève analyse collective. Les élèves révisent leurs tableaux blancs. L'enseignant a collecté des preuves auprès de chaque élève et réorienté l'enseignement sans aucune notation.

Enseignement supérieur et formation professionnelle : la fiche d'une minute

Un formateur en formation d'enseignants s'arrête quinze minutes avant la fin de l'atelier et pose deux questions : « Quelle est la chose la plus importante que vous avez apprise aujourd'hui ? » et « Quelle question vous reste-t-il encore ? » Les participants écrivent pendant deux minutes et remettent leurs fiches. Le formateur les lit le soir même et ouvre la session suivante en traitant les trois questions les plus fréquentes. Les participants comprennent que leur confusion est anticipée et valorisée ; le formateur sait où reprendre la prochaine fois.

Les billets de sortie constituent l'une des mises en œuvre les plus pratiques de ce principe, tous niveaux confondus — une invitation structurée en fin de séance qui génère des preuves actionnables en moins de cinq minutes.

Preuves de la recherche

La revue de Black et Wiliam de 1998 a établi la base de preuves fondamentale. En synthétisant environ 250 études, ils ont constaté que l'évaluation formative bien mise en œuvre produisait des tailles d'effet comprises entre 0,4 et 0,7, avec les effets les plus marqués observés chez les élèves en difficulté. C'est notable : l'évaluation formative n'est pas une stratégie qui bénéficie avant tout aux apprenants déjà performants. Les mécanismes identifiés incluaient des objectifs d'apprentissage plus clairs, un retour d'information plus riche et une plus grande appropriation de l'apprentissage par les élèves.

L'article de Hattie et Timperley de 2007, « The Power of Feedback », publié dans la Review of Educational Research, a méta-analysé 196 études portant sur 6 972 tailles d'effet et trouvé une taille d'effet moyenne de 0,79 pour le retour d'information — l'une des influences pédagogiques les plus puissantes de toute la synthèse. De manière cruciale, ils ont constaté que le retour adressé à la personne (« tu es un bon élève ») était largement inefficace. C'est le retour adressé à la tâche, au processus et aux stratégies d'autorégulation de l'apprenant qui produisait les gains les plus importants.

Kingsley et Grabner-Hagen (2015) ont examiné les outils d'évaluation formative numérique dans les classes K-12 et ont constaté que le retour d'information immédiat, rendu possible par les systèmes de réponse en classe, produisait de meilleurs résultats d'apprentissage que le retour écrit différé, lorsque les élèves bénéficiaient d'un accompagnement suffisant pour agir sur ce qu'ils recevaient. La rapidité du retour importe, mais uniquement associée à la clarté.

La méta-analyse de Kingston et Nash de 2011, publiée dans Educational Measurement: Issues and Practice, mérite d'être mentionnée pour son honnêteté intellectuelle : elle a trouvé des tailles d'effet plus modestes (environ 0,20) que la synthèse de Black et Wiliam. Kingston et Nash ont attribué la différence à la qualité des études et à la fidélité de mise en œuvre. Une évaluation formative appliquée de manière approximative produit des résultats approximatifs. La recherche soutient la pratique, mais pas sans esprit critique — l'exécution compte.

Idées reçues courantes

L'évaluation formative, c'est multiplier les interrogations. Les interrogations à faibles enjeux peuvent servir des finalités formatives, mais l'évaluation formative se définit par ce que l'on fait des preuves, pas par le format de l'outil. Un enseignant qui donne une interrogation de cinq questions puis poursuit avec la leçon suivante sans tenir compte des résultats a conduit une interrogation, pas une évaluation formative. À l'inverse, une discussion riche en classe où l'enseignant écoute attentivement et réoriente la séance en fonction de ce que disent les élèves est hautement formative — sans la moindre interrogation.

L'évaluation formative est uniquement l'affaire de l'enseignant. Cette idée reçue réduit l'évaluation formative à une tâche de surveillance exercée sur les élèves, plutôt qu'à un processus collaboratif les impliquant. Lorsque les élèves apprennent à évaluer leur propre compréhension, à se fixer des objectifs d'apprentissage et à formuler un retour d'information utile à leurs pairs, ils deviennent des acteurs actifs de leur propre progression. L'évaluation par les pairs génère notamment un retour d'information à un volume et une fréquence qu'aucun enseignant seul ne peut égaler, et l'acte d'évaluer le travail d'autrui approfondit la compréhension de celui qui évalue.

Les résultats de l'évaluation formative doivent figurer dans le carnet de notes. Noter les travaux formatifs confond leur finalité diagnostique avec la finalité évaluative de l'évaluation sommative. Lorsque les élèves savent que chaque réponse sera notée, ils protègent leur moyenne plutôt qu'ils ne révèlent leur pensée. Les preuves formatives les plus utiles proviennent souvent de compréhensions incomplètes, de fausses pistes et d'idées à moitié formulées — précisément ce que les notes sanctionnent. Maintenir des registres formatifs et sommatifs séparés protège la sécurité psychologique que des preuves formatives honnêtes requièrent.

Lien avec l'apprentissage actif

L'évaluation formative et l'apprentissage actif se renforcent mutuellement : l'apprentissage actif génère des preuves observables de la pensée, et l'évaluation formative donne aux enseignants et aux élèves un mécanisme pour utiliser ces preuves. Sans retour d'information formatif, l'apprentissage actif peut être engageant mais sans direction ; sans structures d'apprentissage actif, l'évaluation formative manque des preuves riches dont elle a besoin pour être utile.

Le think-pair-share est l'un des vecteurs d'évaluation formative les plus puissants d'usage courant. Lorsque les élèves se mettent en binôme pour discuter d'une question avant de partager avec la classe, l'enseignant circule et écoute — collectant en temps réel des preuves de ce que les élèves comprennent, de ce qu'ils confondent et de ce qu'ils trouvent genuinement difficile. La phase de partage révèle quelles idées sont répandues et lesquelles sont idiosyncrasiques. L'enseignant peut ajuster son enseignement sur le vif en fonction de ce que les binômes ont fait émerger.

La gallery walk transforme les preuves formatives en un artefact physique que la classe peut examiner collectivement. Lorsque les groupes affichent leurs travaux aux murs et en font le tour, l'enseignant et les élèves peuvent voir l'éventail des réponses dans la classe. L'enseignant obtient rapidement des données d'évaluation sur l'ensemble du groupe ; les élèves calibrent leur propre compréhension par rapport à celle de leurs pairs. Les annotations que les élèves ajoutent lors du parcours sont elles-mêmes des preuves formatives.

Le chalk talk, le protocole d'écriture collaborative silencieuse, génère une trace visible de la pensée des élèves sans les pressions sociales de la discussion orale. Les élèves écrivent des questions et des réponses directement sur du papier partagé ou un tableau blanc. L'enseignant peut photographier les échanges et les analyser comme données formatives, tandis que les élèves voient où la pensée de leurs pairs converge ou diverge de la leur.

Le concept d'évaluation pour l'apprentissage offre le cadre philosophique plus large qui unit ces pratiques. Là où l'évaluation formative nomme la pratique technique, l'évaluation pour l'apprentissage nomme l'orientation : une évaluation utilisée non pour trier ou certifier, mais pour soutenir l'apprenant dans sa progression.

Sources

  1. Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. Phi Delta Kappan, 80(2), 139–148.
  2. Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81–112.
  3. Wiliam, D. (2011). Embedded Formative Assessment. Solution Tree Press.
  4. Sadler, D. R. (1989). Formative assessment and the design of instructional systems. Instructional Science, 18(2), 119–144.