Définition
La notation par compétences (en anglais standards-based grading, ou SBG) est un système d'évaluation et de communication des résultats dans lequel les notes reflètent la maîtrise démontrée sur des standards d'apprentissage spécifiques, plutôt qu'un agrégat de scores, d'efforts, de participation et de comportements accumulés sur une période d'évaluation. Chaque score reporté répond à une seule question : dans quelle mesure cet élève a-t-il maîtrisé cette compétence ou ce concept particulier ?
Dans un système de notation traditionnel, un « B+ » peut signifier qu'un élève a brillé aux examens mais a oublié de rendre ses devoirs, qu'il a peiné sur les nouvelles notions mais a gagné des points bonus sur des projets, ou encore qu'il était présent à tous les cours et a bénéficié du doute. La lettre de note ne peut distinguer ces situations. La notation par compétences élimine cette ambiguïté en séparant la maîtrise académique des attentes comportementales, et en rendant compte de chaque standard indépendamment. Un élève peut obtenir 4 sur 4 pour « analyser des sources primaires » et 2 sur 4 pour « construire des arguments étayés par des preuves » — deux informations distinctes qui indiquent directement les prochaines étapes pédagogiques.
Le système repose sur une échelle de maîtrise dont chaque niveau est précisément défini. La plupart des mises en oeuvre utilisent une échelle à 4 points, mais les échelles à 3 points et les systèmes à labels (Avancé, Compétent, En développement, Débutant) sont également courants. Ce qui importe, c'est que chaque niveau soit ancré dans des preuves observables de la performance de l'élève, non dans un pourcentage ou l'intuition d'un enseignant.
Contexte historique
Les fondements intellectuels de la notation par compétences remontent aux travaux de Benjamin Bloom sur l'apprentissage par maîtrise dans les années 1960 et 1970. Son article fondateur de 1968, « Learning for Mastery », affirmait que presque tous les élèves peuvent atteindre des niveaux élevés d'apprentissage lorsqu'on leur accorde suffisamment de temps et un enseignement adapté, et que les écoles devraient structurer l'évaluation autour de la démonstration de la maîtrise plutôt que du classement sur une courbe en cloche. Ses recherches, menées à l'Université de Chicago, ont montré que les élèves bénéficiant d'un enseignement orienté vers la maîtrise surpassaient leurs pairs enseignés de manière traditionnelle d'environ deux écarts-types — une découverte que Robert Marzano a décrite comme l'une des tailles d'effet les plus significatives dans la recherche en éducation.
Le mouvement des standards éducatifs des années 1990 a offert aux idées de Bloom un nouveau cadre institutionnel. La publication de standards nationaux et régionaux a créé des cibles d'apprentissage explicites et publiques, rendant possible de rapporter les notes par rapport à ces cibles plutôt que par rapport aux moyennes de classe. Ken O'Connor, dont le livre de 2002 How to Grade for Learning est devenu un texte fondateur pour les praticiens, a démontré de façon systématique que les pratiques de notation traditionnelles étaient remplies de contradictions qui minaient la validité des notes en tant que mesures de l'apprentissage.
Robert Marzano et ses collègues du Marzano Research Laboratory ont développé et affiné l'échelle de maîtrise à 4 points tout au long des années 2000 et 2010, articulant un cadre cohérent pour traduire les standards en objectifs évaluables. Le livre de Marzano de 2010, Formative Assessment and Standards-Based Grading, a fourni à la fois les fondements théoriques et les outils pratiques que de nombreux établissements ont adoptés en bloc. Rick Wormeli, dont le livre de 2006 Fair Isn't Always Equal a popularisé le cas des réévaluations et du reporting aligné sur les standards, a porté l'argument auprès d'un public plus large d'enseignants en classe.
Au début des années 2010, la SBG était passée de la littérature de recherche à la politique de district dans des États comme l'Oregon, le New Hampshire et le Maine, qui sont devenus des précurseurs des exigences de diplomation basées sur la maîtrise. Le mouvement continue de croître, particulièrement dans les écoles primaires et les collèges, où les réformateurs soutiennent que les jeunes élèves sont particulièrement pénalisés par des notes qui obscurcissent plutôt qu'éclairent leur apprentissage réel.
Principes clés
Les notes reflètent la maîtrise, pas les moyennes
L'engagement fondamental de la notation par compétences est qu'un score reporté représente le niveau actuel de maîtrise d'un élève sur un standard précis. Ce principe exclut des pratiques courantes dans la notation traditionnelle : moyenner les premiers échecs avec les réussites ultérieures, pénaliser le travail rendu en retard en réduisant le score académique, ou inclure la remise des devoirs dans un score censé mesurer la compréhension en lecture.
Quand un élève est en difficulté en septembre et démontre la maîtrise en novembre, la note reflète la maîtrise de novembre. Les données de septembre sont utiles pour la planification pédagogique, mais elles ne pénalisent pas le dossier académique final de l'élève. Ce n'est pas de l'inflation des notes ; c'est une mesure précise de ce que l'élève sait et sait faire maintenant.
Les standards sont désagrégés
Plutôt qu'une seule note d'unité ou de semestre, la SBG produit plusieurs scores — un par standard ou objectif d'apprentissage évalué. Une seule unité en sciences de cinquième pourrait générer des scores distincts pour « identifier les variables dans une expérience », « formuler une hypothèse testable » et « analyser des données pour tirer des conclusions ». Chaque score est indépendamment utile. Les parents et les élèves peuvent voir exactement où l'apprentissage est solide et où il nécessite un soutien, plutôt que d'essayer de décrypter un 78% unique.
Cette désagrégation exige une conception d'évaluation plus délibérée. Les enseignants doivent associer chaque tâche d'évaluation à des standards précis, et le feedback doit être spécifique à chaque standard plutôt que global. Les rubriques sont l'outil principal pour rendre cette connexion explicite, chaque critère étant directement lié à un standard et chaque niveau de performance décrit en termes de preuves plutôt qu'en adjectifs de qualité.
La réévaluation est intégrée au système
Si les notes mesurent la maîtrise et que l'apprentissage prend des durées variables, alors la réévaluation est une nécessité logique, non une faveur. Les systèmes SBG permettent généralement aux élèves de se réévaluer sur n'importe quel standard après une étude ou une pratique supplémentaire, le score le plus récent ou le plus élevé remplaçant les scores antérieurs. Cette conception envoie un message clair : l'objectif est l'apprentissage, et le temps est une variable, non un mécanisme de tri.
Les critiques s'inquiètent parfois que la réévaluation nuise à la rigueur académique ou que les élèves ne travailleront pas la première fois s'ils savent qu'une reprise est possible. La recherche ne confirme pas cette crainte. Une étude de 2019 par Townsley et Varga dans le Journal of Educational Research and Practice a constaté que les politiques de réévaluation dans les écoles SBG étaient associées à une motivation et une persévérance accrues des élèves, et non à des standards académiques plus faibles.
Les notes comportementales et académiques sont séparées
L'effort, la participation, l'assiduité et la remise des devoirs constituent des informations précieuses sur un élève, mais ce ne sont pas des mesures de la maîtrise académique. Les systèmes SBG reportent ces dimensions séparément, souvent sous forme de scores « habitudes d'apprentissage » ou « habitudes de travail », plutôt que de les intégrer dans les notes académiques. Un élève qui travaille dur mais n'a pas encore maîtrisé le standard reçoit un score académique faible et un score d'effort élevé — deux informations honnêtes plutôt qu'une note moyenne qui déformerait les deux.
Cette séparation est l'un des aspects les plus difficiles de l'adoption de la SBG pour les enseignants expérimentés, dont beaucoup estiment que récompenser l'effort dans les notes apprend aux élèves la valeur de la persévérance. L'argument contraire est qu'un feedback honnête et spécifique enseigne la persévérance plus efficacement que des notes gonflées, car les élèves peuvent voir exactement ce qu'ils doivent améliorer plutôt que de simplement recevoir un chiffre pour se sentir bien.
Application en classe
École primaire : rapport sur la maîtrise de la lecture
Un enseignant de CE2 utilisant la SBG pourrait suivre six standards de lecture sur une unité : la phonologie, la fluidité, l'acquisition du vocabulaire, l'identification de l'idée principale, la formulation d'inférences et la structure des textes. À chaque période de reporting, les parents reçoivent un score de maîtrise sur chaque standard plutôt qu'une seule note de lecture. Un élève qui obtient 4 en phonologie et fluidité mais 2 en inférence bénéficie d'un soutien ciblé sur les compétences de lecture de haut niveau, tout en recevant des défis appropriés pour le travail sur les mots. Les décisions pédagogiques de l'enseignant sont guidées par les données désagrégées, et non par une moyenne qui masquerait à la fois la force et la lacune.
Collège : conception de l'évaluation en sciences
Un professeur de sciences de cinquième conçoit une unité sur les écosystèmes avec quatre objectifs d'apprentissage tirés directement des programmes officiels. Chaque tâche d'évaluation est associée à un ou plusieurs objectifs, et la rubrique utilise l'échelle à 4 points avec des descripteurs spécifiques à chaque standard. Lorsqu'un élève remet un rapport de laboratoire qui démontre une collecte de données solide (score : 4) mais une analyse faible (score : 2), l'enseignant fournit un feedback écrit spécifique au standard et planifie une réévaluation de l'objectif d'analyse après une séance de remédiation en petit groupe. Le score de réévaluation remplace le précédent, et la note de l'élève s'améliore pour refléter l'apprentissage réel.
Lycée : conversion en GPA pour les bulletins
Un département de lettres de lycée qui adopte la SBG doit traiter directement la question des bulletins. La plupart des départements créent une table de conversion : 4,0 = A, 3,5 = B+, 3,0 = B, 2,5 = C+, 2,0 = C. La conversion est appliquée en fin de semestre pour générer la note compatible GPA qui apparaît sur les bulletins, tandis que le rapport de maîtrise standard par standard est partagé avec les élèves et les familles tout au long du trimestre. Ce double reporting satisfait aux exigences des candidatures universitaires tout en préservant les bénéfices pédagogiques du feedback par compétences pendant le processus d'apprentissage.
Preuves de recherche
Les données probantes pour la notation par compétences s'appuient à la fois sur les recherches fondamentales sur l'apprentissage par maîtrise et sur des études d'implémentation plus récentes.
Les recherches originales de Bloom sur l'apprentissage par maîtrise (1968, 1984) ont fourni le fondement conceptuel, montrant que lorsque les élèves recevaient un feedback critérié et du temps pour atteindre la maîtrise, les distributions de résultats se déplaçaient considérablement vers le haut. Une méta-analyse de 1990 par Guskey et Pigott dans la Review of Educational Research, couvrant 46 études de programmes d'apprentissage par maîtrise, a trouvé une taille d'effet médiane de 0,54 pour la réussite des élèves, avec des effets plus importants pour les élèves les moins performants. C'est cette lignée de recherche que les praticiens de la SBG invoquent lorsqu'ils affirment que l'évaluation alignée sur les standards et orientée vers la maîtrise réduit les écarts de réussite.
Des études plus récentes examinent spécifiquement la mise en oeuvre de la SBG. Une étude de 2016 par Schiffman dans le Journal of Educational Research a analysé le déploiement sur trois ans de la SBG dans un district K-12 et a constaté des améliorations significatives de l'auto-efficacité et de l'engagement des élèves, parallèlement à une réduction de la proportion d'élèves obtenant des notes insuffisantes. L'étude a noté que les effets étaient les plus forts lorsque la mise en oeuvre s'accompagnait d'un développement professionnel sur les pratiques d'évaluation formative.
La revue de littérature de Townsley de 2018 dans le NASSP Bulletin, examinant 12 études évaluées par des pairs sur la SBG, a trouvé des preuves cohérentes que la SBG augmente la motivation des élèves et réduit l'anxiété liée aux notes, mais a noté que la plupart des études reposent sur des auto-évaluations des enseignants et des élèves plutôt que sur des mesures de résultats contrôlées. Il a conclu que les preuves sont prometteuses, mais que des recherches expérimentales rigoureuses sur les résultats d'apprentissage à long terme restent insuffisantes — une limite honnête que les praticiens doivent connaître : les preuves théoriques et qualitatives pour la SBG sont solides ; les preuves expérimentales causales sur les gains académiques à long terme sont encore en développement.
Les données d'implémentation à grande échelle de Marzano et ses collègues, issues de plus de 300 écoles et rapportées dans Formative Assessment and Standards-Based Grading (2010), ont montré des corrélations constantes entre les pratiques de notation alignées sur les standards et la réussite des élèves aux évaluations standardisées, bien que ces travaux présentent les limites méthodologiques typiques de la recherche praticienne.
Idées reçues fréquentes
La SBG signifie que les élèves peuvent toujours repasser sans conséquences
L'idée reçue la plus persistante est que la SBG élimine toute responsabilité en permettant des reprises illimitées sans condition. Les systèmes SBG bien mis en oeuvre permettent effectivement la réévaluation, mais ils exigent des élèves qu'ils démontrent un apprentissage supplémentaire avant de repasser, pas qu'ils se représentent simplement au même test. Un élève qui souhaite se réévaluer sur un standard d'écriture pourrait être amené à soumettre une révision avec une auto-évaluation, à réaliser des exercices d'entraînement supplémentaires, ou à rencontrer l'enseignant pour discuter de la lacune. La reprise se mérite ; elle n'est pas automatique. Les conséquences pour le comportement académique, comme ne pas avoir rendu le travail, sont suivies séparément comme scores d'habitudes de travail.
Un 4 équivaut à un A
Un 4 sur une échelle de maîtrise à 4 points n'est pas équivalent à 100% sur une échelle traditionnelle. Un 4 signifie « dépasse le standard » — l'élève démontre la maîtrise du standard central et applique cette connaissance de manière plus complexe, étendue ou transférable. Un 3 signifie « atteint pleinement le standard » et constitue l'objectif pour tous les élèves. Lorsque les parents apprennent qu'un 3 est l'objectif et que la plupart des élèves n'obtiendront pas régulièrement des 4, ils interprètent parfois cela comme des attentes abaissées. C'est le contraire : un 3 exige une maîtrise authentique du standard tel qu'il est formulé, et non 70% des points possibles.
La SBG fonctionne sans modifier l'enseignement
Certains établissements adoptent la SBG comme une réforme de la politique de notation sans repenser la structure de l'enseignement. Cela produit le pire des deux mondes : les enseignants continuent d'enseigner des unités en séquence linéaire avec des échéances fixes, mais doivent maintenant convertir les scores en échelle de maîtrise à la fin. Une SBG efficace exige des changements alignés dans la façon dont les enseignants structurent le temps, séquencent l'enseignement et utilisent les données d'évaluation formative pour informer les prochaines étapes. Sans ces changements pédagogiques, l'échelle de maîtrise est superficielle. Le système de notation et le système d'enseignement doivent être conçus ensemble.
Lien avec l'apprentissage actif
La notation par compétences et les méthodologies d'apprentissage actif partagent un engagement commun envers l'apprentissage comme objectif de l'école, et non la performance sur des tâches isolées. Lorsque les élèves connaissent les standards précis vers lesquels ils travaillent, ils peuvent s'auto-évaluer, fixer des objectifs d'apprentissage et orienter leur propre pratique — le travail cognitif et métacognitif que les méthodologies d'apprentissage actif sont conçues pour cultiver.
L'évaluation formative est le partenaire opérationnel quotidien de la SBG. Les billets de sortie, le feedback par les pairs, le débriefing en binômes et les vérifications rapides de la compréhension génèrent tous les preuves spécifiques aux standards dont les enseignants ont besoin pour ajuster leur enseignement avant l'évaluation sommative. La SBG donne à ces données formatives leur raison d'être : les enseignants les collectent pour ajuster l'enseignement, les élèves les utilisent pour identifier leurs prochaines étapes, et aucun des deux n'a besoin d'attendre un résultat d'examen pour savoir où en est l'apprentissage.
Les rubriques sont le lien structurel entre la SBG et l'apprentissage actif. Lorsque les rubriques décrivent les niveaux de performance en termes de critères observables liés à des standards précis, les élèves peuvent les utiliser pendant le processus d'apprentissage, pas seulement à la fin. L'évaluation par les pairs à l'aide de rubriques alignées sur les standards, courante dans l'apprentissage par projets et les unités basées sur l'investigation, développe exactement la conscience métacognitive que le transfert d'apprentissage exige. Les élèves qui analysent régulièrement leur propre travail par rapport à une échelle de maîtrise développent l'habitude d'auto-surveillance que les apprenants expérimentés utilisent automatiquement.
La progression par maîtrise — dans laquelle les élèves avancent lorsqu'ils démontrent la maîtrise plutôt que lorsque le calendrier indique que l'unité est terminée — s'inscrit naturellement dans la structure de réévaluation de la SBG. Dans une classe inversée, où l'enseignement direct est déplacé hors du temps de classe et où ce dernier est consacré à la pratique et à l'application, les données SBG informent la façon dont ce temps en classe est alloué : les élèves au niveau 2 sur un standard bénéficient d'un enseignement ciblé en petit groupe, les élèves au niveau 4 s'attaquent à des problèmes d'extension, et l'enseignant agit comme un coach répondant à des preuves en temps réel plutôt que de dérouler une séquence préétablie indépendamment de la position des élèves.
Sources
-
Bloom, B. S. (1968). Learning for mastery. Evaluation Comment, 1(2), 1–12. UCLA Center for the Study of Evaluation.
-
Guskey, T. R., & Pigott, T. D. (1990). Research on group-based mastery learning programs: A meta-analysis. Journal of Educational Research, 81(4), 197–216.
-
Marzano, R. J. (2010). Formative Assessment and Standards-Based Grading. Marzano Research Laboratory.
-
O'Connor, K. (2002). How to Grade for Learning: Linking Grades to Standards. Corwin Press.