Définition

L'évaluation diagnostique est une évaluation réalisée avant le début de l'enseignement, dans le but explicite de cartographier ce que les élèves savent déjà, les compréhensions partielles qu'ils possèdent et les conceptions erronées susceptibles d'interférer avec les nouveaux apprentissages. Contrairement à l'évaluation sommative (qui mesure les apprentissages après l'enseignement) ou à l'évaluation formative (qui suit les apprentissages pendant l'enseignement), l'évaluation diagnostique établit une ligne de base. Elle répond à une seule question : où en sont mes élèves en ce moment ?

Le terme est emprunté à la médecine, où le diagnostic précède le traitement. En éducation, la logique est identique. Enseigner un programme fixe sans connaître le point de départ des élèves produit un enseignement inefficace : certains élèves suivent des contenus qu'ils maîtrisent déjà ; d'autres prennent du retard parce que des connaissances préalables ont été supposées plutôt que vérifiées. L'évaluation diagnostique comble l'écart entre ce que les enseignants pensent que les élèves savent et ce qu'ils savent réellement.

David Ausubel (1968) l'a formulé clairement dans Educational Psychology: A Cognitive View : « Le facteur le plus important influençant l'apprentissage est ce que l'apprenant sait déjà. Vérifiez-le et enseignez en conséquence. » Cette phrase reste l'argument le plus concis en faveur de la pratique diagnostique dans la littérature de recherche.

Contexte historique

Le concept formel de diagnostic des apprentissages avant l'enseignement est apparu au milieu du vingtième siècle, en parallèle avec la théorie de la pédagogie de maîtrise. L'article de Benjamin Bloom en 1968, « Learning for Mastery » dans Evaluation Comment, soutenait que la plupart des élèves pouvaient atteindre un niveau élevé de réussite si les enseignants identifiaient les lacunes dans les prérequis avant d'aller de l'avant. Bloom distinguait l'évaluation diagnostique des vérifications formatives (retour d'information en cours d'unité) et de l'évaluation sommative, la positionnant comme le fondement d'une planification pédagogique intentionnelle.

Les travaux d'Ausubel sur les organisateurs avancés, publiés à la même époque, ont renforcé cette vision. Sa théorie de l'assimilation soutenait que les nouvelles connaissances doivent s'ancrer à des structures cognitives existantes. Si ces structures sont absentes ou déformées, l'ancrage échoue. L'évaluation diagnostique rend ces structures visibles avant l'introduction de nouveaux contenus.

Dans les années 1980, des chercheurs étudiant les conceptions erronées en sciences, notamment Rosalind Driver à l'Université de Leeds, ont démontré que les élèves arrivent en classe avec des cadres alternatifs stables et cohérents sur la force, la chaleur et la matière — des cadres qui semblent intuitivement corrects mais entrent en conflit avec la science acceptée. Les travaux de Driver ont montré qu'ignorer ces cadres ne les neutralisait pas ; les élèves conservaient souvent leurs croyances initiales tout en produisant simultanément des réponses correctes aux tests. Faire émerger ces modèles préexistants avant l'enseignement est devenu une nécessité reconnue, et non un simple supplément facultatif.

Le mouvement de l'évaluation pour l'apprentissage, cristallisé par la synthèse de Paul Black et Dylan Wiliam en 1998, « Inside the Black Box » dans Phi Delta Kappan, a inscrit la pratique diagnostique dans un paradigme d'enseignement réactif plus large. La synthèse de Black et Wiliam a établi que l'utilisation des données d'évaluation pour ajuster l'enseignement produisait des tailles d'effet allant de 0,4 à 0,7 écart-type, parmi les rendements les mieux documentés de la recherche en éducation. Bien que leur synthèse portât principalement sur l'évaluation formative continue, ils incluaient explicitement le diagnostic pré-instructionnel comme composante de l'enseignement informé par l'évaluation.

Principes clés

Les connaissances antérieures sont le point de départ de tout nouvel apprentissage

Les élèves n'arrivent pas en classe vides. Ils portent des cadres de référence, des concepts partiels et des expériences vécues qui façonnent la manière dont ils interprètent les nouvelles informations. L'évaluation diagnostique traite ces connaissances existantes à la fois comme un atout sur lequel s'appuyer et comme une source potentielle d'interférence à prendre en compte. Les enseignants qui sautent cette étape enseignent souvent à côté des élèves plutôt qu'à eux.

Les conceptions erronées nécessitent une identification explicite

Un élève qui obtient zéro à un prétest et un élève qui obtient zéro tout en ayant une croyance incorrecte mais confiante sur le sujet se trouvent dans des situations très différentes. L'évaluation diagnostique distingue l'absence de connaissances de la présence d'une conception erronée. Cette distinction est importante parce que les conceptions erronées nécessitent une confrontation délibérée plutôt que l'ajout de nouvelles informations par-dessus. Les cartes conceptuelles et les entretiens diagnostiques sont particulièrement adaptés pour révéler ces cadres alternatifs, car ils montrent comment les élèves relient les idées, et pas seulement quels faits ils peuvent rappeler.

Les données diagnostiques doivent guider les décisions pédagogiques

Évaluer sans agir n'est qu'un rituel bureaucratique. Le processus diagnostique n'a aucune valeur si les résultats restent inutilisés. Les enseignants efficaces utilisent les résultats diagnostiques pour séquencer les contenus, former des groupes flexibles, choisir des exemples explicatifs et décider quels éléments fondamentaux revoir. Margaret Heritage (2010) décrit cette orientation comme une « évaluation pour l'apprentissage » plutôt qu'une évaluation de l'apprentissage. L'objectif des données diagnostiques est de modifier ce que l'enseignant fait ensuite.

Le diagnostic est un acte de collecte d'informations, pas un événement noté

Les évaluations diagnostiques ne sont pas des tests avec des notes. Les traiter comme des événements notés introduit une pression de performance qui déforme ce que les élèves révèlent. Lorsque les élèves comprennent qu'une pré-évaluation ne compte pas pour la note, ils sont plus enclins à répondre honnêtement — y compris à admettre qu'ils ne savent pas quelque chose — ce qui donne aux enseignants des données plus précises sur lesquelles travailler.

Des méthodes multiples produisent des tableaux plus fiables

Aucun instrument unique ne saisit l'ensemble des connaissances antérieures. Un prétest écrit montre la mémorisation factuelle mais peut passer à côté des conceptions erronées procédurales. Une carte conceptuelle révèle comment les élèves relient les idées mais peut ne pas exposer les lacunes de vocabulaire de base. Combiner deux ou trois courtes stratégies diagnostiques — par exemple une tâche écrite rapide accompagnée d'une discussion quatre-coins — donne aux enseignants un tableau plus complet que n'importe quel outil seul.

Application en classe

École primaire : tâches de dessin avant une unité de sciences

Avant une unité de CE2 sur le cycle de l'eau, un enseignant distribue des feuilles blanches et demande aux élèves de dessiner ce qu'ils pensent qu'il se passe quand une flaque disparaît par temps ensoleillé. La tâche prend quatre minutes. Les dessins révèlent immédiatement quels élèves ont un modèle intuitif de l'évaporation, lesquels croient que l'eau s'infiltre définitivement dans le sol, et lesquels n'ont aucun modèle fonctionnel. L'enseignant regroupe les élèves en conséquence avant tout enseignement direct, s'assurant que la première leçon aborde directement la conception erronée la plus répandue plutôt que de passer outre.

Collège : entretien diagnostique avant l'algèbre

Avant une unité de cinquième sur les équations linéaires, un enseignant prend six élèves à part pour une conversation structurée de cinq minutes : « Montre-moi comment tu trouverais le nombre qui va dans la case : 3 × __ + 4 = 19. » La conversation révèle si les élèves comprennent le principe d'égalité ou procèdent par essais-erreurs. Les élèves qui appliquent les opérations inverses correctement sont prêts à commencer les problèmes à plusieurs étapes ; ceux qui procèdent par tâtonnement ont besoin d'un enseignement direct sur le modèle de la balance d'abord. L'entretien, contrairement à un prétest écrit, montre le processus de raisonnement plutôt que seulement la réponse finale.

Lycée : carte conceptuelle avant une unité en sciences humaines

Avant une unité de terminale sur la Guerre froide, les élèves passent huit minutes à créer une carte conceptuelle reliant tous les termes qu'ils associent déjà au sujet. L'enseignant examine les cartes le soir même. Les élèves qui relient idéologie politique, dissuasion nucléaire et conflits par procuration sont prêts pour l'analyse de sources primaires. Ceux dont les cartes ne font référence qu'à des repères de culture populaire ont besoin d'un contexte fondamental en premier. Les cartes font également émerger de véritables intérêts : un élève qui établit des liens avec la musique cubaine ou le cinéma coréen offre un fil que l'enseignant pourra tisser tout au long de l'unité pour maintenir l'engagement.

Données de recherche

La méta-analyse de Black et Wiliam en 1998 a synthétisé plus de 250 études sur l'évaluation en classe. Leur conclusion que les pratiques d'évaluation basées sur le retour d'information produisent des tailles d'effet de 0,4 à 0,7 écart-type a identifié la connaissance de la compréhension antérieure des élèves comme un prérequis pour un retour d'information efficace. Les enseignants ne peuvent pas offrir un retour correctif utile sans savoir d'abord ce que les élèves croient déjà sur le sujet.

La méta-analyse de John Hattie en 2009, Visible Learning, qui a synthétisé plus de 800 études, a classé les acquis antérieurs comme l'un des prédicteurs les plus puissants de l'apprentissage. Cela soutient la logique fondamentale de la pratique diagnostique : ce que les élèves savent déjà façonne ce qu'ils peuvent apprendre ensuite. Les enseignants qui font émerger cette information peuvent séquencer l'unité pour combler les lacunes réelles plutôt que supposées.

Stephanie Bell et ses collègues (2010), dans une étude publiée dans Assessment in Education, ont examiné comment les enseignants du primaire utilisaient les données diagnostiques dans les unités de sciences. Les enseignants qui menaient des entretiens diagnostiques structurés avant l'enseignement obtenaient des gains post-unité significativement plus élevés que ceux qui s'appuyaient sur un questionnement informel. Les enseignants structurés rapportaient également une plus grande confiance dans la planification d'activités différenciées, parce que les données diagnostiques réduisaient les approximations nécessaires pour identifier les besoins des élèves.

Kathleen Hogan et Michael Pressley (1997) soutiennent dans Scaffolding Student Learning qu'un étayage efficace requiert un diagnostic précis du niveau de compétence actuel de l'apprenant. Sans étape diagnostique, l'étayage opère au mauvais niveau : trop élevé, il crée de la frustration ; trop bas, il crée de l'ennui.

Des limites réelles méritent d'être nommées. L'évaluation diagnostique ajoute du temps à des emplois du temps déjà chargés. Des instruments brefs peuvent sous-estimer les connaissances des élèves, en particulier ceux qui souffrent d'anxiété face aux tests ou de barrières linguistiques. Et les données diagnostiques n'améliorent l'enseignement que lorsque les enseignants ont à la fois la flexibilité et la profondeur disciplinaire nécessaires pour répondre à ce qu'ils trouvent. Un enseignant qui ne peut pas interpréter la conception erronée d'un élève ne peut pas y remédier, quelle que soit la clarté avec laquelle l'outil diagnostique la fait émerger.

Conceptions erronées fréquentes

L'évaluation diagnostique n'est qu'un prétest noté. Les prétests et les évaluations diagnostiques se recoupent, mais ne sont pas identiques. Un prétest reproduit souvent l'examen sommatif et mesure si les élèves connaissent déjà les objectifs finaux de l'unité. L'évaluation diagnostique sonde les connaissances préalables et les conceptions erronées potentielles sous-jacentes à ces objectifs. Elle vise à révéler comment les élèves pensent, pas seulement quels faits ils ont mémorisés. Noter les évaluations diagnostiques compromet généralement l'objectif, puisque l'enjeu des notes encourage les élèves à performer plutôt qu'à révéler leur véritable point de départ.

Une seule activité diagnostique donne une information complète. Un tableau SVA ou un quiz rapide en début d'unité n'est qu'un instantané, pas un portrait. Les élèves peuvent avoir une connaissance approfondie d'un aspect d'un sujet et des lacunes fondamentales dans un autre. Un élève qui définit correctement la « photosynthèse » peut néanmoins croire que les plantes tirent leur nourriture du sol. Combiner deux ou trois courtes stratégies donne un tableau plus précis et plus utilisable que n'importe quelle méthode unique.

L'évaluation diagnostique ne s'adresse qu'aux élèves en difficulté. Cela confond le diagnostic avec la remédiation. L'évaluation diagnostique s'applique à l'ensemble de la classe, y compris aux élèves qui dépassent déjà les attentes. Sans diagnostiquer les élèves à hautes performances, les enseignants ne peuvent pas approfondir l'apprentissage de manière appropriée et risquent d'ennuyer des apprenants compétents avec un enseignement dont ils n'ont pas besoin. L'enseignement différencié dépend des données diagnostiques à tous les niveaux de la classe, pas seulement à l'extrémité des élèves en difficulté.

Lien avec l'apprentissage actif

L'évaluation diagnostique s'inscrit naturellement dans l'apprentissage actif parce que de nombreuses stratégies diagnostiques efficaces sont participatives par conception, plutôt que des exercices écrits passifs.

L'activité quatre-coins positionne physiquement les élèves dans la salle en fonction de leur niveau d'accord avec une affirmation : « tout à fait d'accord », « d'accord », « pas d'accord » ou « pas du tout d'accord ». Avant une unité d'histoire sur les causes de la Première Guerre mondiale, un enseignant pourrait afficher : « Les guerres sont principalement causées par des facteurs économiques. » La position des élèves, et le raisonnement qu'ils offrent lorsqu'ils sont sollicités, révèle les cadres existants pour la causalité historique sans aucun papier. Le mouvement physique réduit les enjeux par rapport à un test écrit, et la discussion qui s'ensuit fait souvent émerger les informations diagnostiquement les plus utiles.

Le baromètre humain fonctionne de manière similaire, plaçant les élèves sur un continuum plutôt que dans quatre positions fixes. Il est bien adapté aux questions diagnostiques en sciences ou en éthique, où la compréhension antérieure tend à être graduée plutôt que binaire. Un enseignant demandant « À quel point êtes-vous sûr de pouvoir expliquer pourquoi les marées se produisent ? » obtient une carte des connaissances antérieures au niveau de la classe en moins de trois minutes, donnant une information immédiate sur la quantité de révision fondamentale nécessaire en ouverture de la leçon.

Ces deux stratégies reflètent les principes de l'évaluation pour l'apprentissage : l'évaluation n'est pas un événement administratif distinct mais s'intègre dans l'activité de classe, utilisée pour ajuster ce qui se passe ensuite plutôt que pour être enregistrée et classée.

Sources

  1. Ausubel, D. P. (1968). Educational Psychology: A Cognitive View. Holt, Rinehart & Winston.
  2. Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. Phi Delta Kappan, 80(2), 139–148.
  3. Bloom, B. S. (1968). Learning for mastery. Evaluation Comment, 1(2), 1–12. UCLA Center for the Study of Evaluation.
  4. Hattie, J. (2009). Visible Learning: A Synthesis of Over 800 Meta-Analyses Relating to Achievement. Routledge.