Definition
Diagnostische Beurteilung ist eine Erhebung, die vor dem Unterricht stattfindet und ausdrücklich darauf abzielt, zu kartieren, was Schülerinnen und Schüler bereits wissen, welche Teilverständnisse sie mitbringen und welche Fehlvorstellungen das neue Lernen behindern könnten. Anders als summative Beurteilung (die Lernergebnisse nach dem Unterricht misst) oder formative Beurteilung (die das Lernen während des Unterrichts begleitet), legt diagnostische Beurteilung eine Ausgangsbasis fest. Sie beantwortet eine Frage: Wo stehen meine Schülerinnen und Schüler gerade?
Der Begriff ist der Medizin entlehnt, wo die Diagnose der Behandlung vorausgeht. In der Pädagogik gilt dieselbe Logik. Unterrichten nach einem festen Lehrplan, ohne den Ausgangspunkt der Lernenden zu kennen, führt zu ineffizientem Unterricht: Manche Schülerinnen und Schüler sitzen durch Inhalte, die sie bereits beherrschen; andere fallen zurück, weil Vorwissen vorausgesetzt statt überprüft wurde. Diagnostische Beurteilung schließt die Lücke zwischen dem, was Lehrkräfte glauben, dass Schülerinnen und Schüler wissen, und dem, was sie tatsächlich wissen.
David Ausubel (1968) formulierte dies prägnant in Educational Psychology: A Cognitive View: „Der wichtigste einzelne Faktor, der das Lernen beeinflusst, ist das, was der Lernende bereits weiß. Stellen Sie dies fest und unterrichten Sie entsprechend." Dieser Satz bleibt das knappste Argument für diagnostische Praxis in der Forschungsliteratur.
Historischer Kontext
Das formale Konzept der Lerndiagnose vor dem Unterricht entstand Mitte des zwanzigsten Jahrhunderts, begleitet von der Mastery-Learning-Theorie. Benjamin Blooms Aufsatz von 1968, „Learning for Mastery" in Evaluation Comment, argumentierte, dass die meisten Schülerinnen und Schüler hohe Leistungen erreichen könnten, wenn Lehrkräfte Voraussetzungslücken identifizierten, bevor sie weitermachten. Bloom unterschied diagnostische Beurteilung von formativen Zwischenchecks und summativer Bewertung und positionierte sie als Grundlage einer bewussten Unterrichtsplanung.
Ausubels Arbeit zu Advance Organizers, die im selben Zeitraum erschien, unterstützte dies. Seine Assimilationstheorie besagte, dass neues Wissen an bestehende kognitive Strukturen andocken muss. Fehlen diese Strukturen oder sind sie verzerrt, misslingt das Andocken. Diagnostische Beurteilung macht diese Strukturen sichtbar, bevor neue Inhalte eingeführt werden.
In den 1980er Jahren zeigten Forscherinnen und Forscher, die sich mit naturwissenschaftlichen Fehlvorstellungen befassten — insbesondere Rosalind Driver an der University of Leeds —, dass Schülerinnen und Schüler mit stabilen, kohärenten alternativen Deutungsmustern zu Kraft, Wärme und Materie in den Unterricht kommen, die sich intuitiv richtig anfühlen, aber der akzeptierten Wissenschaft widersprechen. Drivers Arbeit zeigte, dass das Ignorieren dieser Deutungsmuster sie nicht neutralisierte; Schülerinnen und Schüler behielten ihre ursprünglichen Überzeugungen oft bei und lieferten gleichzeitig korrekte Antworten in Tests. Das Aufdecken dieser Vorstellungen vor dem Unterricht wurde als notwendige Maßnahme anerkannt, nicht als optionale Ergänzung.
Die Beurteilung für das Lernen, die durch Paul Black und Dylan Wiliams Überblicksartikel von 1998 „Inside the Black Box" in Phi Delta Kappan geprägt wurde, bettete diagnostische Praxis in ein breiteres Paradigma des responsiven Unterrichts ein. Black und Wiliams Synthese ergab, dass der Einsatz von Beurteilungsnachweisen zur Anpassung des Unterrichts Effektgrößen von 0,4 bis 0,7 Standardabweichungen erzielte — zu den höchsten dokumentierten Ergebnissen in der Bildungsforschung. Obwohl sich ihr Überblick vorrangig auf laufende formative Beurteilung konzentrierte, schlossen sie vorbereitende Diagnose ausdrücklich als Bestandteil beurteilungsgeleiteten Unterrichts ein.
Grundprinzipien
Vorwissen ist der Ausgangspunkt für neues Lernen
Schülerinnen und Schüler kommen nicht mit einem leeren Kopf in die Klasse. Sie bringen Deutungsmuster, Teilkonzepte und gelebte Erfahrungen mit, die beeinflussen, wie sie neue Informationen interpretieren. Diagnostische Beurteilung behandelt dieses vorhandene Wissen sowohl als Ressource, auf der aufgebaut werden kann, als auch als potenzielle Quelle von Interferenzen, die es zu adressieren gilt. Lehrkräfte, die diesen Schritt überspringen, unterrichten oft an den Schülerinnen und Schülern vorbei, anstatt für sie.
Fehlvorstellungen müssen gezielt identifiziert werden
Eine Schülerin oder ein Schüler, die bzw. der bei einem Vortest null Punkte erzielt, und eine Schülerin oder ein Schüler, die bzw. der dasselbe Ergebnis erzielt, während sie bzw. er eine zuversichtliche, falsche Überzeugung zum Thema hegt, befinden sich in sehr unterschiedlichen Ausgangssituationen. Diagnostische Beurteilung unterscheidet zwischen dem Fehlen von Wissen und dem Vorhandensein einer Fehlvorstellung. Diese Unterscheidung ist bedeutsam, weil Fehlvorstellungen einer gezielten Konfrontation bedürfen, anstatt dass neues Wissen einfach darübergelegt wird. Concept Mapping und diagnostische Interviews eignen sich besonders gut, um diese alternativen Deutungsrahmen aufzudecken, da sie zeigen, wie Schülerinnen und Schüler Ideen verknüpfen, und nicht nur, welche Fakten sie abrufen können.
Diagnostische Daten müssen Unterrichtsentscheidungen leiten
Beurteilung ohne Konsequenz ist ein bürokratisches Ritual. Der diagnostische Prozess hat keinen Wert, wenn die Ergebnisse ungenutzt bleiben. Effektive Lehrkräfte nutzen diagnostische Erkenntnisse, um Inhalte zu sequenzieren, flexible Gruppen zu bilden, Erklärungsbeispiele auszuwählen und zu entscheiden, welches Grundlagenwissen wiederholt werden muss. Margaret Heritage (2010) beschreibt diese Haltung als „Beurteilung für das Lernen" im Gegensatz zur Beurteilung des Lernens. Der Zweck diagnostischer Daten ist es, zu verändern, was die Lehrkraft als nächstes tut.
Diagnose ist eine Informationserhebung, kein Benotungsereignis
Diagnostische Beurteilungen sind keine benoteten Tests. Werden sie als Benotungsereignisse behandelt, entsteht Leistungsdruck, der verzerrt, was Schülerinnen und Schüler preisgeben. Wenn Schülerinnen und Schüler verstehen, dass eine Vorbeurteilung keine Note trägt, antworten sie ehrlicher — einschließlich des Eingeständnisses, etwas nicht zu wissen — was Lehrkräften genauere Daten liefert.
Mehrere Methoden ergeben zuverlässigere Bilder
Kein einzelnes Instrument erfasst die gesamte Bandbreite des Vorwissens. Ein schriftlicher Vortest zeigt faktisches Wissen, kann aber prozedurale Fehlvorstellungen verfehlen. Eine Concept Map zeigt, wie Schülerinnen und Schüler Ideen verknüpfen, legt aber möglicherweise keine Lücken im Grundvokabular offen. Die Kombination aus zwei oder drei kurzen diagnostischen Strategien — etwa eine kurze schriftliche Aufgabe in Verbindung mit einer Four-Corners-Diskussion — gibt Lehrkräften ein vollständigeres Bild als ein einzelnes Instrument.
Unterrichtspraxis
Grundschule: Zeichenaufgaben vor einer Naturwissenschaftseinheit
Vor einer Einheit über den Wasserkreislauf in der dritten Klasse verteilt eine Lehrkraft leere Blätter und bittet die Schülerinnen und Schüler, zu zeichnen, was sie glauben, was passiert, wenn eine Pfütze an einem sonnigen Tag verschwindet. Die Aufgabe dauert vier Minuten. Die Zeichnungen zeigen sofort, welche Schülerinnen und Schüler ein intuitives Modell von Verdunstung haben, welche glauben, das Wasser versickere dauerhaft im Boden, und welche überhaupt kein funktionierendes Modell besitzen. Die Lehrkraft bildet entsprechende Gruppen, bevor der direkte Unterricht beginnt, und stellt sicher, dass die erste Stunde die häufigste Alternativvorstellung direkt anspricht, anstatt sie zu übergehen.
Mittelstufe: Diagnostisches Interview vor der Algebra
Vor einer Einheit über lineare Gleichungen in der siebten Klasse führt eine Lehrkraft mit sechs Schülerinnen und Schülern ein fünfminütiges strukturiertes Gespräch: „Zeig mir, wie du herausfinden würdest, welche Zahl in das Kästchen gehört: 3 × __ + 4 = 19." Das Gespräch zeigt, ob die Schülerinnen und Schüler das Gleichheitsprinzip verstehen oder durch Raten und Ausprobieren vorgehen. Schülerinnen und Schüler, die inverse Operationen korrekt anwenden, sind bereit, mehrstufige Aufgaben zu beginnen; solche, die durch Ausprobieren arbeiten, benötigen zunächst direkten Unterricht zum Waagemodell. Das Interview zeigt — anders als ein schriftlicher Vortest — den Denkprozess und nicht nur das Endergebnis.
Oberstufe: Concept Mapping vor einer Geisteswissenschaftseinheit
Vor einer Einheit über den Kalten Krieg in der elften Klasse erstellen Schülerinnen und Schüler acht Minuten lang eine Concept Map, in der sie alle Begriffe verbinden, die sie bereits mit dem Thema assoziieren. Die Lehrkraft sichtet die Maps am Abend. Schülerinnen und Schüler, die politische Ideologie, nukleare Abschreckung und Stellvertreterkriege verknüpfen, sind bereit für die Analyse von Primärquellen. Schülerinnen und Schüler, deren Maps sich nur auf popkulturelle Anspielungen beziehen, benötigen zunächst grundlegende Kontextualisierung. Die Maps legen auch echtes Interesse offen: Eine Schülerin oder ein Schüler, die bzw. der Verbindungen zu kubanischer Musik oder koreanischem Kino herstellt, bietet einen Faden, den die Lehrkraft später aufgreifen kann, um das Engagement über die gesamte Einheit aufrechtzuerhalten.
Forschungslage
Black und Wiliams Meta-Analyse von 1998 synthetisierte über 250 Studien zum Klassenraumassessment. Ihr Befund, dass auf Feedback basierte Beurteilungspraktiken Effektgrößen von 0,4 bis 0,7 Standardabweichungen erzielen, identifizierte das Wissen über das Vorverständnis der Schülerinnen und Schüler als Voraussetzung für effektives Feedback. Ohne zu wissen, was Schülerinnen und Schüler bereits über ein Thema glauben, können Lehrkräfte kein nützliches korrektives Feedback geben.
John Hatties Meta-Analyse Visible Learning von 2009, die über 800 Studien synthetisierte, stufte frühere Leistungen als einen der stärksten Prädiktoren für schulisches Lernen ein. Dies stützt die Kernlogik diagnostischer Praxis: Was Schülerinnen und Schüler bereits wissen, prägt, was sie als nächstes lernen können. Lehrkräfte, die diese Information erheben, können die Einheit so sequenzieren, dass tatsächliche Lücken adressiert werden, anstatt angenommene.
Stephanie Bell und Kolleginnen und Kollegen (2010) untersuchten in einer in Assessment in Education veröffentlichten Studie, wie Grundschullehrkräfte diagnostische Daten in naturwissenschaftlichen Einheiten nutzten. Lehrkräfte, die vor dem Unterricht strukturierte diagnostische Interviews durchführten, erzielten deutlich stärkere Zuwächse nach der Einheit als Lehrkräfte, die sich auf informelles Nachfragen verließen. Die strukturiert vorgehenden Lehrkräfte berichteten zudem von größerem Vertrauen in die Planung differenzierter Aktivitäten, weil die diagnostischen Daten das Raten bei der Identifikation von Lernbedürfnissen reduzierten.
Kathleen Hogan und Michael Pressley (1997) argumentieren in Scaffolding Student Learning, dass effektives Scaffolding eine genaue Diagnose des aktuellen Kompetenzniveaus der Lernenden erfordert. Ohne einen diagnostischen Schritt operiert Scaffolding auf der falschen Ebene: zu hoch und damit frustrierend, zu niedrig und damit langweilig.
Es gibt reale Grenzen, die es anzusprechen gilt. Diagnostische Beurteilung kostet Zeit in ohnehin vollen Stundenplänen. Kurze Instrumente können das Wissen der Schülerinnen und Schüler unterschätzen, insbesondere bei Prüfungsangst oder Sprachbarrieren. Und diagnostische Daten verbessern den Unterricht nur dann, wenn Lehrkräfte sowohl die Flexibilität als auch die fachliche Tiefe besitzen, um auf das Gefundene zu reagieren. Eine Lehrkraft, die die Fehlvorstellung einer Schülerin oder eines Schülers nicht interpretieren kann, kann sie nicht adressieren — unabhängig davon, wie klar das diagnostische Instrument sie aufdeckt.
Häufige Missverständnisse
Diagnostische Beurteilung ist nur ein benoteter Vortest. Vortests und diagnostische Beurteilungen überschneiden sich, sind aber nicht identisch. Ein Vortest spiegelt oft die Abschlussprüfung wider und misst, ob Schülerinnen und Schüler die Endziele der Einheit bereits kennen. Diagnostische Beurteilung hingegen untersucht das Vorwissen und potenzielle Fehlvorstellungen, die diesen Zielen zugrunde liegen. Sie zielt darauf ab zu zeigen, wie Schülerinnen und Schüler denken, nicht nur welche Fakten sie auswendig gelernt haben. Die Benotung diagnostischer Beurteilungen untergräbt in der Regel das Ziel, da Notendruck Schülerinnen und Schüler dazu verleitet, eine Leistung zu zeigen, anstatt ihren tatsächlichen Ausgangspunkt zu offenbaren.
Eine einzige diagnostische Aktivität liefert vollständige Informationen. Ein KWL-Diagramm oder ein kurzes Quiz zu Beginn einer Einheit ist eine Momentaufnahme, kein Porträt. Schülerinnen und Schüler können tiefes Wissen in einem Aspekt eines Themas und grundlegende Lücken in einem anderen haben. Eine Schülerin oder ein Schüler, die bzw. der „Photosynthese" korrekt definiert, glaubt möglicherweise dennoch, dass Pflanzen ihre Nahrung aus dem Boden beziehen. Die Kombination von zwei oder drei kurzen Strategien ergibt ein genaueres und handlungsleitenderes Bild als eine einzelne Methode.
Diagnostische Beurteilung ist nur für leistungsschwache Schülerinnen und Schüler. Dies verwechselt Diagnose mit Förderung. Diagnostische Beurteilung gilt für die gesamte Bandbreite der Klasse — einschließlich Schülerinnen und Schüler, die bereits die Erwartungen übertreffen. Ohne die Leistungsstarken zu diagnostizieren, können Lehrkräfte das Lernen nicht angemessen erweitern und riskieren, kompetente Lernende mit Unterricht zu langweilen, den sie nicht benötigen. Differenzierter Unterricht setzt diagnostische Erkenntnisse auf allen Leistungsniveaus voraus — nicht nur am unteren Ende.
Verbindung zum aktiven Lernen
Diagnostische Beurteilung fügt sich natürlich in aktives Lernen ein, weil viele effektive diagnostische Strategien von Natur aus partizipativ gestaltet sind und keine passiven schriftlichen Übungen darstellen.
Die Four-Corners-Aktivität positioniert Schülerinnen und Schüler physisch im Raum entsprechend ihrem Zustimmungsgrad zu einer Aussage: „stimme voll zu", „stimme zu", „stimme nicht zu" oder „stimme überhaupt nicht zu". Vor einer Geschichtseinheit über die Ursachen des Ersten Weltkriegs könnte eine Lehrkraft die These aufstellen: „Kriege werden hauptsächlich durch wirtschaftliche Faktoren verursacht." Wo die Schülerinnen und Schüler stehen und welche Begründungen sie auf Nachfrage nennen, zeigt bestehende Deutungsrahmen zur historischen Kausalität — ganz ohne Papier. Die körperliche Bewegung senkt den Druck im Vergleich zu einem schriftlichen Test, und die anschließende Diskussion bringt oft die diagnostisch wertvollsten Informationen zutage.
Das Human Barometer funktioniert ähnlich und platziert Schülerinnen und Schüler auf einem Kontinuum anstatt an vier festen Positionen. Dies eignet sich gut für diagnostische Fragen in Naturwissenschaften oder Ethik, wo Vorverständnis eher graduell als binär ausgeprägt ist. Eine Lehrkraft, die fragt: „Wie sicher sind Sie, dass Sie erklären können, warum Gezeiten entstehen?", erhält in weniger als drei Minuten eine klassenweite Übersicht über das Vorwissen — eine unmittelbare Information darüber, wie viel grundlegende Wiederholung die erste Stunde erfordert.
Beide Strategien spiegeln die Prinzipien der Beurteilung für das Lernen wider: Beurteilung ist kein gesondertes administratives Ereignis, sondern in die Unterrichtsaktivität eingewoben und dient dazu, das weitere Vorgehen anzupassen — nicht dazu, Ergebnisse zu dokumentieren und abzulegen.
Quellen
- Ausubel, D. P. (1968). Educational Psychology: A Cognitive View. Holt, Rinehart & Winston.
- Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. Phi Delta Kappan, 80(2), 139–148.
- Bloom, B. S. (1968). Learning for mastery. Evaluation Comment, 1(2), 1–12. UCLA Center for the Study of Evaluation.
- Hattie, J. (2009). Visible Learning: A Synthesis of Over 800 Meta-Analyses Relating to Achievement. Routledge.