Definition

Evidenzbasiertes Unterrichten ist die bewusste Auswahl und Anwendung von Unterrichtsstrategien, die durch rigorose empirische Forschung gestützt werden. Eine Lehrkraft, die evidenzbasiert unterrichtet, stellt vor der Wahl einer Unterrichtsmethode eine konkrete Frage: Was sagt die Forschung über deren Wirkung auf das Lernen der Schülerinnen und Schüler, und wie belastbar ist diese Evidenz?

Das Konzept zieht eine direkte Linie zur Medizin. Die evidenzbasierte Praxis im Gesundheitswesen, die Donald Sackett und Kollegen an der McMaster University in den 1990er Jahren formalisiert haben, verlangt, dass klinische Entscheidungen die bestmögliche verfügbare Forschungsevidenz, klinische Expertise und Patientenwerte integrieren. Bildungsforscherinnen und -forscher adaptierten diesen Rahmen ab den späten 1990er Jahren mit dem Argument, dass Lehrkräfte denselben Zugang zu verlässlichen Erkenntnissen verdienen, den Ärztinnen und Ärzte haben.

Evidenzbasiertes Unterrichten ist nicht gleichbedeutend mit einem vorgeschriebenen Curriculum oder der Abschaffung professionellen Urteilsvermögens. Es ist ein Filtermechanismus. Wenn eine Lehrkraft zwischen zwei Ansätzen wählt — etwa zwischen erneutem Lesen und Retrieval Practice zur Wissenskonsolidierung — bedeutet evidenzbasiertes Unterrichten, die Entscheidung auf der Grundlage kontrollierter Forschungsergebnisse zu treffen, nicht auf der Basis von Intuition oder Fortbildungsangeboten ohne Datenbasis.

Historischer Hintergrund

Die evidenzbasierte Bewegung im Bildungsbereich nahm in den frühen 2000er Jahren auf beiden Seiten des Atlantiks institutionelle Gestalt an. In den USA verpflichtete der No Child Left Behind Act von 2001 auf „wissenschaftlich fundierte Forschung" als Standard für bundesfinanzierte Programme, und das What Works Clearinghouse (WWC) wurde 2002 unter dem Institute of Education Sciences gegründet, um wirksame Programme und Praktiken zu evaluieren und zu katalogisieren.

Im Vereinigten Königreich hatte das Evidence for Policy and Practice Information Centre (EPPI-Centre) am University College London seit 1993 Bildungsforschung synthetisiert. Das Centre for Effective Education an der Queen's University Belfast und die Education Endowment Foundation (EEF), gegründet 2011, setzten diese Arbeit im englischen Schulsystem fort: Sie finanzierten randomisierte kontrollierte Studien zu Unterrichtsinterventionen und veröffentlichten ein frei zugängliches Teaching and Learning Toolkit.

Der einflussreichste Einzelbeitrag auf diesem Gebiet war John Hatties Visible Learning, erschienen 2009. Hattie synthetisierte über 800 Metaanalysen, die rund 80 Millionen Schülerinnen und Schüler umfassten, um zu identifizieren, welche Faktoren Lernfortschritte am zuverlässigsten vorhersagen. Seine Arbeit gab Lehrkräften einen ranggeordneten, zugänglichen Rahmen, um die relative Wirksamkeit verschiedener Unterrichtsentscheidungen zu vergleichen. Visible Learning wurde das empirische Fundament evidenzbasierter Unterrichtsgespräche in vielen Schulsystemen weltweit.

Graham Nuthalls posthum veröffentlichtes The Hidden Lives of Learners (2007) fügte eine entscheidende Perspektive auf Unterrichtsebene hinzu. Nuthall verbrachte Jahrzehnte damit, kleinteilige Beobachtungsstudien in neuseeländischen Klassenzimmern durchzuführen, und stellte fest, dass vieles, was Lehrkräfte für hilfreich hielten — Gruppendiskussionen, abwechslungsreiche Aktivitäten, Signale für Schülerengagement — nicht zuverlässig die erwarteten Lerneffekte erzeugte. Seine Befunde unterstrichen die Notwendigkeit, Unterrichtsannahmen an tatsächlichen Lernergebnissen zu messen.

Dylan Wiliam am University College London brachte evidenzbasierte Praxis in die formative Beurteilung, durch seine Zusammenarbeit mit Paul Black. Der Höhepunkt war die wegweisende Übersichtsarbeit „Inside the Black Box" von 1998 und das nachfolgende Programm Embedding Formative Assessment, das zeigte, dass spezifische Feedbackpraktiken die Leistungen fächerübergreifend und altersunabhängig deutlich steigern können.

Kernprinzipien

Evidenzqualität ist ebenso wichtig wie Evidenzexistenz

Nicht jede Forschung hat dasselbe Gewicht. Eine einzelne kleine Studie ohne Kontrollgruppe ist grundlegend verschieden von einer präregistrierten randomisierten kontrollierten Studie, die in mehreren Populationen repliziert wurde. Evidenzbasiertes Unterrichten erfordert, dass Lehrkräfte und Schulleitungen zwischen Evidenzebenen unterscheiden: Expertenmeinungen und Fallstudien stehen am unteren Ende der Hierarchie; systematische Reviews und Metaanalysen mehrerer randomisierter kontrollierter Studien stehen an der Spitze.

Das EEF Teaching and Learning Toolkit bewertet jede Strategie sowohl nach Effektstärke als auch nach der Belastbarkeit der zugrundeliegenden Evidenz. Eine Strategie mit hoher Effektstärke, aber schwacher Evidenzbasis — wie manche Interventionen auf Basis von Lernstilen — sollte mit mehr Skepsis betrachtet werden als eine mit moderater Effektstärke, die durch mehrere hochwertige Studien gestützt wird.

Effektstärke als gemeinsames Maß

Die Effektstärke, typischerweise ausgedrückt als Cohens d, ermöglicht Vergleiche zwischen Studien, die Ergebnisse in unterschiedlichen Einheiten messen. Eine Effektstärke von 0,2 gilt allgemein als klein, 0,5 als mittel und 0,8 als groß. Hattie setzte seinen „Hinge Point" für bildungspraktisch bedeutsame Effekte bei d = 0,40, was ungefähr einem typischen Jahreswachstum der Schülerleistungen entspricht.

Effektstärke ist gerade deshalb wertvoll, weil sie statistische Signifikanz von praktischer Relevanz trennt. Eine Studie mit Tausenden von Teilnehmenden kann für eine Intervention mit einer Effektstärke von 0,02 ein statistisch signifikantes Ergebnis liefern — ohne praktischen Nutzen. Evidenzbasiertes Unterrichten erfordert die Bewertung beider Dimensionen.

Kontext bestimmt die Umsetzung, nicht die Strategiewahl

Evidenz identifiziert, welche Strategien unter verschiedenen Bedingungen wirken; professionelle Expertise bestimmt, wie sie in einem konkreten Klassenzimmer mit konkreten Schülerinnen und Schülern umzusetzen sind. Spaced Practice beispielsweise ist alters- und fächerübergreifend robust wirksam, doch das optimale Wiederholungsintervall und die Form der Übungsaufgaben erfordern das pädagogische Urteilsvermögen der Lehrkraft.

Dieses Prinzip schützt vor zwei Fehlern: Evidenz völlig zu ignorieren (allein auf Intuition zu setzen) und Evidenz mechanisch anzuwenden (alle Schülerinnen, Schüler und Fächer als identisch zu behandeln).

Fortlaufende Reflexion verfeinert die Praxis

Evidenzbasiertes Unterrichten ist keine einmalige Curriculumsentscheidung. Lehrkräfte, die es praktizieren, engagieren sich in kontinuierlicher Reflexion: Sie setzen evidenzinformierte Strategien um, erheben Daten über die Reaktionen ihrer eigenen Schülerinnen und Schüler und verfeinern ihren Ansatz. Dies knüpft direkt an Aktionsforschung an, die lehrergeleitete Untersuchung der Unterrichtspraxis als Modell professioneller Entwicklung formalisiert.

Anwendung im Unterricht

Lektionen rund um wirkungsstarke Strategien strukturieren

Eine Geschichtslehrkraft an einer weiterführenden Schule, die evidenzbasiert unterrichtet, könnte eine Unterrichtseinheit mithilfe von drei gut belegten Strategien strukturieren: Pre-Testing (Aktivierung und Erfassung von Vorwissen vor der Instruktion, Effektstärke d = 0,45 in Hatties Synthese), worked examples während des ersten Fertigkeitserwerbs (Reduzierung der kognitiven Belastung in der vulnerabelsten Lernphase) und gering bewertete Abrufübungen an Tag 2, 7 und 21 nach der Erstinstruktion.

Jede dieser Entscheidungen lässt sich auf einen Forschungsbestand mit bedeutsamen Effektstärken und hoher Evidenzqualität zurückführen. Die Lehrkraft folgt keinem Skript; sie wählt Werkzeuge mit nachgewiesener Erfolgsbilanz und passt sie an den historischen Inhalt und den aktuellen Wissensstand ihrer Schülerinnen und Schüler an.

Beurteilungsdaten zur Steuerung des Unterrichts nutzen

Eine Grundschullehrerin in Klasse 4 stellt fest, dass drei Schülerinnen und Schüler kontinuierlich Aufgaben mit Brüchen und ungleichen Nennern verfehlen. Evidenzbasierte Praxis bedeutet hier, dem Impuls zu widerstehen, den gesamten Unterrichtsstoff erneut für die ganze Klasse zu behandeln. Forschung zur diagnostischen Beurteilung (Dylan Wiliam, 2011) zeigt, dass gezieltes, reaktives Feedback auf spezifische Fehlvorstellungen größere Lernfortschritte erzeugt als klassenweite Wiederholung von bereits beherrschtem Inhalt.

Die Lehrerin gestaltet eine Kleingruppenintervention für die drei Schülerinnen und Schüler, nutzt eine konkret-piktorial-abstrakte Progression, gestützt durch Bruners Repräsentationstheorie, und überprüft den Lernstand nach fünf Sitzungen. Die Daten — nicht die Intuition der Lehrerin darüber, ob die Stunde „gut lief" — bestimmen den nächsten Schritt.

Fortbildungsangebote evidenzbasiert bewerten

Eine Fachleiterin, die zwei Fortbildungsangebote bewertet — eines zur lernstilbasierten Differenzierung, eines zu formativem Feedback — kann evidenzbasiertes Denken direkt auf diese Entscheidung anwenden. Das EEF-Toolkit bewertet Lernstile mit sehr geringer Evidenzqualität und nahezu keiner Effektstärke; formatives Feedback trägt eine hohe Evidenzqualitätsbewertung und eine Effektstärke von etwa 0,60. Die Zuweisung des Fortbildungsbudgets folgt der Evidenz, nicht den Umfrageergebnissen der Präsentierenden.

Forschungslage

Die grundlegende groß angelegte Synthese ist Hatties Visible Learning (2009), das in Visible Learning for Teachers (2012) und Visible Learning: The Sequel (2023) aktualisiert wurde. Der Band von 2009 synthetisierte über 800 Metaanalysen und identifizierte die wichtigsten Einflussfaktoren auf Schülerleistungen. Hatties konsistentester Befund: Die Qualität des Lehrer-Feedbacks — insbesondere Feedback, das Schülerinnen und Schüler darüber informiert, wo sie im Verhältnis zum Ziel stehen und was sie als nächstes tun sollen — erzeugt die höchsten und zuverlässigsten Lernfortschritte aller Unterrichtsvariablen.

Paul Black und Dylan Wiliams Übersichtsarbeit „Assessment and Classroom Learning" von 1998 (Assessment in Education, 5(1), S. 7–74) synthetisierte 250 Studien zur formativen Beurteilung und fand Effektstärken von 0,4 bis 0,7 Standardabweichungen für gut umgesetzte formative Beurteilungspraktiken. Die Übersicht war wegweisend dafür, formative Beurteilung als Eckpfeiler evidenzbasierter Unterrichtsstrategie zu etablieren.

Robert Marzano, Debra Pickering und Jane Pollocks Classroom Instruction That Works (2001), basierend auf einer Synthese von über 100 Studien, identifizierten neun Kategorien von Unterrichtsstrategien mit starken Effektstärken. Obwohl spätere Kritiken einige von Marzanos methodischen Entscheidungen in Frage stellten, veranlasste der Rahmen die breite Übernahme evidenzbasierter Strategiesprache in Schulsystemen.

Eine wesentliche Einschränkung im Feld ist die Schwierigkeit, hochwertige Laborforschung in authentische Unterrichtskontexte zu übertragen. Roediger und Karpickes Retrieval-Practice-Studien (2006, Psychological Science) zeigten große Effekte unter kontrollierten Bedingungen, und nachfolgende klassenbasierte Replikationen haben bestätigt, dass diese Effekte standhalten — doch die optimale Umsetzung variiert erheblich nach Fach und Alter. Lehrkräfte sollten Effektstärken als Richtungsgröße, nicht als präzise Vorhersage für ihr eigenes Klassenzimmer betrachten.

Häufige Missverständnisse

Evidenzbasiertes Unterrichten bedeutet, nur randomisierte kontrollierte Studien zu nutzen. RCTs sind der höchste Standard für kausale Aussagen, aber nicht die einzige legitime Evidenzquelle im Bildungsbereich. Systematische Reviews, hochwertige Längsschnittstudien und replizierte quasi-experimentelle Studien tragen alle zur Evidenzbasis bei. Eine Strategie, die durch mehrere unabhängige Korrelationsstudien in unterschiedlichen Kontexten gestützt wird, kann — mit angemessener Vorsicht hinsichtlich kausaler Aussagen — handlungsleitend sein.

Was im Durchschnitt wirkt, wirkt für jede Schülerin und jeden Schüler. Effektstärken aus großen Metaanalysen beschreiben Durchschnittseffekte über Populationen hinweg. Eine Strategie mit d = 0,60 wird nicht jede Schülerin und jeden Schüler in jedem Klassenzimmer im gleichen Maße fördern. Manche profitieren mehr, andere weniger, und manche reagieren je nach Vorwissen, Motivation oder Unterrichtskontext unterschiedlich. Evidenzbasiertes Unterrichten erfordert, Daten über die eigenen Schülerinnen und Schüler zu erheben und nicht allein dem Populationsdurchschnitt zu vertrauen.

Evidenzbasiertes Unterrichten schränkt Kreativität und Lehrerautonomie ein. Evidenz begrenzt das Feld plausibler Strategien, schreibt aber nicht vor, wie eine Lehrkraft diese Strategien zum Leben erweckt. Eine Lehrkraft, die evidenzbasiert Cold Calling mit Denkzeit einsetzt (gestützt durch Wait-Time-Forschung und Retrieval-Practice-Forschung), kann dennoch kulturell responsive Impulse gestalten, ihr Wissen über einzelne Schülerinnen und Schüler einsetzen und innerhalb einer validierten Struktur ihren eigenen pädagogischen Stil entwickeln. Evidenz setzt die Untergrenze, nicht die Obergrenze.

Verbindung zum aktiven Lernen

Evidenzbasiertes Unterrichten und aktives Lernen verstärken sich gegenseitig. Viele der wirkungsstärksten Strategien in Hatties Synthese sind von Natur aus aktiv: Formatives Feedback erfordert, dass Schülerinnen und Schüler verarbeiten und reagieren; Retrieval Practice erfordert aktiven Abruf statt passiver Wiederholung; Reciprocal Teaching erfordert, dass Schülerinnen und Schüler Fragen generieren, zusammenfassen, klären und vorhersagen.

Visible Learning liefert die empirische Grundlage dafür zu verstehen, welche aktiven Lernansätze messbare Fortschritte erzeugen. Diskussionsmethoden mit geringer kognitiver Anforderung schneiden in Hatties Synthese schlecht ab; strukturierte Diskussionen mit klaren Zielen, Cold Calling und Verantwortlichkeit für Begründungen schneiden deutlich besser ab. Die Unterscheidung liegt nicht per se zwischen aktiv und passiv, sondern zwischen aktivem Engagement, das Denken produziert, und aktivem Engagement, das Performanz ohne Lernen erzeugt.

Retrieval Practice zählt zu den am besten belegten aktiven Lernstrategien in der kognitiven Wissenschaft. Schülerinnen und Schüler zu bereits gelerntem Material zu befragen — statt sie Notizen wiederholen zu lassen — übertrifft passive Lernmethoden konsistent mit Effektstärken, die alters-, fach- und zeitintervallübergreifend robust sind. Für Lehrkräfte, die Wiederholungsaktivitäten gestalten, ist diese Evidenz eindeutig und umsetzbar.

Aktionsforschung operationalisiert evidenzbasiertes Unterrichten auf Klassenebene. Während Metaanalysen Lehrkräften sagen, welche Strategien tendenziell wirken, gibt Aktionsforschung Lehrkräften eine Methode an die Hand, um herauszufinden, ob und wie diese Strategien für ihre spezifischen Schülerinnen und Schüler wirken. Eine Lehrkraft, die die Forschung zur Spaced Practice liest, ein Spacing-Protokoll umsetzt und die Quizleistungen über ein Semester systematisch verfolgt, betreibt beides: Sie wendet externe Evidenz an und generiert lokale Evidenz.

Methoden mit starken aktiven Lernkomponenten — darunter das Flipped Classroom, projektbasiertes Lernen und das Sokratische Seminar — profitieren direkt vom evidenzbasierten Unterrichtsrahmen. Statt diese Ansätze aufgrund ihrer Attraktivität pauschal zu übernehmen, können Lehrkräfte die spezifischen Mechanismen jeder Methode (metakognitive Reflexion, kollaboratives Problemlösen, elaboratives Fragen) gegen die Evidenz für diese Mechanismen prüfen und entsprechend umsetzen.

Quellen

  1. Hattie, J. (2009). Visible Learning: A Synthesis of Over 800 Meta-Analyses Relating to Achievement. Routledge.

  2. Black, P., & Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education: Principles, Policy & Practice, 5(1), 7–74.

  3. Nuthall, G. (2007). The Hidden Lives of Learners. NZCER Press.

  4. Education Endowment Foundation. (2024). Teaching and Learning Toolkit. EEF. Retrieved from https://educationendowmentfoundation.org.uk/education-evidence/teaching-learning-toolkit