Definition
Assessment for Learning (AfL) bezeichnet die Praxis, fortlaufend während des Unterrichts Erkenntnisse über das Schülerverständnis zu gewinnen und auf deren Grundlage Lehren und Lernen in Echtzeit anzupassen. Es geht nicht darum, etwas zu messen oder festzuhalten – sondern darum, handlungsrelevante Informationen zu erzeugen, auf die sowohl Lehrende als auch Lernende zurückgreifen, um die Lücke zwischen aktuellem Stand und Lernziel zu schließen.
Die Assessment Reform Group (1999) definierte AfL als „den Prozess des Suchens und Interpretierens von Evidenz, die Lernende und Lehrende nutzen, um festzustellen, wo Lernende in ihrem Lernprozess stehen, wohin sie gelangen sollen und wie sie dieses Ziel am besten erreichen." Drei Fragen stehen im Mittelpunkt dieser Definition: Wo steht die lernende Person gerade? Wohin soll sie sich entwickeln? Was ist der beste nächste Schritt? Jede AfL-Strategie beantwortet mindestens eine davon.
AfL ist eng mit formativer Beurteilung verwandt, legt jedoch stärker den Fokus auf die Handlungsfähigkeit der Lernenden. Während formative Beurteilung jeden risikoarmen Check beschreiben kann, setzt AfL ausdrücklich voraus, dass die gewonnenen Erkenntnisse mit den Schülerinnen und Schülern geteilt und von ihnen selbst — nicht nur von der Lehrkraft — genutzt werden.
Historischer Hintergrund
Das moderne AfL-Rahmenwerk geht auf eine Überblicksstudie von Paul Black und Dylan Wiliam aus dem Jahr 1998 zurück, die beide damals am King's College London tätig waren. Ihr Aufsatz „Inside the Black Box: Raising Standards Through Classroom Assessment" synthetisierte 250 Studien aus den Jahren 1988 bis 1997 und kam zu dem Schluss, dass formative Beurteilung — bei hochwertiger Rückmeldung und aktiver Einbeziehung der Lernenden — Effektstärken von 0,4 bis 0,7 Standardabweichungen erzielte. Das entsprach in ihren Worten einer Verschiebung vom 50. Perzentil auf etwa das 65. bis 75. Perzentil.
Der Begriff „Assessment for Learning" wurde durch die Assessment Reform Group (ARG) geprägt, ein britisches Forschungskonsortium, das von 1989 bis 2010 aktiv war und u. a. Black, Wiliam, Mary James und Bethan Marshall umfasste. Ihre Publikation „Assessment for Learning: Beyond the Black Box" (1999) benannte das Konzept, grenzte es von summativer Beurteilung ab und legte zehn Prinzipien fest, die Schulen als Rahmen nutzen konnten.
Black und Wiliam folgten mit „Assessment and Classroom Learning" (1998, Assessment in Education) sowie dem praxisorientierten „Working Inside the Black Box" (2002), das konkrete Strategien einführte: Fragetechniken, lernförderndes Feedback, das Teilen von Lernzielen mit Schülerinnen und Schülern sowie Peer- und Selbstbeurteilung. Bis 2004 war AfL als offizielle Bildungspolitik in England, Schottland und Wales verankert und hatte sich auf Australien, Neuseeland, Kanada und Skandinavien ausgeweitet.
Die intellektuellen Wurzeln reichen weiter zurück als in die 1990er-Jahre. Benjamin Blooms Mastery-Learning-Modell (1968) zeigte, dass Schülerinnen und Schüler, die formative Überprüfungen und korrigierendes Feedback erhielten, bevor sie zu neuem Stoff übergingen, deutlich höhere Leistungen erzielten. Vygotskys Zone der nächsten Entwicklung (1978) lieferte die theoretische Grundlage: Wirksamer Unterricht muss die Lücke zwischen dem adressieren, was Lernende selbstständig können, und dem, was sie mit Unterstützung leisten können. AfL ist in der Praxis der Mechanismus, mit dem diese Lücke fortlaufend gefunden und geschlossen wird.
Kernprinzipien
Lernziele und Erfolgskriterien teilen
Schülerinnen und Schüler lernen effektiver, wenn sie wissen, was sie lernen sollen und wie gute Arbeit aussieht. Lernziele zu teilen („Am Ende dieser Stunde werden Sie in der Lage sein, ...") ist nicht dasselbe wie eine Aktivität anzukündigen. Erfolgskriterien beschreiben beobachtbare Belege für Verständnis: „Du kannst erklären, warum der Wasserkreislauf in tropischen Regionen schneller verläuft, und verwendest dabei mindestens zwei Wettervariablen." Wenn Schülerinnen und Schüler diesen Maßstab selbst verinnerlichen, können sie ihren eigenen Fortschritt beobachten, anstatt die Erwartungen der Lehrkraft zu erraten.
Unterrichtsfragen, die Erkenntnisse generieren
Fragen auf einfachem Reproduktionsniveau („In welchem Jahr begann die Französische Revolution?") bestätigen das Gedächtnis, offenbaren aber kein Verständnis. AfL erfordert Fragen, die Denkvorgänge sichtbar machen: „Warum glauben Sie, war der Dritte Stand volatiler als der Zweite?" Techniken wie Wartezeit (mindestens drei Sekunden nach dem Stellen einer Frage), zufälliges Cold Calling und die No-Hands-Up-Regel sorgen dafür, dass Erkenntnisse von allen Schülerinnen und Schülern stammen — nicht nur von denjenigen, die sich freiwillig melden. Das Ziel ist diagnostisches Datenmaterial, keine Vorführung.
Feedback, das Lernen vorantreibt
Wirksames Feedback im Rahmen von AfL zeigt Lernenden konkret auf, was sie gut gemacht haben, was verbessert werden muss und wie die Verbesserung gelingen kann. Forschungsergebnisse von Kluger und DeNisi (1996), die 2.500 Experimente umfassten, stellten fest, dass Feedback, das sich auf die Aufgabe und den nächsten Schritt konzentriert, die Leistung zuverlässig steigerte; Feedback, das auf die Person gerichtet war (Noten, Lob, Ego), verschlechterte sie häufig. Feedback im Bildungswesen fungiert als Unterricht, nicht als Bewertung. Kommentare wie „Dein Argument ist klar, aber du hast nur eine Quelle zitiert — finde eine weitere, die deine These aus einer anderen Perspektive stützt" geben der lernenden Person eine konkrete Handlungsmöglichkeit.
Peer-Beurteilung
Schülerinnen und Schüler, die die Arbeit anderer beurteilen, festigen ihr eigenes Verständnis der Erfolgskriterien und liefern gleichzeitig Rückmeldungen für ihre Mitschülerinnen und Mitschüler. Dylan Wiliam betont, dass Peer-Beurteilung explizites Training erfordert: Lernende müssen lernen, spezifisches, aufgabenbezogenes Feedback zu geben, anstatt allgemeines Lob oder Kritik zu äußern. Die soziale Dimension bietet einen zusätzlichen Vorteil: Feedback von Gleichaltrigen wird oft bereitwilliger angenommen als das einer Lehrkraft, weil es weniger Bewertungsgewicht trägt.
Selbstbeurteilung und Selbstregulation
Selbstbeurteilung ist die wirksamste Komponente von AfL, weil sie die Gewohnheit aufbaut, das eigene Verständnis unabhängig von der Lehrkraft zu überprüfen. Zu den Techniken zählen Ampel-Selbsteinschätzung (Rot: Ich verstehe es nicht; Gelb: Ich bin unsicher; Grün: Ich verstehe es), Reflexionstagebücher und strukturierte Selbstbewertung anhand von Erfolgskriterien. Mit der Zeit entwickelt Selbstbeurteilung metakognitive Bewusstheit — Lernende, die ihr eigenes Verständnis treffend einschätzen können, sind besser in der Lage, ihr eigenes Lernen zu steuern.
Anwendung im Unterricht
Exit Tickets (alle Jahrgangsstufen)
Ein Exit Ticket ist eine kurze schriftliche Antwort auf eine gezielte Frage, die in den letzten drei bis fünf Minuten des Unterrichts verfasst und vor dem Verlassen des Raumes abgegeben wird. Eine Naturwissenschaftslehrkraft könnte fragen: „Zeichne und beschrifte den Wasserkreislauf. Kreise die Phase ein, bei der du dir am wenigsten sicher bist." Die Lehrkraft sichtet die Tickets vor der nächsten Stunde, sortiert sie in drei Stapel (solides Verständnis, teilweises Verständnis, Fehlvorstellung) und passt den Einstieg der nächsten Stunde entsprechend an. Exit Tickets kosten nahezu keine Unterrichtszeit und liefern mehr diagnostische Informationen als Abschlusstests — weil sie ankommen, solange eine Korrektur noch möglich ist.
Think-Pair-Share als AfL-Instrument
Think-Pair-Share wird häufig als Aktivierungstechnik beschrieben, funktioniert aber bei gezieltem Einsatz als formatives Beurteilungsinstrument. In der „Share"-Phase hört die Lehrkraft nicht auf richtige Antworten, sondern auf die Bandbreite des Denkens im Raum. Eine Geschichtslehrkraft, die Think-Pair-Share zu den Ursachen des Ersten Weltkriegs einsetzt, hört in vier Minuten fünf bis acht verschiedene Erklärungen — genug, um zu erkennen, ob Schülerinnen und Schüler unmittelbare und strukturelle Ursachen verwechseln, ob sie die zugewiesenen Quellen heranziehen und welche Paare eine direkte Intervention benötigen, bevor es weitergeht.
Gallery Walk zur Echtzeitdiagnose
Ein Gallery Walk hängt Schülerarbeiten oder Aufgabenstellungen im Raum aus und lässt Lernende rotieren, um zu lesen, zu kommentieren und aufeinander aufzubauen. Für die Lehrkraft entsteht eine verteilte Darstellung des Verständnisses, die in wenigen Minuten überblickt werden kann. Eine Mathematiklehrkraft, die sechs verschiedene Schülerlösungsansätze für dieselbe Algebraaufgabe aushängt, kann den Gallery Walk nutzen, um eine Klassendiskussion darüber zu eröffnen, warum drei Ansätze funktionieren und drei nicht — ohne einzelne Schülerinnen und Schüler herauszugreifen. So werden Fehlvorstellungen im großen Maßstab, in einem risikoarmen Format, sichtbar.
Chalk-Talk für schriftliche formative Evidenz
Chalk-Talk ist eine stille, schriftliche Diskussion, bei der Schülerinnen und Schüler auf eine zentrale, auf Packpapier oder einem Whiteboard notierte Frage reagieren. Da alle Beiträge sichtbar sind, kann die Lehrkraft das kollektive Verständnis der Klasse auf einen Blick erfassen und gezielte Nachfragen direkt auf dem Papier ergänzen. Anders als bei verbalen Diskussionen entsteht bei Chalk-Talk ein dauerhaftes Artefakt, das fotografiert und ausgewertet werden kann. Es eignet sich besonders gut für Themen, bei denen Schülerinnen und Schüler zögern, laut zu sprechen (kontroverse Themen, Bereiche, in denen sie Fehler fürchten), sowie für Klassen, in denen einige wenige dominante Stimmen leisere Schülerinnen und Schüler verdrängen.
Forschungslage
Black und Wiliams grundlegende Überblicksstudie von 1998 legte das Fundament: In 250 Studien übertrafen Klassen, die formative Beurteilungsverfahren einsetzten, Kontrollklassen konsistent um 0,4 bis 0,7 Standardabweichungen. Die Studie war bemerkenswert in ihrer Reichweite und zog aus vielfältigen nationalen Kontexten, Jahrgangsstufen und Fächern.
John Hatties Visible-Learning-Projekt (2009), eine Meta-Analyse von über 800 Meta-Analysen mit Daten von 80 Millionen Schülerinnen und Schülern, ordnet formativer Beurteilung eine Effektstärke von 0,90 zu — weit über dem Schwellenwert von 0,40, den Hattie als „Angelpunkt" für ein Jahr erwartetes Wachstum definiert. Feedback erreicht spezifisch einen Wert von 0,73. Das sind die höchsten Effektstärken unter allen untersuchten Unterrichtsinterventionen, einschließlich Technologieeinsatz, Leistungsgruppierung und verlängerter Schulzeiten.
Eine Studie von Ruiz-Primo und Furtak (University of Colorado, 2011) beobachtete Naturwissenschaftslehrkräfte der Mittelstufe und kodierte ihr Frageverhalten im Vergleich zu Schülerlernergebnissen in Vor- und Nachtests. Lehrkräfte, die informative formative Beurteilung einsetzten — das Denken der Schülerinnen und Schüler anregend, die Evidenz erkennend und darauf reagierend — erzielten deutlich größere Lernzuwächse als jene, die dies nicht taten, selbst unter Kontrolle des Vorwissens.
Forschungen von Cowie und Bell (1999, veröffentlicht in Assessment in Education) unterschieden geplantes von interaktivem AfL. Geplantes AfL umfasst bewusst eingesetzte Instrumente (Exit Tickets, Vorerhebungen). Interaktives AfL entsteht spontan im Dialog — eine Lehrkraft, die Verwirrung in der Frage einer Schülerin oder eines Schülers hört und die Erklärung sofort anpasst. Beide erzeugen Lernzuwächse, aber interaktives AfL ist schwerer zu trainieren und hält sich nur dann aufrecht, wenn Lehrkräfte über tiefes Fachwissen und tragfähige Beziehungen zu den Lernenden verfügen.
Die ehrliche Einschränkung: Ein Großteil der AfL-Forschung stützt sich auf Selbstberichte von Lehrkräften oder kurzfristige Ergebnismessungen. Langzeitstudien zur Behaltensleistung sind seltener. Einige Meta-Analysen vermischen hochwertiges formatives Feedback mit risikoarmen Abfragen, was Effektstärken aufbläht. Die Evidenz für die Kernmechanismen von AfL ist stark; die Evidenz für spezifische Implementierungsformate ist variabler.
Häufige Missverständnisse
AfL ist nur häufigeres Testen. Häufige risikoarme Abfragen können ein Bestandteil von AfL sein, und Retrieval Practice unterstützt tatsächlich die Behaltensleistung. AfL ist jedoch nicht durch die Häufigkeit des Überprüfens definiert, sondern dadurch, was mit den Informationen geschieht. Eine Abfrage, die im Notenbuch verzeichnet und ohne Feedback zurückgegeben wird, ist kein AfL. Ein offenes Gespräch, in dem die Lehrkraft eine Frage stellt, die Antwort hört und die nächste Erklärung sofort anpasst, ist AfL — auch wenn nichts aufgeschrieben wurde.
Lernziele teilen bedeutet, das Ziel von einer Folie abzulesen. Das Aushängen von „SWBAT: Die Ursachen des Ersten Weltkriegs analysieren" erfüllt eine formale Anforderung, hilft Schülerinnen und Schülern aber nicht beim Lernen. Ein Lernziel zu teilen bedeutet, es bedeutsam zu machen: zu besprechen, wie Analyse aussieht im Unterschied zu Beschreibung, Erfolgskriterien gemeinsam mit Schülerinnen und Schülern zu entwickeln, mitten in der Stunde zum Ziel zurückzukehren, um den Fortschritt zu überprüfen. Die Worte an der Tafel sind weit weniger entscheidend als das, was Schülerinnen und Schüler als Ziel verstehen.
AfL kommt vor allem schwächeren Schülerinnen und Schülern zugute. AfL erzeugt Lernzuwächse über das gesamte Leistungsspektrum, doch die Forschung zeigt konsistent die größten Gewinne für leistungsschwächere Lernende. Das ist intuitiv nachvollziehbar: Schülerinnen und Schüler, die den Stoff bereits verstehen, sind weniger auf die Anpassungen der Lehrkraft angewiesen. AfL als Fördermaßnahme zu rahmen unterschätzt es jedoch. Leistungsstarke Schülerinnen und Schüler profitieren erheblich von Feedback, das ihr Denken über Mindesterfolgskriterien hinaus erweitert, und von Selbstbeurteilungspraktiken, die unabhängige Lerngewohnheiten aufbauen.
Verbindung zum aktiven Lernen
AfL und aktives Lernen sind sich gegenseitig verstärkende Systeme. Aktives Lernen generiert die beobachtbare Evidenz, die AfL benötigt; AfL gibt Lehrkräften einen fundierten Weg, auf das zu reagieren, was aktives Lernen sichtbar macht.
Think-Pair-Share veranschaulicht diese Beziehung. Die Technik zwingt jede Schülerin und jeden Schüler dazu, eine Antwort zu konstruieren, bevor sie die Erklärung der Lehrkraft hören — so werden Vorwissen und Fehlvorstellungen sichtbar, die sonst unsichtbar blieben. Eine Lehrkraft, die in der Pair-Phase zuhört und in der Share-Phase bestimmte Antworten gezielt aufgreift, praktiziert interaktives AfL: Sie nutzt die Evidenz, um die Richtung der Klassendiskussion in Echtzeit zu gestalten.
Chalk-Talk erzeugt ein schriftliches Protokoll kollektiven Denkens, das als formatives Artefakt fungiert. Anders als bei einer verbalen Diskussion kann die Lehrkraft das vollständige Spektrum der Schülerantworten gleichzeitig sichten, Muster im Missverständnis identifizieren und eine gezielte Folgesequenz gestalten. Die Stille von Chalk-Talk gewährleistet zudem, dass auch die ruhigsten Schülerinnen und Schüler Evidenz beisteuern — ein anhaltendes Problem bei verbalen AfL-Techniken, die selbstsichere, schnell reagierende Personen begünstigen.
Gallery Walks verwandeln Schülerarbeiten in öffentlich sichtbare Daten. Wenn Schülerinnen und Schüler ihre Überlegungen aushängen und Gleichaltrige sie kommentieren, erhält die Lehrkraft ein verteiltes Bild des Klassenverständnisses — ohne Einzelgespräche führen zu müssen. Die entstehenden Artefakte können nicht nur die nächste Stunde informieren, sondern auch aufzeigen, welche Schülerinnen und Schüler Kleingruppenförderung benötigen und welche bereit für Erweiterungsaufgaben sind.
Auf einer tieferen Ebene teilen aktives Lernen und AfL eine gemeinsame Prämisse: Schülerinnen und Schüler sind keine passiven Empfängerinnen und Empfänger von Unterricht, sondern aktive Konstrukteurinnen und Konstrukteure von Verständnis. AfL macht diese Konstruktion sichtbar; aktives Lernen schafft die Bedingungen, unter denen sie stattfindet.
Weiterführende Lektüre zur Feedback-Dimension von AfL: Feedback im Bildungswesen. Zur lernendenseitigen Komponente: Selbstbeurteilung.
Quellen
- Black, P., & Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education: Principles, Policy & Practice, 5(1), 7–74.
- Black, P., & Wiliam, D. (1998). Inside the Black Box: Raising Standards Through Classroom Assessment. King's College London School of Education.
- Assessment Reform Group. (1999). Assessment for Learning: Beyond the Black Box. University of Cambridge School of Education.
- Hattie, J. (2009). Visible Learning: A Synthesis of Over 800 Meta-Analyses Relating to Achievement. Routledge.