Was ist der Unterschied zwischen Assessment for Learning und Assessment of Learning?

Assessment of Learning (summativ) misst, was Schülerinnen und Schüler am Ende einer Einheit oder eines Kurses erreicht haben – eine Abschlussprüfung, eine Note, ein Zeugnis. Assessment for Learning (formativ) findet während des Unterrichts statt und ist darauf ausgelegt, den weiteren Verlauf zu verändern. Das Ziel ist nicht das Festhalten einer Punktzahl, sondern die Gewinnung von Informationen, auf die Lehrende und Lernende unmittelbar reagieren.

Ersetzt Assessment for Learning Noten?

Nein. AfL und summative Benotung verfolgen unterschiedliche Zwecke und koexistieren in den meisten Klassen. AfL liefert fortlaufendes Feedback, das den Unterricht leitet; Noten berichten über Leistungen im Verhältnis zu einem Standard. Viele Schulen setzen AfL intensiv während einer Einheit ein und vergeben am Ende eine einzige summative Note. Beide Systeme ergänzen sich, sie konkurrieren nicht.

Wie viel zusätzliche Zeit erfordert Assessment for Learning bei der Unterrichtsplanung?

Gut umgesetzt reduziert AfL die Zeit für Nachholunterricht, da Fehlvorstellungen früh erkannt werden – der Nettoaufwand ist oft negativ. Exit Tickets brauchen zwei bis drei Minuten zur Vorbereitung und fünf Minuten zur Auswertung. Think-Pair-Share und Cold Calling erfordern gar keine zusätzliche Planung, sie sind in die Unterrichtsdurchführung eingebettet. Der eigentliche Aufwand liegt im Formulieren klarer Lernziele und Erfolgskriterien – was eine gute Unterrichtsplanung ohnehin voraussetzt.

Funktioniert Assessment for Learning auch in großen Klassen?

Ja. Ganzklassen-Techniken wie Mini-Whiteboards, Daumen-hoch/Daumen-runter-Signale, Ampelkarten und digitale Abstimmungstools (Mentimeter, Kahoot, Google Forms) geben Lehrenden einen schnellen Überblick über die gesamte Klasse, ohne individuelle Korrekturen. Gallery Walks und Chalk-Talk erzeugen schriftliche Artefakte, die schnell auf Muster hin gesichtet werden können.

Was sagt die Forschung über die Wirkungsgröße von AfL?

Paul Black und Dylan Wiliams Überblicksstudie von 1998 über 250 Einzelstudien ergab Effektstärken zwischen 0,4 und 0,7 Standardabweichungen, was etwa 2 Monaten zusätzlichem Lernzuwachs pro Jahr entspricht. John Hatties Visible-Learning-Synthese von 2009 weist für formative Beurteilung eine Effektstärke von 0,90 aus – eine der höchsten aller untersuchten Unterrichtsinterventionen.

Assessment for Learning (AfL) - Pädagogisches Wiki

Definition

Assessment for Learning (AfL) bezeichnet die Praxis, fortlaufend während des Unterrichts Erkenntnisse über das Schülerverständnis zu gewinnen und auf deren Grundlage Lehren und Lernen in Echtzeit anzupassen. Es geht nicht darum, etwas zu messen oder festzuhalten – sondern darum, handlungsrelevante Informationen zu erzeugen, auf die sowohl Lehrende als auch Lernende zurückgreifen, um die Lücke zwischen aktuellem Stand und Lernziel zu schließen.

Die Assessment Reform Group (1999) definierte AfL als „den Prozess des Suchens und Interpretierens von Evidenz, die Lernende und Lehrende nutzen, um festzustellen, wo Lernende in ihrem Lernprozess stehen, wohin sie gelangen sollen und wie sie dieses Ziel am besten erreichen." Drei Fragen stehen im Mittelpunkt dieser Definition: Wo steht die lernende Person gerade? Wohin soll sie sich entwickeln? Was ist der beste nächste Schritt? Jede AfL-Strategie beantwortet mindestens eine davon.

AfL ist eng mit formativer Beurteilung verwandt, legt jedoch stärker den Fokus auf die Handlungsfähigkeit der Lernenden. Während formative Beurteilung jeden risikoarmen Check beschreiben kann, setzt AfL ausdrücklich voraus, dass die gewonnenen Erkenntnisse mit den Schülerinnen und Schülern geteilt und von ihnen selbst , nicht nur von der Lehrkraft , genutzt werden.

Historischer Hintergrund

Das moderne AfL-Rahmenwerk geht auf eine Überblicksstudie von Paul Black und Dylan Wiliam aus dem Jahr 1998 zurück, die beide damals am King's College London tätig waren. Ihr Aufsatz „Inside the Black Box: Raising Standards Through Classroom Assessment" synthetisierte 250 Studien aus den Jahren 1988 bis 1997 und kam zu dem Schluss, dass formative Beurteilung , bei hochwertiger Rückmeldung und aktiver Einbeziehung der Lernenden , Effektstärken von 0,4 bis 0,7 Standardabweichungen erzielte. Das entsprach in ihren Worten einer Verschiebung vom 50. Perzentil auf etwa das 65. bis 75. Perzentil.

Der Begriff „Assessment for Learning" wurde durch die Assessment Reform Group (ARG) geprägt, ein britisches Forschungskonsortium, das von 1989 bis 2010 aktiv war und u. a. Black, Wiliam, Mary James und Bethan Marshall umfasste. Ihre Publikation „Assessment for Learning: Beyond the Black Box" (1999) benannte das Konzept, grenzte es von summativer Beurteilung ab und legte zehn Prinzipien fest, die Schulen als Rahmen nutzen konnten.

Black und Wiliam folgten mit „Assessment and Classroom Learning" (1998, Assessment in Education) sowie dem praxisorientierten „Working Inside the Black Box" (2002), das konkrete Strategien einführte: Fragetechniken, lernförderndes Feedback, das Teilen von Lernzielen mit Schülerinnen und Schülern sowie Peer- und Selbstbeurteilung. Bis 2004 war AfL als offizielle Bildungspolitik in England, Schottland und Wales verankert und hatte sich auf Australien, Neuseeland, Kanada und Skandinavien ausgeweitet.

Die intellektuellen Wurzeln reichen weiter zurück als in die 1990er-Jahre. Benjamin Blooms Mastery-Learning-Modell (1968) zeigte, dass Schülerinnen und Schüler, die formative Überprüfungen und korrigierendes Feedback erhielten, bevor sie zu neuem Stoff übergingen, deutlich höhere Leistungen erzielten. Vygotskys Zone der nächsten Entwicklung (1978) lieferte die theoretische Grundlage: Wirksamer Unterricht muss die Lücke zwischen dem adressieren, was Lernende selbstständig können, und dem, was sie mit Unterstützung leisten können. AfL ist in der Praxis der Mechanismus, mit dem diese Lücke fortlaufend gefunden und geschlossen wird.

Kernprinzipien

Lernziele und Erfolgskriterien teilen

Schülerinnen und Schüler lernen effektiver, wenn sie wissen, was sie lernen sollen und wie gute Arbeit aussieht. Lernziele zu teilen („Am Ende dieser Stunde werden Sie in der Lage sein, ...") ist nicht dasselbe wie eine Aktivität anzukündigen. Erfolgskriterien beschreiben beobachtbare Belege für Verständnis: „Du kannst erklären, warum der Wasserkreislauf in tropischen Regionen schneller verläuft, und verwendest dabei mindestens zwei Wettervariablen." Wenn Schülerinnen und Schüler diesen Maßstab selbst verinnerlichen, können sie ihren eigenen Fortschritt beobachten, anstatt die Erwartungen der Lehrkraft zu erraten.

Unterrichtsfragen, die Erkenntnisse generieren

Fragen auf einfachem Reproduktionsniveau („In welchem Jahr begann die Französische Revolution?") bestätigen das Gedächtnis, offenbaren aber kein Verständnis. AfL erfordert Fragen, die Denkvorgänge sichtbar machen: „Warum glauben Sie, war der Dritte Stand volatiler als der Zweite?" Techniken wie Wartezeit (mindestens drei Sekunden nach dem Stellen einer Frage), zufälliges Cold Calling und die No-Hands-Up-Regel sorgen dafür, dass Erkenntnisse von allen Schülerinnen und Schülern stammen , nicht nur von denjenigen, die sich freiwillig melden. Das Ziel ist diagnostisches Datenmaterial, keine Vorführung.

Feedback, das Lernen vorantreibt

Wirksames Feedback im Rahmen von AfL zeigt Lernenden konkret auf, was sie gut gemacht haben, was verbessert werden muss und wie die Verbesserung gelingen kann. Forschungsergebnisse von Kluger und DeNisi (1996), die 2.500 Experimente umfassten, stellten fest, dass Feedback, das sich auf die Aufgabe und den nächsten Schritt konzentriert, die Leistung zuverlässig steigerte; Feedback, das auf die Person gerichtet war (Noten, Lob, Ego), verschlechterte sie häufig. Feedback im Bildungswesen fungiert als Unterricht, nicht als Bewertung. Kommentare wie „Dein Argument ist klar, aber du hast nur eine Quelle zitiert , finde eine weitere, die deine These aus einer anderen Perspektive stützt" geben der lernenden Person eine konkrete Handlungsmöglichkeit.

Peer-Beurteilung

Schülerinnen und Schüler, die die Arbeit anderer beurteilen, festigen ihr eigenes Verständnis der Erfolgskriterien und liefern gleichzeitig Rückmeldungen für ihre Mitschülerinnen und Mitschüler. Dylan Wiliam betont, dass Peer-Beurteilung explizites Training erfordert: Lernende müssen lernen, spezifisches, aufgabenbezogenes Feedback zu geben, anstatt allgemeines Lob oder Kritik zu äußern. Die soziale Dimension bietet einen zusätzlichen Vorteil: Feedback von Gleichaltrigen wird oft bereitwilliger angenommen als das einer Lehrkraft, weil es weniger Bewertungsgewicht trägt.

Selbstbeurteilung und Selbstregulation

Selbstbeurteilung ist die wirksamste Komponente von AfL, weil sie die Gewohnheit aufbaut, das eigene Verständnis unabhängig von der Lehrkraft zu überprüfen. Zu den Techniken zählen Ampel-Selbsteinschätzung (Rot: Ich verstehe es nicht; Gelb: Ich bin unsicher; Grün: Ich verstehe es), Reflexionstagebücher und strukturierte Selbstbewertung anhand von Erfolgskriterien. Mit der Zeit entwickelt Selbstbeurteilung metakognitive Bewusstheit , Lernende, die ihr eigenes Verständnis treffend einschätzen können, sind besser in der Lage, ihr eigenes Lernen zu steuern.

Anwendung im Unterricht

Exit Tickets (alle Jahrgangsstufen)

Ein Exit Ticket ist eine kurze schriftliche Antwort auf eine gezielte Frage, die in den letzten drei bis fünf Minuten des Unterrichts verfasst und vor dem Verlassen des Raumes abgegeben wird. Eine Naturwissenschaftslehrkraft könnte fragen: „Zeichne und beschrifte den Wasserkreislauf. Kreise die Phase ein, bei der du dir am wenigsten sicher bist." Die Lehrkraft sichtet die Tickets vor der nächsten Stunde, sortiert sie in drei Stapel (solides Verständnis, teilweises Verständnis, Fehlvorstellung) und passt den Einstieg der nächsten Stunde entsprechend an. Exit Tickets kosten nahezu keine Unterrichtszeit und liefern mehr diagnostische Informationen als Abschlusstests , weil sie ankommen, solange eine Korrektur noch möglich ist.

Think-Pair-Share wird häufig als Aktivierungstechnik beschrieben, funktioniert aber bei gezieltem Einsatz als formatives Beurteilungsinstrument. In der „Share"-Phase hört die Lehrkraft nicht auf richtige Antworten, sondern auf die Bandbreite des Denkens im Raum. Eine Geschichtslehrkraft, die Think-Pair-Share zu den Ursachen des Ersten Weltkriegs einsetzt, hört in vier Minuten fünf bis acht verschiedene Erklärungen , genug, um zu erkennen, ob Schülerinnen und Schüler unmittelbare und strukturelle Ursachen verwechseln, ob sie die zugewiesenen Quellen heranziehen und welche Paare eine direkte Intervention benötigen, bevor es weitergeht.

Gallery Walk zur Echtzeitdiagnose

Ein Gallery Walk hängt Schülerarbeiten oder Aufgabenstellungen im Raum aus und lässt Lernende rotieren, um zu lesen, zu kommentieren und aufeinander aufzubauen. Für die Lehrkraft entsteht eine verteilte Darstellung des Verständnisses, die in wenigen Minuten überblickt werden kann. Eine Mathematiklehrkraft, die sechs verschiedene Schülerlösungsansätze für dieselbe Algebraaufgabe aushängt, kann den Gallery Walk nutzen, um eine Klassendiskussion darüber zu eröffnen, warum drei Ansätze funktionieren und drei nicht , ohne einzelne Schülerinnen und Schüler herauszugreifen. So werden Fehlvorstellungen im großen Maßstab, in einem risikoarmen Format, sichtbar.

Chalk-Talk für schriftliche formative Evidenz

Chalk-Talk ist eine stille, schriftliche Diskussion, bei der Schülerinnen und Schüler auf eine zentrale, auf Packpapier oder einem Whiteboard notierte Frage reagieren. Da alle Beiträge sichtbar sind, kann die Lehrkraft das kollektive Verständnis der Klasse auf einen Blick erfassen und gezielte Nachfragen direkt auf dem Papier ergänzen. Anders als bei verbalen Diskussionen entsteht bei Chalk-Talk ein dauerhaftes Artefakt, das fotografiert und ausgewertet werden kann. Es eignet sich besonders gut für Themen, bei denen Schülerinnen und Schüler zögern, laut zu sprechen (kontroverse Themen, Bereiche, in denen sie Fehler fürchten), sowie für Klassen, in denen einige wenige dominante Stimmen leisere Schülerinnen und Schüler verdrängen.

Forschungslage

Black und Wiliams grundlegende Überblicksstudie von 1998 legte das Fundament: In 250 Studien übertrafen Klassen, die formative Beurteilungsverfahren einsetzten, Kontrollklassen konsistent um 0,4 bis 0,7 Standardabweichungen. Die Studie war bemerkenswert in ihrer Reichweite und zog aus vielfältigen nationalen Kontexten, Jahrgangsstufen und Fächern.

John Hatties Visible-Learning-Projekt (2009), eine Meta-Analyse von über 800 Meta-Analysen mit Daten von 80 Millionen Schülerinnen und Schülern, ordnet formativer Beurteilung eine Effektstärke von 0,90 zu , weit über dem Schwellenwert von 0,40, den Hattie als „Angelpunkt" für ein Jahr erwartetes Wachstum definiert. Feedback erreicht spezifisch einen Wert von 0,73. Das sind die höchsten Effektstärken unter allen untersuchten Unterrichtsinterventionen, einschließlich Technologieeinsatz, Leistungsgruppierung und verlängerter Schulzeiten.

Eine Studie von Ruiz-Primo und Furtak (University of Colorado, 2011) beobachtete Naturwissenschaftslehrkräfte der Mittelstufe und kodierte ihr Frageverhalten im Vergleich zu Schülerlernergebnissen in Vor- und Nachtests. Lehrkräfte, die informative formative Beurteilung einsetzten , das Denken der Schülerinnen und Schüler anregend, die Evidenz erkennend und darauf reagierend , erzielten deutlich größere Lernzuwächse als jene, die dies nicht taten, selbst unter Kontrolle des Vorwissens.

Forschungen von Cowie und Bell (1999, veröffentlicht in Assessment in Education) unterschieden geplantes von interaktivem AfL. Geplantes AfL umfasst bewusst eingesetzte Instrumente (Exit Tickets, Vorerhebungen). Interaktives AfL entsteht spontan im Dialog , eine Lehrkraft, die Verwirrung in der Frage einer Schülerin oder eines Schülers hört und die Erklärung sofort anpasst. Beide erzeugen Lernzuwächse, aber interaktives AfL ist schwerer zu trainieren und hält sich nur dann aufrecht, wenn Lehrkräfte über tiefes Fachwissen und tragfähige Beziehungen zu den Lernenden verfügen.

Die ehrliche Einschränkung: Ein Großteil der AfL-Forschung stützt sich auf Selbstberichte von Lehrkräften oder kurzfristige Ergebnismessungen. Langzeitstudien zur Behaltensleistung sind seltener. Einige Meta-Analysen vermischen hochwertiges formatives Feedback mit risikoarmen Abfragen, was Effektstärken aufbläht. Die Evidenz für die Kernmechanismen von AfL ist stark; die Evidenz für spezifische Implementierungsformate ist variabler.

Häufige Missverständnisse

Verbindung zum aktiven Lernen

AfL und aktives Lernen sind sich gegenseitig verstärkende Systeme. Aktives Lernen generiert die beobachtbare Evidenz, die AfL benötigt; AfL gibt Lehrkräften einen fundierten Weg, auf das zu reagieren, was aktives Lernen sichtbar macht.

Think-Pair-Share veranschaulicht diese Beziehung. Die Technik zwingt jede Schülerin und jeden Schüler dazu, eine Antwort zu konstruieren, bevor sie die Erklärung der Lehrkraft hören , so werden Vorwissen und Fehlvorstellungen sichtbar, die sonst unsichtbar blieben. Eine Lehrkraft, die in der Pair-Phase zuhört und in der Share-Phase bestimmte Antworten gezielt aufgreift, praktiziert interaktives AfL: Sie nutzt die Evidenz, um die Richtung der Klassendiskussion in Echtzeit zu gestalten.

Chalk-Talk erzeugt ein schriftliches Protokoll kollektiven Denkens, das als formatives Artefakt fungiert. Anders als bei einer verbalen Diskussion kann die Lehrkraft das vollständige Spektrum der Schülerantworten gleichzeitig sichten, Muster im Missverständnis identifizieren und eine gezielte Folgesequenz gestalten. Die Stille von Chalk-Talk gewährleistet zudem, dass auch die ruhigsten Schülerinnen und Schüler Evidenz beisteuern , ein anhaltendes Problem bei verbalen AfL-Techniken, die selbstsichere, schnell reagierende Personen begünstigen.

Gallery Walks verwandeln Schülerarbeiten in öffentlich sichtbare Daten. Wenn Schülerinnen und Schüler ihre Überlegungen aushängen und Gleichaltrige sie kommentieren, erhält die Lehrkraft ein verteiltes Bild des Klassenverständnisses , ohne Einzelgespräche führen zu müssen. Die entstehenden Artefakte können nicht nur die nächste Stunde informieren, sondern auch aufzeigen, welche Schülerinnen und Schüler Kleingruppenförderung benötigen und welche bereit für Erweiterungsaufgaben sind.

Auf einer tieferen Ebene teilen aktives Lernen und AfL eine gemeinsame Prämisse: Schülerinnen und Schüler sind keine passiven Empfängerinnen und Empfänger von Unterricht, sondern aktive Konstrukteurinnen und Konstrukteure von Verständnis. AfL macht diese Konstruktion sichtbar; aktives Lernen schafft die Bedingungen, unter denen sie stattfindet.

Weiterführende Lektüre zur Feedback-Dimension von AfL: Feedback im Bildungswesen. Zur lernendenseitigen Komponente: Selbstbeurteilung.

Quellen

Black, P., & Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education: Principles, Policy & Practice, 5(1), 7–74.
Black, P., & Wiliam, D. (1998). Inside the Black Box: Raising Standards Through Classroom Assessment. King's College London School of Education.
Assessment Reform Group. (1999). Assessment for Learning: Beyond the Black Box. University of Cambridge School of Education.
Hattie, J. (2009). Visible Learning: A Synthesis of Over 800 Meta-Analyses Relating to Achievement. Routledge.

Assessment for Learning (AfL)

Definition

Historischer Hintergrund

Kernprinzipien

Lernziele und Erfolgskriterien teilen

Unterrichtsfragen, die Erkenntnisse generieren

Feedback, das Lernen vorantreibt

Peer-Beurteilung

Selbstbeurteilung und Selbstregulation

Anwendung im Unterricht

Exit Tickets (alle Jahrgangsstufen)

Gallery Walk zur Echtzeitdiagnose

Chalk-Talk für schriftliche formative Evidenz

Forschungslage

Häufige Missverständnisse

Verbindung zum aktiven Lernen

Quellen

Häufig Gestellte Fragen

Verwandte Konzepte

Verwandte Artikel

25+ Strategien für formative Leistungsbewertung zur Förderung des Lernerfolgs

50+ kreative Exit-Ticket-Ideen: Strategien für die formative Leistungsbewertung

Warum kompetenzorientierter Unterricht die klassische Wissensvermittlung ablöst

Verwandte Methoden

Ich-Du-Wir (Denken-Austauschen-Vorstellen)

Stummes Schreibgespräch

Museumsgang

Definition

Historischer Hintergrund

Kernprinzipien

Lernziele und Erfolgskriterien teilen

Unterrichtsfragen, die Erkenntnisse generieren

Feedback, das Lernen vorantreibt

Peer-Beurteilung

Selbstbeurteilung und Selbstregulation

Anwendung im Unterricht

Exit Tickets (alle Jahrgangsstufen)

Think-Pair-Share als AfL-Instrument

Gallery Walk zur Echtzeitdiagnose

Chalk-Talk für schriftliche formative Evidenz

Forschungslage

Häufige Missverständnisse

Verbindung zum aktiven Lernen

Quellen

Häufig Gestellte Fragen

Verwandte Konzepte

Verwandte Artikel

25+ Strategien für formative Leistungsbewertung zur Förderung des Lernerfolgs

50+ kreative Exit-Ticket-Ideen: Strategien für die formative Leistungsbewertung

Warum kompetenzorientierter Unterricht die klassische Wissensvermittlung ablöst

Verwandte Methoden

Ich-Du-Wir (Denken-Austauschen-Vorstellen)

Stummes Schreibgespräch

Museumsgang