Definition

Erfolgskriterien sind explizite Beschreibungen dessen, was Schülerinnen und Schüler tun, erstellen oder vorführen müssen, um zu zeigen, dass sie ein Lernziel erreicht haben. Während ein Lernziel das Reiseziel benennt („Die Schülerinnen und Schüler verstehen den Wasserkreislauf"), beschreiben Erfolgskriterien den Ankunftsbeweis: was eine Schülerin oder ein Schüler sagen, schreiben, zeichnen, erklären oder zeigen kann, um nachzuweisen, dass das Verstehen erreicht wurde.

Diese Unterscheidung ist bedeutsam. Ziele existieren auf der Ebene der Planungsabsicht der Lehrkraft. Kriterien existieren auf der Ebene der beobachtbaren Ergebnisse der Lernenden. Wenn Kriterien klar sind, können Schülerinnen und Schüler ihren eigenen Fortschritt während einer Aufgabe beobachten, sich vor der Abgabe selbst korrigieren und gezielt Hilfe suchen statt vage Bestätigung. Sind Kriterien nicht vorhanden oder bleiben sie implizit, weiß nur die Lehrkraft, wie „gut" aussieht — ein struktureller Nachteil, der Schülerinnen und Schüler, denen das kulturelle Kapital fehlt, akademische Erwartungen selbst zu entschlüsseln, überproportional trifft.

Erfolgskriterien können produktorientiert (ein fertiges Erzeugnis beschreibend), prozessorientiert (Schritte oder Strategien beschreibend) oder einstellungsbezogen (kollaborative Verhaltensweisen oder Denkhaltungen beschreibend) sein. In der Praxis kombinieren die meisten wirksamen Unterrichtseinheiten mindestens zwei dieser Typen.

Historischer Kontext

Der systematische Einsatz von Erfolgskriterien im Unterricht entwickelte sich aus der Bewegung für beurteilungsbasiertes Lernen, die Ende der 1990er Jahre Fahrt aufnahm. Paul Black und Dylan Wiliams 1998er Übersichtsarbeit „Inside the Black Box", veröffentlicht vom King's College London, fasste Belege aus 250 Studien zusammen und kam zu dem Schluss, dass formative Beurteilungspraktiken — einschließlich der transparenten Vermittlung von Lernzielen an Schülerinnen und Schüler — Effektstärken zwischen 0,4 und 0,7 erzielten, zu den höchsten aller in diesem Umfang untersuchten pädagogischen Interventionen.

Shirley Clarke, eine britische Forscherin und Praktikerin, die eng mit Black und Wiliam zusammenarbeitete, leistete den größten Beitrag dazu, Erfolgskriterien als Unterrichtspraxis zu operationalisieren. Ihr Buch von 2001 Unlocking Formative Assessment und das nachfolgende Formative Assessment in Action (2005) gaben Lehrkräften konkrete Rahmenpläne zum Schreiben, Teilen und gemeinsamen Entwickeln von Kriterien mit Lernenden. Clarke führte das Begriffspaar „Lernabsichten und Erfolgskriterien" (LISC) ein, das in britischen, australischen und neuseeländischen Klassenzimmern in den 2000er Jahren zum Standardvokabular wurde.

John Hatties Visible Learning-Synthese (2009), die sich auf über 800 Metaanalysen stützt, ordnete „Lehrerklarheit" — deren Kernkomponente explizite Erfolgskriterien sind — eine Effektstärke von 0,75 zu, deutlich über Hatties Schwellenwert von 0,40 für bedeutsame Wirkung. Dies verlieh der Praxis eine starke empirische Grundlage zu einem Zeitpunkt, als evidenzbasiertes Lehren institutionell an Bedeutung gewann. Die Arbeit von Jan Chappuis, insbesondere Seven Strategies of Assessment for Learning (2009, Educational Testing Service), erweiterte die Anwendung von Erfolgskriterien auf nordamerikanische Kontexte und verband sie direkt mit der Selbsteinschätzung der Lernenden.

Grundprinzipien

Kriterien müssen beobachtbar und überprüfbar sein

Ein Erfolgskriterium ist nur dann funktional, wenn eine Schülerin, ein Schüler oder eine Lehrkraft eine Arbeit betrachten und feststellen kann, ob es erfüllt wurde. „Shakespeare verstehen" besteht diesen Test nicht. „Erklären, wie Iagos Gebrauch des Aparte dramatische Ironie für das Publikum erzeugt" besteht ihn. Die entscheidende Frage beim Formulieren von Kriterien lautet: Könnte eine Zwölfjährige oder ein Zwölfjähriger sich ohne Rücksprache mit der Lehrkraft selbst daran messen? Wenn die Antwort Nein lautet, ist das Kriterium noch auf der Ebene der Absicht der Lehrkraft formuliert, nicht auf der Ebene der Evidenz der Lernenden.

Kriterien sind von Aufgaben zu unterscheiden

Ein häufiger Fehler ist die Verwechslung der Aufgabe („Schreibe einen Überzeugungsbrief") mit den Erfolgskriterien dafür. Aufgaben beschreiben, was Schülerinnen und Schüler tun werden. Kriterien beschreiben die Qualitäten, die eine Arbeit aufweisen muss. Dieselbe Aufgabe kann verschiedenen Kriteriensätzen dienen, je nachdem, was die Unterrichtsstunde priorisiert: An einem Tag könnten die Kriterien auf strukturelle Elemente fokussieren (These, Beweis, Gegenargument); an einem anderen auf Sprachwahl (Modalverben, wertungsgeladenes Vokabular). Diese Unterscheidung klar zu halten verhindert, dass Kriterien zu einer Checkliste prozeduraler Schritte anstatt zu Qualitätsbeschreibungen werden.

Kriterien sollten vor Arbeitsbeginn geteilt werden

Kriterien, die erst nach einer Aufgabe geteilt werden, verfallen zu einem Bewertungsschema. Ihr pädagogischer Wert liegt vollständig darin, Lernenden ein kognitives Ziel zu geben, während sie noch Entscheidungen treffen. Forschungsarbeiten von Clarke (2005) zeigten, dass Schülerinnen und Schüler in Klassen, wo Kriterien vor der Aufgabe geteilt wurden, signifikant häufiger Selbstkorrekturen während der Aufgabe vornahmen und zielgerichteteres Peer-Feedback lieferten als Schülerinnen und Schüler, die Kriterien erst bei der Abgabe erhielten.

Gemeinsame Entwicklung fördert metakognitive Eigenverantwortung

Schülerinnen und Schüler, die an der Entwicklung von Erfolgskriterien mitwirken, entwickeln ein stärkeres metakognitives Bewusstsein dafür, wie Qualität aussieht. Eine verbreitete Routine zur gemeinsamen Entwicklung: Die Lehrkraft präsentiert zwei oder drei anonyme Beispiele einer abgeschlossenen Aufgabe (eines stark, eines schwach, eines mittelmäßig), bittet Lernende zu benennen, was sie voneinander unterscheidet, und moderiert eine Klassendiskussion, aus der die zugrundeliegenden Kriterien hervorgehen. Die Lehrkraft verfeinert und formalisiert anschließend, was die Lernenden artikulieren. Dieser Prozess dauert länger als das bloße Vorgeben von Kriterien, aber die kognitive Arbeit des Qualitätsunterscheidens baut ein übertragbares Urteilsvermögen auf, das Lernende auf künftige Aufgaben anwenden.

Kriterien müssen explizit mit dem Lernziel verknüpft sein

Jedes Kriterium sollte auf das formulierte Lernziel zurückführbar sein. Wenn ein Kriterium nicht auf ein Ziel zurückgeführt werden kann, misst es entweder etwas Irrelevantes (z. B. Sauberkeit, wenn das Ziel mathematisches Denken ist) oder es zeigt, dass das Ziel zu ungenau formuliert war. Diese Abstimmungsprüfung ist auch eine Planungsdisziplin: Das Formulieren präziser Erfolgskriterien zwingt Lehrkräfte dazu, genau zu bestimmen, was sie tatsächlich möchten, dass Lernende lernen — nicht nur, was sie tun sollen.

Unterrichtliche Anwendung

Grundschule: Frühes Schreiben, 2. Klasse

Eine Lehrkraft der zweiten Klasse, die eine Unterrichtsstunde zum Verfassen von Berichten hält, hängt drei visuelle Erfolgskriterien an der Tafel neben schülerfreundlichen Symbolen auf: eine Uhr (Ereignisse in zeitlicher Reihenfolge), eine Sprechblase (Zeitverbindungswörter verwenden: zuerst, dann, danach, schließlich) und ein Gesicht (in der ersten Person geschrieben — „Ich"). Bevor die Lernenden schreiben, liest die Lehrkraft jedes Kriterium vor, schreibt modellhaft einen Absatz ihres eigenen Berichts und bittet die Lernenden zu zeigen, wo jedes Kriterium in ihrem Text erscheint. Die Lernenden verfassen anschließend selbstständig ihren Text, nutzen eine ausgedruckte Kriterienliste zur Selbstüberprüfung und tauschen sich dann mit einer Partnerin oder einem Partner aus. Die Kriterien sind vorgegeben; die Aufgabe — ein Bericht über einen Klassenausflug — liefert den Kontext.

Mittelstufe: Analytischer Aufsatz, 8. Klasse Geschichte

Eine Geschichtslehrkraft, die Schülerinnen und Schüler auf das Schreiben einer Quellenanalyse vorbereitet, entwickelt die Kriterien gemeinsam mit der Klasse. Sie projiziert zwei anonyme Aufsätze aus einem früheren Jahrgang und fragt: „Was macht den stärkeren Aufsatz stärker?" Die Lernenden stellen fest, dass er direkt aus der Quelle zitiert, erklärt, was das Zitat zeigt (anstatt es nur zu wiederholen), und die Absicht der Autorin oder des Autors berücksichtigt. Die Lehrkraft ergänzt ein Kriterium, das die Lernenden übersehen: die Einschränkungen der Quelle angesichts des Entstehungszeitpunkts und -zwecks zu bedenken. Die abschließend vereinbarten Kriterien — zitieren, erklären, kontextualisieren, Provenienz bewerten — werden in einem gemeinsamen Dokument festgehalten. Die Lernenden beziehen sich beim Schreiben darauf und nutzen sie für schriftliches Feedback an eine Partnerin oder einen Partner.

Oberstufe: Mathematisches Problemlösen, 11. Klasse

Eine Mathematiklehrkraft setzt neben Produktkriterien auch Prozesskriterien für eine mehrstufige Wahrscheinlichkeitsaufgabe ein. Produktkriterien legen die korrekte Form der Antwort fest (exakter Bruch, vereinfacht). Prozesskriterien legen fest: zeigt alle Rechenschritte klar, benennt die angewandte Regel vor ihrer Anwendung, überprüft die Antwort anhand der Aufgabenbedingungen. Dies trennt mathematisches Denken von bloßem Rechnen und ermöglicht der Lehrkraft zu diagnostizieren, ob Fehler auf konzeptuelle Lücken oder prozedurale Fehler zurückzuführen sind — entscheidende Information für die Planung der nächsten Stunde.

Forschungsbelege

Black und Wiliams Metaübersicht von 1998 („Inside the Black Box", Phi Delta Kappan) bleibt die grundlegende Evidenzbasis. Aus der Synthese von 250 Studien schlossen sie, dass klare, mit Lernenden geteilte Lernziele — kombiniert mit regelmäßigem formativem Feedback daran — Effektstärken von 0,4 bis 0,7 erzeugten, wobei die größten Gewinne durchgängig bei leistungsschwächeren Lernenden auftraten und so Leistungslücken verringerten, anstatt lediglich Durchschnittswerte zu heben.

Hattie und Timperleys Aufsatz von 2007 „The Power of Feedback" (Review of Educational Research, 77(1), 81–112) analysierte 196 Studien mit über 6.000 Effektstärken. Ihr Modell benennt drei Feedback-Fragen: Wo gehe ich hin? Wie komme ich voran? Was als nächstes? Erfolgskriterien beantworten die erste Frage direkt, indem sie das Ziel explizit machen — eine Voraussetzung, die sie als notwendig für das Funktionieren der zweiten und dritten Feedbackfunktion identifizierten. Ohne klares Ziel ist Feedback darüber, „wie ich vorankomme", richtungslos.

Shirley Clarkes Längsschnittarbeit in britischen Grundschulen (berichtet in Formative Assessment in Action, 2005, Hodder Murray) dokumentierte qualitative und quantitative Ergebnisse in Klassen, die über drei Jahre hinweg gemeinsame LISC-Praxis einführten. Lehrkräfte berichteten, dass das Teilen von Kriterien die Zahl aufgabenfremder Verfahrensfragen verringerte („Ist das lang genug?", „Ist das richtig?") und inhaltliche Fragen zur Qualität zunahmen — ein Wandel, der erhebliche Unterrichtszeit freigab.

Eine Einschränkung ist festzuhalten: Der Großteil der Forschung zu Erfolgskriterien ist quasi-experimenteller Natur und wurde in natürlichen Unterrichtssettings durchgeführt, nicht in randomisierten kontrollierten Studien. Effektstärkenschätzungen variieren erheblich nach Fach, Altersgruppe und Art der Umsetzung. Die Forschung stützt die Praxis solide, legt aber kein optimales Format, keine optimale Häufigkeit oder Entwicklungsmethode für alle Kontexte fest.

Häufige Missverständnisse

Erfolgskriterien sind dasselbe wie Anweisungen

Lernende (und manche Lehrkräfte) verwechseln Kriterien mit den prozeduralen Schritten einer Aufgabe. „Schreibe drei Absätze, füge einen Titel ein, verwende Großbuchstaben" beschreibt das Aufgabenformat, nicht die Lernqualität. Erfolgskriterien beantworten eine andere Frage: nicht „Was muss ich tun?", sondern „Was muss meine Arbeit zeigen?" Anweisungen sind notwendig, sagen einer Schülerin oder einem Schüler aber nicht, wie gut aussieht — sondern nur, was das fertige Produkt auf oberflächlicher Ebene enthalten muss. Der Test: Kriterien sollten bedeutsam bleiben, auch wenn sich das Format der Aufgabe ändert.

Mehr Kriterien bedeutet mehr Klarheit

Acht oder zehn Kriterien für eine einzelne Aufgabe bereitzustellen hilft Lernenden selten und lähmt sie oft. Die kognitive Belastungsforschung (Sweller, 1988) ist hier direkt relevant: Wenn die Kriterienliste selbst zur Arbeitsgedächtnisbelastung wird, wenden Lernende ihre Aufmerksamkeit dem Verwalten der Liste zu anstatt ihrer Anwendung auf die Arbeit. Drei bis fünf Kriterien, priorisiert nach dem, was die Stunde am meisten wertschätzt, führen zu besseren Ergebnissen als erschöpfende Checklisten. Die Forschung zu Lehrerklarheit kommt zum selben Schluss: Spezifität und Fokus übertreffen Vollständigkeit.

Das Teilen von Kriterien mindert Herausforderung oder Kreativität

Eine hartnäckige Sorge unter Lehrkräften, besonders in Kunst und Geisteswissenschaften, ist, dass explizite Kriterien originelles Denken einschränken. Die Evidenz stützt diese Sorge nicht. Clarkes Unterrichtsforschung zeigte, dass Lernende mit klaren Qualitätskriterien für kreatives Schreiben vielfältigere und anspruchsvollere Texte produzierten — nicht weniger — weil sie verstanden, wovon und wohin sie sich bewegten. Kriterien legen den Boden fest, nicht die Decke. Das Missverständnis spiegelt meist Kriterien wider, die auf der Ebene des Formats formuliert sind („füge eine Metapher ein") statt auf der Ebene der Qualität („erzeuge ein Bild, das die Lesenden den Kontrast zwischen den beiden Ideen spüren lässt") — ein Formulierungsproblem, kein konzeptuelles Problem mit Kriterien.

Verbindung zum aktiven Lernen

Erfolgskriterien sind nicht nur ein Beurteilungswerkzeug — sie sind eine Voraussetzung für bedeutsames aktives Lernen. Schülerinnen und Schüler können keine produktive Selbsteinschätzung, kein Peer-Feedback und keine metakognitive Reflexion betreiben ohne ein gemeinsames, explizites Bild von Qualität. In dem Moment, in dem Kriterien sichtbar sind, können Lernende kognitive Arbeit leisten, die zuvor nur die Lehrkraft erledigen konnte.

In der Praxis formativer Beurteilung verankern Erfolgskriterien jede wichtige Strategie. Exit-Tickets sind nur dann bedeutsam, wenn sie an Kriterien geknüpft sind, anhand derer Lernende sich selbst einschätzen können. Peer-Feedback wird substanziell, wenn beide Seiten eine gemeinsame Sprache für Qualität teilen. Selbstregulation — die Fähigkeit, die eigene Arbeit zu beobachten, zu bewerten und anzupassen — hängt davon ab, ein verinnerlichtes Modell davon zu haben, wie „gut" aussieht, das Kriterien im Laufe der Zeit helfen aufzubauen.

Die Verbindung zu spezifischen Methoden des aktiven Lernens ist direkt. Beim Think-Pair-Share fokussiert die vorherige Selbsteinschätzung anhand von Kriterien die Paardiskussion auf inhaltliche Lücken statt auf prozedurale Verwirrung. Beim projektbasierten Lernen legen gemeinsam entwickelte Erfolgskriterien zum Projektstart gemeinsame Standards fest, anhand derer Teams Prototypen und Entwürfe im gesamten Untersuchungszyklus bewerten können. Im Sokratischen Seminar machen Diskussionskriterien (z. B. „baut auf dem Beitrag einer vorherigen Sprecherin oder eines vorherigen Sprechers auf", „nutzt Belege aus dem Text") die Verhaltensstandards qualitätsvollen akademischen Diskurses sichtbar und selbstbewertbar für Lernende, die in diesem Register noch nicht sicher sind.

Die Beziehung zwischen Erfolgskriterien und Lernzielen ist architektonisch: Ziele definieren das beabsichtigte Lernen; Kriterien definieren dessen Evidenz. Gemeinsam bilden sie das, was Hattie das „sichtbare" Element des sichtbaren Lernens nennt — einen Unterrichtsraum, in dem sowohl Lehrkraft als auch Lernende artikulieren können, wohin das Lernen geht und wie es aussehen wird, wenn es angekommen ist.

Quellen

  1. Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. Phi Delta Kappan, 80(2), 139–148.

  2. Clarke, S. (2005). Formative Assessment in Action: Weaving the Elements Together. Hodder Murray.

  3. Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81–112.

  4. Chappuis, J. (2009). Seven Strategies of Assessment for Learning. Educational Testing Service.