Definition

Abrufübung bezeichnet den bewussten Akt, Informationen aus dem Gedächtnis abzurufen, anstatt sie schlicht erneut zu lesen oder sich ihnen passiv auszusetzen. Jedes Mal, wenn eine lernende Person ein Wissenselement erfolgreich abruft, werden die neuronalen Bahnen, die diese Erinnerung stützen, gestärkt — künftiger Abruf wird schneller und zuverlässiger. Das Vergessen, das zwischen Lerneinheiten auftritt, ist keine verschwendete Zeit; es erzeugt eine wünschenswerte Schwierigkeit, die der Abrufakt anschließend auflöst und vertieft.

Das Phänomen wird auch als Testeffekt oder Abrufübungseffekt bezeichnet. Der entscheidende Unterschied liegt darin, dass Abrufübung keine Leistungsmessung ist. Sie ist eine Lernstrategie, ein Unterrichtswerkzeug und eine Unterrichtsroutine. Die Note, die eine Schülerin oder ein Schüler für ein Quiz erhält, ist für den Lernprozess weit weniger bedeutsam als der Akt, Antworten aus dem Gedächtnis zu erzeugen.

Abrufübung gehört zu einer Familie evidenzbasierter Lernstrategien, die bisweilen unter dem Begriff „wünschenswerte Schwierigkeiten" zusammengefasst werden — Bedingungen, die den sichtbaren Fortschritt kurzfristig verlangsamen, die Langzeitbehaltensleistung und den Transfer jedoch dramatisch verbessern (Bjork, 1994). Lehrende, die diesen Unterschied verstehen, hören auf, niedrigschwelliges Abfragen als Bestrafung zu betrachten, und beginnen, es als eine der wirkungsvollsten Unterrichtsmaßnahmen wahrzunehmen, die ihnen zur Verfügung stehen.

Historischer Kontext

Die Beobachtung, dass Testen das Lernen verbessert, geht um mehr als ein Jahrhundert über die moderne kognitive Psychologie hinaus. Im Jahr 1909 stellte Mary Whiton Calkins, die erste weibliche Präsidentin der American Psychological Association, unterschiedliche Behaltensleistungen zwischen aktivem Abruf und passiver Wiederholung fest. Die systematische wissenschaftliche Untersuchung der Abrufübung beginnt jedoch mit E.L. Thorndike, dessen Experimente an der Columbia University 1914 zeigten, dass Schülerinnen und Schüler, die mehr Zeit damit verbrachten, aus dem Gedächtnis zu rezitieren, diejenigen übertrafen, die dieselbe Zeit mit Lesen verbrachten.

Das Konzept blieb im Mainstream der Bildungsforschung während eines Großteils des zwanzigsten Jahrhunderts weitgehend latent, überlagert von konstruktivistischen Ansätzen, die sich auf die Bedingungen des Erstlernens konzentrierten. Der Aufschwung kam mit den Arbeiten von Henry Roediger und Jeff Karpicke an der Washington University in St. Louis. Ihre wegweisende Studie aus dem Jahr 2006 in Science zeigte, dass Studierende, die einen Text lernten und anschließend Abrufübungen absolvierten, eine Woche später 80 % des Materials behalten hatten, verglichen mit 36 % bei Studierenden, die ausschließlich wiederholtes Lesen nutzten. Diese Lücke — mehr als doppelte Behaltensleistung — machte es unmöglich, Abrufübung zu ignorieren.

Seit 2006 hat sich das Forschungsfeld rasch ausgeweitet. Pooja Agarwal, eine ehemalige Studentin von Roediger, gründete die gemeinnützige Organisation RetrievalPractice.org mit und führte klassenbasierte Studien durch, die den Effekt in K–12-Kontexten bestätigten. Die 2018 entstandene Zusammenarbeit zwischen Agarwal und der Lehrerin Patrice Bain mündete in Powerful Teaching, einer praxisorientierten Synthese, die jahrzehntelange Laborbefunde in Unterrichtsstrategien übersetzt. Abrufübung erscheint heute in jeder bedeutenden Übersicht evidenzbasierter Unterrichtspraktiken, darunter dem Teaching and Learning Toolkit der Education Endowment Foundation, wo sie als eine der wirkungsstärksten und kostengünstigsten verfügbaren Interventionen eingestuft wird.

Schlüsselprinzipien

Abruf muss generativ sein

Der Gedächtnisnutzen entsteht durch das Erzeugen einer Antwort, nicht durch deren Wiedererkennen. Multiple-Choice-Fragen erzeugen zwar einen gewissen Abrufnutzen, doch freie Wiedergabe — alles Erinnerte aufschreiben, ein Diagramm von Grund auf rekonstruieren, ein Konzept ohne Notizen erklären — erzeugt wesentlich mehr. Der mentale Aufwand, eine Antwort zu suchen und zu konstruieren, ist genau das, was den Lerneffekt antreibt. Passive Wiederholung (erneutes Lesen, erneutes Anschauen, Markieren) fühlt sich produktiv an, führt jedoch zu wenig dauerhaftem Lernen, weil sie keine Erzeugungsleistung erfordert.

Schwierigkeit ist ein Merkmal, kein Fehler

Abruf, der Anstrengung erfordert, erzeugt langfristig größere Gewinne als müheloser Abruf. Dieser kontraintuitive Befund bedeutet, dass Lehrende Abrufaktivitäten so gestalten sollten, dass sie Schülerinnen und Schüler herausfordern — nicht lediglich bestätigen, was bereits gut bekannt ist. Eine Schülerin oder ein Schüler, die oder der Mühe hat, etwas abzurufen, es dann aber schafft — oder eine falsche Antwort abruft und korrigierendes Feedback erhält — lernt aus dieser Episode mehr als eine Person, die einen gut eingeübten Fakt mühelos abruft. Kalibrieren Sie den Schwierigkeitsgrad so, dass die Lernenden an der Grenze ihres aktuellen Wissens arbeiten.

Feedback schließt den Kreislauf

Abruf ohne Feedback birgt das Risiko, Fehler zu festigen. Nach jeder Abrufaktivität müssen Schülerinnen und Schüler ihre Antworten mit korrekten Informationen abgleichen. Unmittelbares Feedback — von der Lehrperson, einer Mitschülerin oder einem Mitschüler oder einem Referenzblatt — korrigiert Fehlvorstellungen, bevor sie sich verfestigen. Forschungen von Butler und Roediger (2008) bestätigen, dass auf Abruf folgendes Feedback sowohl wiederholtes Lernen als auch ungefeedbackten Abruf bei Langzeittests übertrifft.

Verteilung verstärkt den Effekt

Der Abrufübungseffekt potenziert sich, wenn er mit verteilter Übung kombiniert wird. Gleiches Material über mehrere zeitlich getrennte Einheiten hinweg abzurufen, anstatt in einem einzigen massierten Block, erzeugt dramatisch bessere Behaltensleistung. Eine Schülerin oder ein Schüler, die oder der am 1., 4. und 15. Tag Abrufübungen durchführt, wird am Ende des Semesters weit mehr behalten als jemand, der dieselbe Gesamtzahl von Abrufversuchen in einem einzigen Lernblock absolviert.

Niedrige Stakes schützen das Lernklima

Hochstakige Benotung unterdrückt Abrufübung, indem sie Leistungsangst auslöst, die Häufigkeit und Ehrlichkeit der Abrufversuche mindert. Die Befunde zeigen, dass der Lernnutzen unabhängig davon entsteht, ob das Quiz benotet wird. Wenn Abrufaktivitäten häufig, niedrigschwellig und als Lernwerkzeug statt als Leistungsmessung gerahmt sind, engagieren sich Schülerinnen und Schüler ehrlicher und profitieren vollständiger.

Unterrichtliche Anwendung

Brain Dumps und freie Wiedergabe

Zu Beginn einer Unterrichtsstunde werden Schülerinnen und Schüler gebeten, drei Minuten lang alles aufzuschreiben, woran sie sich aus der vorigen Stunde erinnern — ohne Notizen, ohne Hinweise. Dieser „Brain Dump" oder freie Abruf macht Vorwissen sichtbar, identifiziert Lücken, bevor neuer Unterricht darauf aufbaut, und erzeugt den generativen Abruf, der die Behaltensleistung fördert. Nach den drei Minuten vergleichen Schülerinnen und Schüler ihre Notizen mit einer Partnerin oder einem Partner oder mit einer Referenz und markieren, was sie übersehen haben. Die Aktivität dauert unter fünf Minuten und erfordert keine Vorbereitungsmaterialien.

Für jüngere Schülerinnen und Schüler (Klassen 2–4) lässt sich der Brain Dump auf eine verbale Form vereinfachen: „Erzähle deiner Partnerin oder deinem Partner drei Dinge, die du aus der gestrigen Naturkundestunde weißt." Derselbe Abrufnutzen gilt; das Format sollte an die kognitiven Anforderungen der jeweiligen Altersgruppe angepasst werden.

Abrufraster und Übungskarten

In naturwissenschaftlichen Klassen oder im Geschichtsunterricht der Sekundarstufe präsentiert ein Abrufraster den Schülerinnen und Schülern eine Tabelle: Themen in der Kopfzeile, Fragetypen (definieren, erklären, anwenden) in der Seitenspalte. Die Lernenden wählen ein Feld, schreiben ihre Antwort aus dem Gedächtnis und überprüfen sie. Im Verlauf eines Semesters wächst das Raster, bis es den gesamten Kurs abdeckt. Dies macht kumulativen Abruf systematisch statt zufällig und gibt Schülerinnen und Schülern eine sichtbare Aufzeichnung dessen, was sie wissen und wo Lücken bestehen.

Übungskarten funktionieren ähnlich. Schülerinnen und Schüler schreiben auf eine Seite eine Frage, auf die andere die Antwort und arbeiten die Stapel über mehrere Einheiten hinweg durch. Entscheidend ist die zeitliche Verteilung: Richtig beantwortete Karten werden für eine Woche beiseitegelegt; falsch beantwortete werden in die nächste Einheit zurückgeführt. Dies ist das Prinzip hinter Software für das verteilte Wiederholen wie Anki, doch die physische Kartenvariante funktioniert ebenso gut und erfordert keine Technologie.

Exit-Tickets als Abrufübung

Exit-Tickets sind ein verbreitetes Werkzeug der formativen Beurteilung, doch ihre Gestaltung entscheidet darüber, ob sie Abruf aktivieren oder lediglich oberflächliche Vertrautheit prüfen. Ein Exit-Ticket, das fragt „Was war die Hauptidee der heutigen Stunde?", erfordert wenig generativen Aufwand. Ein Exit-Ticket, das fragt „Erkläre ohne Blick in deine Notizen, warum der Versailler Vertrag zu den Bedingungen beigetragen hat, die den Zweiten Weltkrieg ermöglichten", verlangt echten Abruf und erzeugt echtes Lernen. Halten Sie die Aufgabenstellung konkret, generativ und knapp genug, dass Schülerinnen und Schüler sie in drei bis vier Minuten bearbeiten können.

Forschungsbelege

Die grundlegende Abrufübungsstudie bleibt Karpicke und Roediger (2008), veröffentlicht in Science. Über vier Gruppen hinweg, die unterschiedliche Kombinationen von Lern- und Testphasen nutzten, zeigte wiederholtes Testen überlegene Behaltensleistung bei einem Follow-up nach einer Woche — unabhängig davon, ob Feedback gegeben wurde. Die Gruppe, die einmal lernte und dreimal abrief, behielt 80 % des Materials; die Gruppe, die viermal lernte, behielt 36 %. Diese Studie wurde in Dutzenden von Labors und Altersgruppen repliziert.

Agarwal, Bain und Chamberlain (2012) übertrugen die Forschung in authentische K–12-Klassenzimmer. Über sechs Wochen sozialkundlichen Unterrichts in der Mittelstufe erzielten Schülerinnen und Schüler, die regelmäßige niedrigschwellige Abrufquizze zu bereits unterrichtetem Material erhielten, eine volle Notenstufe höher in einer standardisierten Einheitsprüfung als Schülerinnen und Schüler einer verglichenen Kontrollgruppe. Entscheidend ist, dass dieser Effekt für Lernende mit hohem und niedrigem Vorwissen gleichermaßen galt und die Annahme widerlegt, Abrufübung begünstige nur leistungsstarke Lernende.

Eine Metaanalyse von Rowland (2014), die 85 Experimente auswertete, bestätigte, dass Abrufübung im Vergleich zum erneuten Lernen eine mittlere Effektstärke von 0,50 erzeugt, mit größeren Effekten für freie Wiedergabeformate und bei Tests nach längeren Verzögerungen. Effektstärken über 0,40 gelten in der Bildungsinterventionsforschung allgemein als praktisch bedeutsam.

Die Forschung benennt auch Randbedingungen, die es zu beachten gilt. Abrufübung ist weniger wirksam, wenn Schülerinnen und Schüler nur minimales Vorwissen zu einem Thema haben — Abruf setzt etwas voraus, das abgerufen werden kann. Bei völlig neuem Material, zu dem die Lernenden noch kein Schema haben, an das sie Informationen knüpfen könnten, sollte zunächst Instruktion erfolgen, bevor Abrufaktivitäten beginnen. Dies knüpft an die kognitive Lasttheorie an: Wird das Arbeitsgedächtnis bei der Erstenkodierung überlastet, bleibt nichts zum Abrufen übrig. Die Reihenfolge ist entscheidend: erst lehren, dann abrufen.

Häufige Missverständnisse

Missverständnis: Abrufübung ist nur Testen, und Testen ist stressig und demotivierend.

Hochstakige summative Prüfungen können stressig sein. Häufige, niedrigschwellige Abrufaktivitäten sind es typischerweise nicht — insbesondere wenn Lehrende sie ausdrücklich als Lernwerkzeug und nicht als Bewertungsanlass rahmen. Agarwal et al. (2014) befragten über 1.300 Mittelstufenschülerinnen und -schüler und stellten fest, dass die große Mehrheit Abrufquizze als hilfreich, fair und nicht angstauslösend empfand. Die entscheidenden Variablen sind Stakes, Häufigkeit und Rahmung — nicht der Abrufakt selbst.

Missverständnis: Wenn Schülerinnen und Schüler etwas nicht abrufen können, ist Abrufübung verschwendet.

Gescheiterter Abruf mit anschließendem Feedback erzeugt Lernen. Roedigers und Karpickes Forschung zeigt, dass der Versuch abzurufen, selbst ein erfolgloser, das Gehirn darauf vorbereitet, die korrekte Antwort effektiver zu kodieren, wenn sie anschließend gegeben wird. Dies wird als Hyperkorrektureffekt bezeichnet: Mit hoher Konfidenz gemachte Fehler, die durch Feedback korrigiert werden, werden besser behalten als richtige Antworten, die mit niedriger Konfidenz gegeben wurden. Mit dem Abruf zu ringen ist kein Scheitern; es ist der Mechanismus.

Missverständnis: Abrufübung baut nur auswendig gelernte Faktenkenntnisse auf.

Dies ist der Einwand, den Lehrende am häufigsten erheben, die sich um Tiefe des Verständnisses sorgen. Die Forschungslage stützt ihn nicht. Karpicke und Blunt (2011) verglichen Concept-Mapping mit Abrufübung beim Lernen eines Wissenschaftstextes, der Schlussfolgerung und Anwendung erforderte. Schülerinnen und Schüler in der Abrufbedingung übertrafen die Concept-Mapper sowohl bei einfachen Gedächtnisfragen als auch bei Inferenzfragen. Abruf stärkt die gesamte Wissensstruktur, nicht nur die Oberflächenfakten, weil Konzepte in Beziehung zueinander gespeichert sind und das Abrufen eines Konzepts das gesamte Netz aktiviert und stärkt.

Verbindung zum aktiven Lernen

Abrufübung ist keine passive Aktivität, die als aktives Lernen verkleidet ist. Die mentale Arbeit, Antworten aus dem Gedächtnis zu erzeugen, ist genau die Art produktiver kognitiver Anstrengung, die aktives Lernen in seiner besten Form ausmacht. Mehrere strukturierte Routinen des aktiven Lernens sind darauf ausgelegt, Abruf auf natürliche Weise zu nutzen.

Speed-Dating paart Schülerinnen und Schüler in rotierenden Eins-zu-eins-Austauschen, bei denen jede Person der anderen ein Konzept erklärt oder abfragt, bevor das Signal zum Rotieren ertönt. Jede Rotation ist ein Abrufereignis: Die Lernenden müssen Informationen aus dem Gedächtnis abrufen, um sie ohne Notizen einer neuen Partnerin oder einem neuen Partner zu erklären. Der soziale Druck, eine Gleichaltrige oder einen Gleichaltrigen zu unterrichten, ist ein niedrigschwelliger Motivator, der Engagement steigert, ohne Angst zu erzeugen.

Round-Robin erzeugt sequenziellen Abruf in einer Gruppe: Jede Person trägt ein erinnerteres Informationsstück bei, bevor die Gruppe wiederholen oder weitergeben darf. Dies sichert verteilte Beteiligung und macht Lücken im individuellen Wissen sichtbar, die die Gruppe gemeinsam aufarbeiten kann. Lehrende können beobachten, welche Konzepte bereitwillig auftauchen und bei welchen Zögern entsteht — Round-Robin ist damit zugleich ein nützliches Werkzeug der formativen Beurteilung neben seinem Abrufnutzen.

Give-One-Get-One verlangt von jeder Person, zunächst eine eigene Abrufliste zu erstellen (give one), bevor Informationen von Mitschülerinnen und Mitschülern gesammelt werden (get one). Diese Abfolge bewahrt den generativen Abrufnutzen und baut gleichzeitig auf sozialem Lernen auf. Schülerinnen und Schüler, die zuerst eine eigene Liste erstellen, behalten mehr aus dem anschließenden Peer-Austausch als solche, die lediglich umherwandern und sammeln.

Jede dieser Strukturen des aktiven Lernens wirkt, weil sie Erzeugung, nicht Wiedererkennen erfordert. Kombiniert mit bewusstem zeitlichen Verteilen über Einheiten hinweg, werden sie zur unterrichtlichen Umsetzung dessen, was die Laborforschung konsistent als die ertragreichste verfügbare Lernstrategie identifiziert hat.

Quellen

  1. Roediger, H. L., & Karpicke, J. D. (2006). Test-enhanced learning: Taking memory tests improves long-term retention. Psychological Science, 17(3), 249–255.

  2. Karpicke, J. D., & Roediger, H. L. (2008). The critical importance of retrieval for learning. Science, 319(5865), 966–968.

  3. Agarwal, P. K., Bain, P. M., & Chamberlain, R. W. (2012). The value of applied research: Retrieval practice improves classroom learning and recommendations from a teacher, a principal, and a scientist. Educational Psychology Review, 24(3), 437–448.

  4. Rowland, C. A. (2014). The effect of testing versus restudy on retention: A meta-analytic review of the testing effect. Psychological Bulletin, 140(6), 1432–1463.