Definition
Die kognitive Belastungstheorie (KBT) ist ein Rahmenmodell, das erklärt, wie das menschliche Gehirn neue Informationen verarbeitet — und warum manche didaktischen Konzepte Lernen fördern, während andere Frustration erzeugen. Ihr zentrales Argument ist klar: Das Arbeitsgedächtnis ist sowohl in seiner Kapazität als auch in seiner Dauer begrenzt. Wenn die Anforderungen beim Lernen diese Grenzen überschreiten, kann neues Wissen nicht wirksam ins Langzeitgedächtnis überführt werden.
Die Theorie unterscheidet zwei Gedächtnissysteme. Das Arbeitsgedächtnis hält jene Informationen bereit, über die gerade aktiv nachgedacht wird; es kann jedoch nur etwa vier Elemente gleichzeitig verarbeiten (Cowan, 2001) und behält diese ohne Wiederholung nur für wenige Sekunden. Das Langzeitgedächtnis ist demgegenüber praktisch unbegrenzt. Es speichert Wissen in organisierten Schemata — mentalen Strukturen, die verwandte Informationen zu einzelnen Einheiten bündeln. Wenn jemand über ein reiches Schema zu einem Thema verfügt, kann er oder sie komplexe Aufgaben bewältigen, ohne das Arbeitsgedächtnis zu überlasten, weil das Schema selbst nur als ein einziges Element zählt. Das Ziel des Unterrichts besteht nach der KBT darin, Wissen aus der Welt und aus dem Arbeitsgedächtnis in stabile, automatisierte Schemata im Langzeitgedächtnis zu überführen.
Für Lehrkräfte verschiebt dies die gesamte didaktische Perspektive. Die entscheidende Frage lautet nicht mehr „Habe ich den Stoff behandelt?", sondern „Hatten die Schülerinnen und Schüler die mentale Kapazität, diesen Stoff zu verarbeiten und zu speichern?" Zu schnelles Vorankommen, das gleichzeitige Präsentieren zu vieler Elemente oder Aufgaben, die gleichzeitig Verstehen und Ausführen verlangen, können die Grenzen des Arbeitsgedächtnisses überschreiten — und keine Menge Wiederholungslesen oder guter Absichten kann das ausgleichen.
Historischer Kontext
John Sweller, Pädagogischer Psychologe an der University of New South Wales, führte die kognitive Belastungstheorie 1988 in einem Artikel in Cognitive Science ein. Sweller stützte sich auf George Millers frühere Arbeiten zur Kapazität des Arbeitsgedächtnisses (Miller, 1956) sowie maßgeblich auf das 1974 von Alan Baddeley und Graham Hitch entwickelte Modell des Arbeitsgedächtnisses als Mehrkomponentensystem mit getrennten phonologischen und visuospatial-räumlichen Kanälen.
Swellers frühe Forschung konzentrierte sich auf den Mathematikunterricht, wo er feststellte, dass Schülerinnen und Schüler, die durchgearbeitete Beispiele studierten, mehr lernten als jene, die dieselbe Zeit damit verbrachten, gleichwertige Aufgaben zu lösen. Er schlug vor, dass Problemlösen, wenn dem Lernenden relevante Schemata fehlen, die Kapazität des Arbeitsgedächtnisses für Suchstrategien aufzehrt, anstatt das Erlernen der zugrundeliegenden Struktur zu fördern. Dies war die erste Formulierung dessen, was zum praktisch bedeutsamsten Befund der KBT werden sollte.
In den 1990er-Jahren arbeitete Sweller mit Paul Chandler und Fred Paas zusammen, um drei unterschiedliche Arten kognitiver Belastung herauszuarbeiten und den Expertise-Umkehreffekt zu entwickeln — die Beobachtung, dass Unterstützungsmaßnahmen, die Anfängerinnen und Anfängern nützen, fortgeschrittenere Lernende aktiv behindern. Forschende an der Universität Amsterdam, insbesondere Fred Paas und Jeroen van Merriënboer, erweiterten die KBT auf das Design komplexer Kompetenztrainings und entwickelten 1992 das Vier-Komponenten-Modell des didaktischen Designs (4C/ID). Um das Jahr 2000 hatte die KBT sich zu einem der meistzitierten Rahmenmodelle der Pädagogischen Psychologie entwickelt und beeinflusste die Curriculumgestaltung von Grundschulklassen bis hin zu medizinischen Ausbildungsprogrammen.
Zentrale Prinzipien
Intrinsische Belastung
Die intrinsische Belastung ist die inhärente Komplexität des Lernstoffs, die sich nach der Anzahl der Elemente richtet, die gleichzeitig verarbeitet werden müssen, um das Konzept zu verstehen. Sie wird durch den Inhalt selbst bestimmt, nicht durch die Art seiner Vermittlung. Ein Kind, das einstellige Zahlen addieren lernt, steht vor einer geringen intrinsischen Belastung; ein Kind, das chemische Gleichungen ausbalancieren lernt, steht vor einer hohen intrinsischen Belastung, weil mehrere voneinander abhängige Konzepte gleichzeitig im Geist gehalten werden müssen. Lehrkräfte können die intrinsische Belastung nicht beseitigen, aber durch eine Sequenzierung der Inhalte steuern, bei der grundlegende Schemata geformt werden, bevor komplexe Anwendungen eingeführt werden.
Extrinsische Belastung
Die extrinsische Belastung ist der kognitive Aufwand, der durch das didaktische Design und nicht durch den Inhalt selbst entsteht. Überladene Folien, Effekte durch geteilte Aufmerksamkeit (wenn Text und das zugehörige Diagramm auf einer Seite räumlich voneinander getrennt sind), redundante Informationen, die gleichzeitig in zwei Formaten präsentiert werden, sowie unklare Aufgabenstellungen erzeugen extrinsische Belastung, ohne zum Lernen beizutragen. Die extrinsische Belastung ist der Feind guten Unterrichts, weil sie die begrenzte Kapazität des Arbeitsgedächtnisses verschwendet, die eigentlich dem Verstehen gewidmet sein sollte. Die Reduzierung extrinsischer Belastung ist der direkteste Hebel, den Lehrkräfte haben, um Lernergebnisse zu verbessern.
Lernrelevante Belastung
Die lernrelevante Belastung bezeichnet die produktive geistige Arbeit, die Lernende in die Konstruktion und Automatisierung von Schemata investieren. Wenn jemand neue Informationen aktiv mit bestehendem Wissen verknüpft, Muster über Beispiele hinweg identifiziert oder Informationen abrufend übt, betreibt er oder sie lernrelevante Verarbeitung. Anders als die extrinsische Belastung ist die lernrelevante Belastung erwünscht — hier findet das eigentliche Lernen statt. Gutes didaktisches Design setzt mentale Kapazität frei, die nicht durch extrinsische Anforderungen gebunden ist, damit mehr davon lernrelevanter Verarbeitung gewidmet werden kann.
Der Expertise-Umkehreffekt
Wenn Lernende in einem Bereich Expertise entwickeln, werden ihre Schemata zunehmend automatisiert und gebündelt. Didaktische Unterstützungsmaßnahmen, die für Anfängerinnen und Anfänger unverzichtbar waren (wie durchgearbeitete Beispiele, detaillierte Schritt-für-Schritt-Anleitungen und Scaffolding), werden für Expertinnen und Experten redundant und erzeugen eine neue extrinsische Belastung, indem sie sie zwingen, nicht mehr benötigte Anleitungen neben ihren bestehenden Schemata zu verarbeiten. Dieser Expertise-Umkehreffekt bedeutet, dass Unterricht adaptiv sein muss: Die Unterstützung sollte mit wachsender Kompetenz abnehmen, nicht über einen gesamten Lernabschnitt hinweg konstant bleiben.
Schema-Automatisierung
Nachhaltiges Lernen erfordert nicht nur die Bildung von Schemata, sondern auch deren Automatisierung — damit Abruf und Anwendung so schnell werden, dass der Prozess kaum noch Kapazität im Arbeitsgedächtnis beansprucht. Automatizität setzt kognitive Ressourcen für höheres Denken frei. Eine Leserin, die jedes Wort bewusst dekodieren muss, kann nicht gleichzeitig den Sinn von Sätzen erfassen. Eine Leserin, die automatisch dekodiert, widmet das Arbeitsgedächtnis vollständig dem Sinnverstehen. Üben, das Automatisierung aufbaut, ist daher keine bloße mechanische Wiederholung; es ist der Mechanismus, durch den komplexe Leistungen möglich werden.
Anwendung im Unterricht
Durchgearbeitete Beispiele vor der eigenständigen Übungsphase
Bei jeder neuen Prozedur oder jedem neuen Aufgabentyp beginnt man mit vollständig durchgearbeiteten Beispielen, die Lernende studieren, nicht lösen. Der vollständige Lösungsweg wird gezeigt, an jedem Schritt mit Begründungen versehen. Nach zwei oder drei durchgearbeiteten Beispielen folgt der Übergang zu „Vervollständigungsaufgaben" — teils gelösten Aufgaben, bei denen die Lernenden die letzten Schritte ergänzen. Erst nach dieser Progression sollten Lernende vollständig eigenständige Aufgaben lösen. Diese Sequenz ist besonders wirksam in Mathematik, Chemie und beim Programmieren, wo die Struktur von Lösungen selbst das Lernziel darstellt.
Eine Lehrperson im 8. Schuljahr im Bereich Algebra könnte beispielsweise drei vollständig kommentierte Beispiele zum Lösen linearer Gleichungen zeigen, die Schülerinnen und Schüler durch die Überlegungen führen und anschließend Paaren einen Satz von Gleichungen geben, bei dem Schritt eins und zwei bereits ausgefüllt sind und die Lernenden Schritt drei und vier ergänzen. Die vollständige eigenständige Übung folgt, sobald das Schema sich zu formen beginnt.
Chunking und Sequenzierung in der Grundschule
In einer Lesestunde in der dritten Klasse präsentiert eine Lehrkraft, die nach den Prinzipien der KBT unterrichtet, anstatt eines komplexen Textes zusammen mit Verständnisfragen, Vokabelarbeit und Diskussion gleichzeitig diese Elemente zeitlich getrennt. Die Lernenden begegnen dem Wortschatz explizit vor der Lektüre, lesen den Text einmal ohne Unterbrechung für das Gesamtverständnis, bevor sie Verständnisfragen bearbeiten. Jede Phase zielt auf eine kognitive Anforderung zur Zeit ab und verhindert die Überlastung, die entsteht, wenn Dekodieren, Wortschabruf und Verstehen um dieselben begrenzten Arbeitsgedächtnis-Ressourcen konkurrieren.
Reduzierung von Aufmerksamkeitsteilung in Bildmaterialien
Beim Präsentieren von Diagrammen, Karten oder naturwissenschaftlichen Prozessen integriert man Beschriftungen und Erläuterungen direkt ins Diagramm, anstatt sie in einer separaten Legende oder einem Textblock darunter zu platzieren. Der Effekt der geteilten Aufmerksamkeit — bei dem Lernende einen Teil des Diagramms im Geist behalten müssen, während sie visuell nach der Erläuterung suchen — erzeugt extrinsische Belastung, ohne das Verständnis zu fördern. Eine Biologielehrkraft, die die Zellteilung präsentiert, beschriftet jede Phase direkt im Diagramm und vermeidet damit das Hin-und-Herwechseln zwischen Bild und Text. Dies schließt direkt an die Dual-Coding-Theorie an, die zeigt, dass koordinierte visuelle und verbale Informationen die Enkodierung stärken, wenn beide Kanäle integriert statt redundant präsentiert werden.
Forschungsbelege
Sweller, van Merriënboer und Paas (1998) veröffentlichten eine wegweisende Synthese in Cognitive Psychology, die ein Jahrzehnt KBT-Forschung zusammenfasste. In Studien aus Mathematik, Physik und Geometrie übertrafen durchgearbeitete Beispiele bei Anfängerinnen und Anfängern konsistent die gleichwertige Problemlösepraxis, wobei der Vorteil verschwand, sobald die Lernenden Expertise entwickelten. Die Rezension formalisierte die Drei-Typen-Taxonomie kognitiver Belastung und etablierte die KBT als kohärentes Forschungsprogramm.
Kalyuga, Ayres, Chandler und Sweller (2003) dokumentierten den Expertise-Umkehreffekt in fünf Experimenten im Educational Psychologist und zeigten, dass für Anfängerinnen und Anfänger optimale didaktische Unterstützungen (durchgearbeitete Beispiele, detaillierte Anleitungen) bei fortgeschritteneren Lernenden im Vergleich zu Minimalanleitungen signifikant schlechtere Ergebnisse produzierten. Dieser Befund hat direkte praktische Konsequenzen: Adaptiver Unterricht, der die Unterstützung mit wachsender Expertise reduziert, übertrifft feste didaktische Formate.
Paas und van Merriënboer (1994) zeigten in Human Factors, dass subjektive Beurteilungen mentaler Anstrengung, die unmittelbar nach Lernaufgaben erhoben werden, ein valides und sensitives Maß für kognitive Belastung darstellen. Damit konnten Forschende didaktische Bedingungen vergleichen, ohne Belastung ausschließlich aus Leistungsdaten ableiten zu müssen — ein methodischer Beitrag, der das Feld für differenziertere experimentelle Arbeit öffnete.
Eine Metaanalyse von Mutlu-Bayraktar, Cosgun und Altan (2019) in Computers and Education wertete 55 Studien zu KBT-informiertem Design in digitalen Lernumgebungen aus und fand eine mittlere Effektgröße von d = 0,61 zugunsten KBT-basierter Designs gegenüber Kontrollbedingungen. Der Effekt war stärker bei Anfängerinnen und Anfängern sowie bei Inhalten mit hoher intrinsischer Belastung — ein Ergebnis, das mit den theoretischen Vorhersagen übereinstimmt. Die Autorinnen und Autoren wiesen darauf hin, dass die meisten Studien kurzfristige Labor- oder Quasi-Experimente waren, und forderten langfristigere Klassenzimmerstudien, die Retention und Transfer messen.
Häufige Missverständnisse
Die kognitive Belastungstheorie bedeutet, Inhalte zu vereinfachen. Die KBT fordert nicht, den intellektuellen Anspruch des Lernstoffs zu reduzieren. Intrinsische Belastung kann und sollte nicht beseitigt werden; die Beherrschung komplexer Bereiche erfordert das Ringen mit echtem komplexem Material. Was die Theorie ins Visier nimmt, ist die extrinsische Belastung — die unnötige Reibung, die durch schlechte Präsentation, redundante Informationen oder unklares Aufgabendesign entsteht. Lehrkräfte können hohe akademische Erwartungen aufrechterhalten und gleichzeitig Aktivitäten gestalten, die das Arbeitsgedächtnis nicht nutzlos durch Unklarheiten in der Aufgabenstellung oder unübersichtliche Materialien belasten.
Sobald Lernende etwas verstanden haben, spielt kognitive Belastung keine Rolle mehr. Verstehen ist nicht dasselbe wie Automatisierung. Eine Schülerin, die bewusst versteht, wie eine Grammatikregel anzuwenden ist, steht beim schnellen Schreiben immer noch vor hoher kognitiver Belastung, weil sie gleichzeitig Ideen, Satzstruktur, Wortschatz und die Regel im Arbeitsgedächtnis halten muss. Kognitive Belastung bleibt ein Faktor, bis das relevante Schema ausreichend automatisiert ist. Deshalb produziert verteiltes Üben über die Zeit dauerhafteres Lernen als geballtes Üben in einer einzigen Sitzung — wiederholter Abruf baut die Automatizität auf, die das Arbeitsgedächtnis für komplexere Aufgaben freisetzt.
Mehr Information und mehr durchgearbeitete Beispiele sind immer besser. Der Redundanzeffekt zeigt, dass das gleichzeitige Präsentieren derselben Information in zwei Formaten — Text laut vorlesen, während die Lernenden ihn auch lesen, oder ein vollständig beschriftetes Diagramm verbal erläutern, während die Lernenden es betrachten — extrinsische Belastung durch die Verarbeitung identischer Inhalte über überlappende Kanäle erzeugt. Für Lernende, die bereits partielle Schemata besitzen, können zusätzliche durchgearbeitete Beispiele den Schemaabruf beeinträchtigen. Lernmaterialien sollten ausreichend, nicht umfassend sein und sich mit der Expertise der Lernenden weiterentwickeln, anstatt konstant zu bleiben.
Verbindung zum aktiven Lernen
Die kognitive Belastungstheorie wendet sich nicht gegen aktives Lernen — sie erklärt, warum aktives Lernen funktioniert, wenn es gut gestaltet ist, und warum es scheitert, wenn es schlecht gestaltet ist. Schlecht strukturierte Gruppenaufgaben können enorme extrinsische Belastung erzeugen: Lernende müssen gleichzeitig soziale Koordination, unklare Anweisungen und unbekannte Inhalte bewältigen. Gut gestaltetes aktives Lernen beseitigt extrinsische Belastung und lenkt kognitive Ressourcen in lernrelevante Verarbeitung.
Lernstationen veranschaulichen dies direkt. Wenn Stationen Lernende durch Aufgaben rotieren lassen, die jeweils ein einzelnes Konzept oder eine einzelne Kompetenz auf einem handhabbaren Komplexitätsniveau ansprechen, präsentiert jede Station eine kontrollierte intrinsische Belastung, während Bewegung und Abwechslung die Ermüdungseffekte anhaltender anstrengender Verarbeitung reduzieren. Stationen ermöglichen es Lehrkräften auch, Gruppen Aufgaben zuzuweisen, die ihrem aktuellen Stand der Schemaentwicklung entsprechen — und damit den Expertise-Umkehreffekt auf Klassenebene wirksam zu steuern.
Die Jigsaw-Methode steuert kognitive Belastung durch Rollenspezialisierung. Anstatt jeden Lernenden zu zwingen, gleichzeitig alle Komponenten eines komplexen Themas zu erlernen, weist Jigsaw jeder Person zu, zunächst Expertin oder Experte für einen Teilbereich zu werden, bevor sie das Wissen an die Peers weitervermittelt. Dies hält die intrinsische Belastung in der ersten Expertengruppen-Phase auf einem handhabbaren Niveau und nutzt dann Scaffolding durch Peer-Erklärung in der Jigsaw-Phase. Ein Konzept anderen zu erklären ist selbst eine lernrelevante Verarbeitungsaktivität: Sie erfordert das Abrufen, Ordnen und Artikulieren des Schemas auf eine Weise, die die Enkodierung vertieft. Die Struktur spiegelt auch das Chunking-Prinzip wider — komplexe Klasseninhalte werden in Komponenten aufgeteilt, die jeweils auf einem höheren Niveau gelernt werden, bevor sie integriert werden.
Die Dual-Coding-Theorie ergänzt die KBT durch den Befund, dass verbale und visuelle Kanäle im Arbeitsgedächtnis teilweise unabhängig voneinander sind. Die gleichzeitige Nutzung beider Kanäle ohne Redundanz verdoppelt effektiv die verfügbare Verarbeitungskapazität für einen gegebenen Inhalt. Deshalb übertreffen kommentierte Diagramme, Konzeptkarten kombiniert mit kurzen verbalen Zusammenfassungen und illustrierte Schritt-für-Schritt-Anleitungen bei neuen Inhalten mit hoher intrinsischer Belastung in der Regel rein textliche oder rein bildliche Präsentationen.
Quellen
- Sweller, J. (1988). Cognitive load during problem solving: Effects on learning. Cognitive Science, 12(2), 257–285.
- Sweller, J., van Merriënboer, J. J. G., & Paas, F. (1998). Cognitive architecture and instructional design. Educational Psychology Review, 10(3), 251–296.
- Kalyuga, S., Ayres, P., Chandler, P., & Sweller, J. (2003). The expertise reversal effect. Educational Psychologist, 38(1), 23–31.
- Paas, F., & van Merriënboer, J. J. G. (1994). Variability of worked examples and transfer of geometrical problem-solving skills: A cognitive-load approach. Journal of Educational Psychology, 86(1), 122–133.