Mathematik · Klasse 13 · Stochastik: Beurteilende Statistik · 2. Halbjahr

Teststärke und Stichprobenumfang

Die Schülerinnen und Schüler verstehen die Konzepte der Teststärke und des optimalen Stichprobenumfangs.

Kurzfassung:Aktive Lernformen eignen sich besonders für das Thema Teststärke und Stichprobenumfang, weil Schülerinnen und Schüler durch eigene Experimente und Datenanalysen die abstrakten Konzepte direkt erleben können. Sichtbare Effekte durch Variationen von n oder Effektstärken fördern ein nachhaltiges Verständnis der Zusammenhänge zwischen Stichprobenumfang, Fehlerwahrscheinlichkeiten und Entscheidungsqualität.

KMK BildungsstandardsKMK: Sekundarstufe II - Stochastik

Über dieses Thema

Die Teststärke eines Hypothesentests gibt die Wahrscheinlichkeit an, eine falsche Nullhypothese korrekt abzulehnen. Sie steht in inverser Beziehung zur Fehlerwahrscheinlichkeit zweiter Art (β). Schülerinnen und Schüler der Klasse 13 verstehen, dass ein größerer Stichprobenumfang die Teststärke steigert, weil die Varianz der Schätzstatistik abnimmt und die Trennschärfe zwischen Hypothesen zunimmt. Dies verbindet sich mit den KMK-Standards für Stochastik in der Sekundarstufe II, wo beurteilende Statistik im Fokus steht.

Im Rahmen der Vorbereitung auf das Abitur analysieren Lernende Kompromisse bei der Wahl des Stichprobenumfangs: Höhere Präzision erfordert mehr Ressourcen, Zeit und Kosten. Sie bewerten reale Studien, etwa in Medizin oder Umweltforschung, und lernen, Power-Kurven zu interpretieren. Dies fördert systematisches Denken und die Fähigkeit, statistische Entscheidungen zu rechtfertigen.

Aktives Lernen ist hier besonders wirksam, weil Simulationen und interaktive Tools abstrakte Wahrscheinlichkeiten erfahrbar machen. Schülerinnen und Schüler führen eigene Tests durch, variieren Parameter und beobachten Effekte direkt, was Verständnis vertieft und Fehlvorstellungen abbaut.

Leitfragen

Erklären Sie, wie die Teststärke eines Hypothesentests mit der Wahrscheinlichkeit eines Fehlers 2. Art zusammenhängt.
Analysieren Sie, wie ein größerer Stichprobenumfang die Aussagekraft eines Tests verbessert.
Bewerten Sie die Kompromisse bei der Wahl des Stichprobenumfangs in realen Studien.

Lernziele

Erklären Sie den Zusammenhang zwischen Teststärke, Fehler 2. Art (β) und Signifikanzniveau (α).
Analysieren Sie, wie sich eine Erhöhung des Stichprobenumfangs auf die Teststärke und die Wahrscheinlichkeit eines Fehlers 2. Art auswirkt.
Berechnen Sie den notwendigen Stichprobenumfang für einen gegebenen Test mit vorgegebener Teststärke und vorgegebenem Signifikanzniveau.
Bewerten Sie die praktischen und ethischen Kompromisse bei der Festlegung des Stichprobenumfangs für wissenschaftliche Studien.

Bevor es losgeht

Hypothesentest: Nullhypothese und Alternativhypothese

Warum: Schüler müssen die Grundlagen von Hypothesentests verstehen, um die Konzepte der Teststärke und der Fehlerarten anwenden zu können.

Fehler 1. und 2. Art

Warum: Ein klares Verständnis der beiden Arten von Fehlern ist notwendig, um die Teststärke als die Wahrscheinlichkeit zu definieren, einen Fehler 2. Art zu vermeiden.

Grundlagen der Stichprobenverteilung

Warum: Das Verständnis, wie sich Stichprobenverteilungen mit zunehmendem Stichprobenumfang verändern, ist entscheidend für die Analyse der Auswirkung von 'n' auf die Teststärke.

Schlüsselvokabular

Teststärke (Power)	Die Wahrscheinlichkeit, eine falsche Nullhypothese korrekt abzulehnen. Sie gibt an, wie gut ein Test einen Effekt oder Unterschied nachweisen kann, wenn er tatsächlich existiert.
Fehler 2. Art (β)	Die Wahrscheinlichkeit, eine falsche Nullhypothese nicht abzulehnen. Dies ist das Gegenteil der Teststärke: Power = 1 - β.
Stichprobenumfang (n)	Die Anzahl der Beobachtungen oder Messungen, die in einer Stichprobe gesammelt werden. Ein größerer Stichprobenumfang erhöht in der Regel die Genauigkeit und Teststärke.
Power-Kurve	Eine grafische Darstellung, die die Teststärke eines Tests für verschiedene Werte des wahren Effekts oder der Effektgröße bei gegebenem Stichprobenumfang zeigt.

Vorsicht vor diesen Fehlvorstellungen

Häufige FehlvorstellungTeststärke steigt linear mit n.

Was Sie stattdessen lehren sollten

Tatsächlich nähert sie sich asymptotisch 1 an. Aktive Simulationen zeigen dies visuell: Schüler plotten Kurven und erkennen Sättigungseffekte, was Peer-Diskussionen zu nuanciertem Verständnis führt.

Häufige FehlvorstellungGrößeres n macht β immer null.

Was Sie stattdessen lehren sollten

Selbst bei großem n bleibt β positiv, abhängig von Effektstärke. Hands-on-Tests mit realen Daten helfen, da Schüler Effekte variieren und beobachten, wie enge Grenzen Trennung erschweren.

Häufige FehlvorstellungTeststärke ignoriert α.

Was Sie stattdessen lehren sollten

Power hängt von α ab: Kleineres α verringert sie. Gruppendiskussionen nach Simulationen klären Trade-offs, indem Schüler Szenarien austauschen und optimale Balances finden.

Ideen für aktives Lernen

Alle Aktivitäten ansehen→

Planspiel

Würfeltest mit variierendem n

Gruppen werfen einen unfairen Würfel (z. B. mit Gewichtung) mehrmals und testen die Nullhypothese 'fair'. Sie wiederholen für n=10, 30, 100 und berechnen empirische Teststärken. Diskutieren Sie Ergebnisse in Plenum.

45 Min.·Kleingruppen

Planspiel

Software-Übung: Power-Kurven plotten

Mit GeoGebra oder Excel simulieren Paare Hypothesentests für Mittelwerte. Variieren Sie n und σ, plotten Power gegen n. Vergleichen Sie mit theoretischen Formeln und notieren Sie Kompromisse.

30 Min.·Partnerarbeit

Fallstudienanalyse

Medizinische Daten analysieren

Whole class bearbeitet einen Datensatz (z. B. Wirkung eines Medikaments). Teilen Sie in Gruppen auf, testen mit unterschiedlichen n und bewerten Teststärke. Präsentieren Sie Empfehlungen.

50 Min.·Kleingruppen

Bezüge zur Lebenswelt

In der medizinischen Forschung legen Pharmaunternehmen den Stichprobenumfang für klinische Studien fest, um sicherzustellen, dass ein neues Medikament statistisch signifikant wirksamer ist als ein Placebo, wobei Kosten und Patientensicherheit abgewogen werden.
Umweltbehörden wie das Umweltbundesamt benötigen eine ausreichende Teststärke, um geringe Konzentrationen von Schadstoffen in Wasser- oder Bodenproben nachweisen zu können, um Umweltschutzmaßnahmen zu rechtfertigen.

Ideen zur Lernstandserhebung

Kurze Überprüfung

Stellen Sie den Schülern eine Tabelle mit verschiedenen Szenarien bereit (z. B. kleine vs. große Stichprobe, großer vs. kleiner Effekt). Bitten Sie sie, für jedes Szenario die erwartete Teststärke und die Wahrscheinlichkeit eines Fehlers 2. Art einzuschätzen und ihre Begründung kurz zu notieren.

Diskussionsfrage

Leiten Sie eine Diskussion mit der Frage: 'Stellen Sie sich vor, Sie entwickeln einen neuen COVID-19-Test. Welche Faktoren würden Sie bei der Entscheidung über den Stichprobenumfang für die Validierungsstudie berücksichtigen, und welche Kompromisse müssten Sie eingehen?'

Lernstandskontrolle

Geben Sie jedem Schüler eine Karte mit einer der folgenden Fragen: 'Wie beeinflusst eine Verdopplung des Stichprobenumfangs die Teststärke?' oder 'Warum ist es wichtig, die Teststärke vor Beginn einer Studie zu bestimmen?' Die Schüler schreiben eine kurze, präzise Antwort.

Häufig gestellte Fragen

Was ist die Teststärke eines Hypothesentests?

Die Teststärke (1 - β) misst die Wahrscheinlichkeit, eine falsche H0 abzulehnen. Sie hängt von α, Effektstärke, Varianz und n ab. In der Praxis berechnet man sie über Power-Funktionen oder Simulationen, um Studien zu planen. Dies ist zentral für zuverlässige Inferenz in Stochastik.

Wie verbessert ein größerer Stichprobenumfang die Teststärke?

Größeres n reduziert die Standardfehler, erhöht die Trennschärfe zwischen H0 und H1. Power-Kurven zeigen: Ab n=30 steigt sie stark, dann abflachend. Schüler lernen dies durch Simulationen und wenden es auf Abituraufgaben an, inklusive Formel n ≈ (zα + zβ)² * σ² / δ².

Welche Kompromisse gibt es bei der Wahl des Stichprobenumfangs?

Größeres n steigert Power, kostet aber Zeit, Geld und Aufwand. In realen Studien balanciert man mit Pilotstudien oder sequentiellen Designs. Bewertung fördert kritisches Denken: Schüler analysieren Beispiele wie Wahlen oder klinische Trials und rechtfertigen Entscheidungen.

Wie unterstützt aktives Lernen beim Verständnis von Teststärke?

Aktive Methoden wie Würfel-Simulationen oder Software-Übungen machen Wahrscheinlichkeiten greifbar. Schüler variieren n selbst, berechnen empirische Power und diskutieren Ergebnisse. Dies baut Intuition auf, korrigiert Fehlvorstellungen und verbindet Theorie mit Praxis effektiver als reine Vorträge (ca. 65 Wörter).

Planungsvorlagen für Mathematik

Unterrichtsplan

5E Modell

Das 5E Modell gliedert den Unterricht in fünf Phasen: Einstieg, Erarbeitung, Erklärung, Vertiefung und Evaluation. Es führt Lernende durch forschendes Lernen von der Neugier zum tiefen Verständnis.

Einheitenplaner

Matheeinheit

Planen Sie eine konzeptuell kohärente Mathematikeinheit: vom intuitiven Verständnis über prozedurale Sicherheit zur Anwendung im Kontext. Jede Stunde baut auf der vorherigen auf in einer logisch verbundenen Lernsequenz.

Bewertungsraster

Mathe Bewertungsraster

Erstellen Sie ein Bewertungsraster, das Problemlösen, mathematisches Denken und Kommunikation neben der prozeduralen Genauigkeit bewertet. Lernende erhalten Rückmeldung darüber, wie sie denken, nicht nur ob das Ergebnis stimmt.

Mehr in Stochastik: Beurteilende Statistik

Stichproben und Schätzverfahren

Die Schülerinnen und Schüler verstehen die Bedeutung von Stichproben und lernen, Populationsparameter zu schätzen.

8 methodologies

Konfidenzintervalle

Die Schülerinnen und Schüler berechnen Konfidenzintervalle für unbekannte Wahrscheinlichkeiten und interpretieren diese.

8 methodologies

Hypothesentests: Grundlagen

Die Schülerinnen und Schüler formulieren Null- und Alternativhypothesen und verstehen das Prinzip des Hypothesentests.

8 methodologies

Einseitige Hypothesentests

Durchführung von Signifikanztests zur Überprüfung von Vermutungen über Erfolgswahrscheinlichkeiten.

8 methodologies

Zweiseitige Hypothesentests

Die Schülerinnen und Schüler führen zweiseitige Tests durch und interpretieren die Ergebnisse.

8 methodologies

Fehler 1. und 2. Art

Analyse von Fehlentscheidungen bei statistischen Tests und deren Konsequenzen in der Praxis.

8 methodologies

Edited by Adriana Perusin, Editor-in-Chief, Flip Education