Skip to content

Teststärke und StichprobenumfangAktivitäten & Unterrichtsstrategien

Aktive Lernformen eignen sich besonders für das Thema Teststärke und Stichprobenumfang, weil Schülerinnen und Schüler durch eigene Experimente und Datenanalysen die abstrakten Konzepte direkt erleben können. Sichtbare Effekte durch Variationen von n oder Effektstärken fördern ein nachhaltiges Verständnis der Zusammenhänge zwischen Stichprobenumfang, Fehlerwahrscheinlichkeiten und Entscheidungsqualität.

Klasse 13Analysis, Analytische Geometrie und Stochastik: Vorbereitung auf das Abitur4 Aktivitäten30 Min.50 Min.

Lernziele

  1. 1Erklären Sie den Zusammenhang zwischen Teststärke, Fehler 2. Art (β) und Signifikanzniveau (α).
  2. 2Analysieren Sie, wie sich eine Erhöhung des Stichprobenumfangs auf die Teststärke und die Wahrscheinlichkeit eines Fehlers 2. Art auswirkt.
  3. 3Berechnen Sie den notwendigen Stichprobenumfang für einen gegebenen Test mit vorgegebener Teststärke und vorgegebenem Signifikanzniveau.
  4. 4Bewerten Sie die praktischen und ethischen Kompromisse bei der Festlegung des Stichprobenumfangs für wissenschaftliche Studien.

Möchten Sie einen vollständigen Unterrichtsentwurf mit diesen Lernzielen? Mission erstellen

45 Min.·Kleingruppen

Planspiel: Würfeltest mit variierendem n

Gruppen werfen einen unfairen Würfel (z. B. mit Gewichtung) mehrmals und testen die Nullhypothese 'fair'. Sie wiederholen für n=10, 30, 100 und berechnen empirische Teststärken. Diskutieren Sie Ergebnisse in Plenum.

Vorbereitung & Details

Erklären Sie, wie die Teststärke eines Hypothesentests mit der Wahrscheinlichkeit eines Fehlers 2. Art zusammenhängt.

Moderationstipp: Fordern Sie die Schülerinnen und Schüler während der Simulation auf, für jede Würfelanzahl n eine Hypothese zu formulieren und die erwartete Teststärke zu prognostizieren, bevor sie die Simulation starten.

Setup: Flexibler Raum für verschiedene Gruppenstationen

Materials: Rollenkarten mit Zielen und Ressourcen, Spielwährung oder Token, Rundenprotokoll

AnwendenAnalysierenBewertenErschaffenSozialbewusstseinEntscheidungsfähigkeit
30 Min.·Partnerarbeit

Software-Übung: Power-Kurven plotten

Mit GeoGebra oder Excel simulieren Paare Hypothesentests für Mittelwerte. Variieren Sie n und σ, plotten Power gegen n. Vergleichen Sie mit theoretischen Formeln und notieren Sie Kompromisse.

Vorbereitung & Details

Analysieren Sie, wie ein größerer Stichprobenumfang die Aussagekraft eines Tests verbessert.

Moderationstipp: Bitten Sie die Lernenden, bei der Power-Kurven-Übung die Achsenbeschriftungen und Skalierungen zu erklären, um das Verständnis für die mathematischen Zusammenhänge zu vertiefen.

Setup: Gruppentische mit Zugang zu Quellenmaterialien

Materials: Quellensammlung, Arbeitsblatt zum Forschungszyklus, Leitfaden zur Fragestellung, Vorlage für die Ergebnispräsentation

AnalysierenBewertenErschaffenSelbststeuerungSelbstwahrnehmung
50 Min.·Kleingruppen

Fallstudienanalyse: Medizinische Daten analysieren

Whole class bearbeitet einen Datensatz (z. B. Wirkung eines Medikaments). Teilen Sie in Gruppen auf, testen mit unterschiedlichen n und bewerten Teststärke. Präsentieren Sie Empfehlungen.

Vorbereitung & Details

Bewerten Sie die Kompromisse bei der Wahl des Stichprobenumfangs in realen Studien.

Moderationstipp: Legen Sie den medizinischen Daten Fallstudie eine klare Forschungsfrage vor (z.B. 'Wirksamkeit eines neuen Medikaments?'), damit die Analyse zielgerichtet erfolgt und nicht ins Uferlose geht.

Setup: Gruppentische mit Platz für die Fallunterlagen

Materials: Fallstudien-Paket (3-5 Seiten), Arbeitsblatt mit Analyseraster, Präsentationsvorlage

AnalysierenBewertenErschaffenEntscheidungsfähigkeitSelbststeuerung
35 Min.·Partnerarbeit

Fishbowl-Diskussion: Optimale n in der Praxis

Individual berechnen Schüler minimale n für gegebene Power. In Pairs diskutieren reale Einschränkungen (Budget, Zeit) und schlagen Alternativen vor. Plenum fasst zusammen.

Vorbereitung & Details

Erklären Sie, wie die Teststärke eines Hypothesentests mit der Wahrscheinlichkeit eines Fehlers 2. Art zusammenhängt.

Moderationstipp: Führen Sie die Diskussion über optimale n mit konkreten Beispielen aus der Praxis (z.B. klinische Studien oder Qualitätskontrolle), um die Relevanz zu verdeutlichen.

Setup: Innenkreis mit 4–6 Stühlen, umgeben von einem Außenkreis

Materials: Diskussionsimpuls oder Leitfrage, Beobachtungsbogen

AnalysierenBewertenSozialbewusstseinSelbstwahrnehmung

Dieses Thema unterrichten

Erfahrene Lehrkräfte beginnen mit einer intuitiven Einführung, zum Beispiel durch einen Würfeltest mit kleiner Stichprobe, der häufige Fehlentscheidungen produziert. Anschließend wird systematisch der Stichprobenumfang erhöht, um den Effekt auf die Teststärke sichtbar zu machen. Wichtig ist, immer wieder auf den Trade-off zwischen Stichprobengröße und Kosten oder Aufwand hinzuweisen. Vermeiden Sie rein theoretische Erklärungen ohne praktische Verankerung, da die Konzepte sonst abstrakt bleiben.

Was Sie erwartet

Am Ende der Einheit sollen die Lernenden die Teststärke als Funktion des Stichprobenumfangs und der Effektstärke beschreiben können, grafische Darstellungen interpretieren und praktische Kompromisse zwischen Stichprobengröße, Kosten und Fehlerrisiken begründen. Die Schülerinnen und Schüler zeigen dies durch präzise Argumentationen in Diskussionen und korrekte Berechnungen oder Simulationen.

Diese Aktivitäten sind ein Ausgangspunkt. Die vollständige Mission ist das Erlebnis.

  • Vollständiges Moderationsskript mit Lehrkraft-Dialogen
  • Druckfertige Schülermaterialien, bereit für den Unterricht
  • Differenzierungsstrategien für jeden Lerntyp
Mission erstellen

Vorsicht vor diesen Fehlvorstellungen

Häufige FehlvorstellungWährend der Simulation 'Würfeltest mit variierendem n' beobachten einige Schülerinnen und Schüler, dass die Teststärke mit zunehmendem n linear steigt.

Was Sie stattdessen lehren sollten

Nutzen Sie die Simulationsergebnisse, um die Schülerinnen und Schüler aufzufordern, die Kurve zu plotten und zu diskutieren, warum die Teststärke sich asymptotisch 1 nähert, aber nie diesen Wert erreicht.

Häufige FehlvorstellungWährend der Fallstudie 'Medizinische Daten analysieren' nehmen einige an, dass ein großer Stichprobenumfang β auf null reduziert.

Was Sie stattdessen lehren sollten

Bitten Sie die Lernenden, die Effektstärke zu variieren und zu beobachten, wie selbst bei großem n β positiv bleibt, um die Abhängigkeit von der Effektstärke zu verdeutlichen.

Häufige FehlvorstellungWährend der Diskussion 'Optimale n in der Praxis' äußern einige, dass die Teststärke unabhängig von α ist.

Was Sie stattdessen lehren sollten

Führen Sie nach der Simulation eine Peer-Diskussion durch, in der die Schülerinnen und Schüler Szenarien mit verschiedenen α-Werten austauschen und die Auswirkungen auf die Teststärke analysieren.

Ideen zur Lernstandserhebung

Kurze Überprüfung

Nach der Simulation 'Würfeltest mit variierendem n' geben Sie den Lernenden eine Tabelle mit Szenarien (z.B. n=10, n=50, großer/s kleiner Effekt). Sie schätzen Teststärke und β ein und begründen ihre Antworten in Stichpunkten.

Diskussionsfrage

Während der Fallstudie 'Medizinische Daten analysieren' leiten Sie eine Diskussion mit der Frage: 'Welche Faktoren außer dem Stichprobenumfang beeinflussen die Teststärke in eurer Analyse, und wie könnt ihr diese kontrollieren?'

Lernstandskontrolle

Nach der Einheit 'Power-Kurven plotten' erhalten die Lernenden eine Karte mit der Frage: 'Wie beeinflusst eine Halbierung des Stichprobenumfangs die Teststärke im Vergleich zu einer Verdopplung?' Sie antworten präzise mit Bezug auf die gezeichneten Kurven.

Erweiterungen & Unterstützung

  • Challenge: Lassen Sie die Schülerinnen und Schüler eine eigene Simulation mit einem nicht-trivialen Effekt (z.B. gezinkter Würfel) entwerfen und die Teststärke für verschiedene n-Werte berechnen.
  • Scaffolding: Geben Sie den Lernenden eine vorbereitete Tabelle mit vorgegebenen n-Werten und Effektstärken, die sie in Gruppen ausfüllen und interpretieren sollen.
  • Deeper: Vertiefen Sie die mathematischen Zusammenhänge, indem Sie die Formel für die Teststärke herleiten und mit den simulierten Werten vergleichen.

Schlüsselvokabular

Teststärke (Power)Die Wahrscheinlichkeit, eine falsche Nullhypothese korrekt abzulehnen. Sie gibt an, wie gut ein Test einen Effekt oder Unterschied nachweisen kann, wenn er tatsächlich existiert.
Fehler 2. Art (β)Die Wahrscheinlichkeit, eine falsche Nullhypothese nicht abzulehnen. Dies ist das Gegenteil der Teststärke: Power = 1 - β.
Stichprobenumfang (n)Die Anzahl der Beobachtungen oder Messungen, die in einer Stichprobe gesammelt werden. Ein größerer Stichprobenumfang erhöht in der Regel die Genauigkeit und Teststärke.
Power-KurveEine grafische Darstellung, die die Teststärke eines Tests für verschiedene Werte des wahren Effekts oder der Effektgröße bei gegebenem Stichprobenumfang zeigt.

Bereit, Teststärke und Stichprobenumfang zu unterrichten?

Erstellen Sie eine vollständige Mission mit allem, was Sie brauchen

Mission erstellen