Informatik · Klasse 13 · Künstliche Intelligenz und Machine Learning · 2. Halbjahr

Grundlagen des Machine Learning

Die Schülerinnen und Schüler verstehen die Konzepte von überwachtem, unüberwachtem und bestärkendem Lernen.

Kurzfassung:Aktives Lernen eignet sich besonders für Machine Learning, weil Schülerinnen und Schüler durch praktische Erfahrungen die abstrakten Konzepte des überwachten, unüberwachten und bestärkenden Lernens greifbar machen. Die Stationen und Challenges fördern nicht nur das Verständnis, sondern auch die Reflexion über Datenqualität und Modellverhalten.

KMK BildungsstandardsKMK: Sekundarstufe II - AlgorithmenKMK: Sekundarstufe II - Daten und ihre Strukturierung

Über dieses Thema

Die Grundlagen des Machine Learning drehen sich um die Kernkonzepte des überwachten, unüberwachten und bestärkenden Lernens. Schülerinnen und Schüler verstehen, dass überwachtes Lernen mit gelabelten Daten trainiert, um Muster zu erkennen und Vorhersagen zu treffen, wie bei der Klassifikation von E-Mails als Spam oder Nicht-Spam. Unüberwachtes Lernen gruppiert ungelabelte Daten, etwa durch Clustering von Kundensegmenten in Marketingdaten. Bestärkendes Lernen optimiert Handlungen durch Belohnungen und Strafen, wie ein Agent, der in einem Spiel die beste Strategie lernt.

Dieses Thema verknüpft sich eng mit den KMK-Standards zu Algorithmen und Datenstrukturierung in der Sekundarstufe II. Es betont die zentrale Rolle von Datenqualität und -menge für erfolgreiche Modelle. Schüler analysieren reale Anwendungen, etwa in Medizin oder autonomen Fahrzeugen, und lernen, Paradigmen an Probleme anzupassen. So entsteht ein tiefes Verständnis für KI-Systeme.

Aktive Lernansätze sind hier ideal, weil abstrakte Algorithmen durch praktische Experimente und Simulationen konkret werden. Wenn Schüler mit Tools wie Python oder visuellen Plattformen eigene Modelle bauen und vergleichen, internalisieren sie Unterschiede zwischen Lernarten und entdecken Stärken sowie Grenzen intuitiv. Das stärkt Problemlösungsfähigkeiten nachhaltig.

Leitfragen

Differentiieren Sie zwischen überwachtem und unüberwachtem Lernen.
Erklären Sie die Rolle von Daten in Machine Learning-Modellen.
Analysieren Sie Beispiele für die Anwendung verschiedener Lernparadigmen.

Lernziele

Klassifizieren Sie gegebene Datensätze als geeignet für überwachtes, unüberwachtes oder bestärkendes Lernen.
Erklären Sie die Funktion von Merkmalen (Features) und Labels im Kontext von überwachtem Lernen anhand eines Beispiels.
Analysieren Sie die Ergebnisse eines Clustering-Algorithmus auf einem ungelabelten Datensatz und interpretieren Sie die gefundenen Gruppen.
Entwerfen Sie ein einfaches Szenario für bestärkendes Lernen, das eine klare Belohnungsfunktion definiert.
Vergleichen Sie die Vor- und Nachteile von überwachtem und unüberwachtem Lernen für spezifische Problemstellungen.

Bevor es losgeht

Grundlagen der Datenverarbeitung und -analyse

Warum: Schüler müssen grundlegende Konzepte wie Datentypen, Variablen und einfache statistische Kennzahlen verstehen, um Daten für Machine Learning vorbereiten und interpretieren zu können.

Einführung in Algorithmen und Programmierung

Warum: Ein Verständnis von Algorithmen und grundlegenden Programmierkonstrukten ist notwendig, um die Funktionsweise von Machine Learning-Modellen nachvollziehen und ggf. einfache Implementierungen verstehen zu können.

Schlüsselvokabular

Überwachtes Lernen	Ein Lernparadigma, bei dem das Modell mit einem Datensatz trainiert wird, der sowohl Eingabemerkmale als auch die dazugehörigen korrekten Ausgaben (Labels) enthält.
Unüberwachtes Lernen	Ein Lernparadigma, bei dem das Modell mit einem Datensatz trainiert wird, der nur Eingabemerkmale ohne vordefinierte Ausgaben (Labels) enthält, um Muster und Strukturen zu finden.
Bestärkendes Lernen	Ein Lernparadigma, bei dem ein Agent durch Interaktion mit einer Umgebung lernt, indem er Aktionen ausführt und auf Basis von Belohnungen oder Bestrafungen seine Strategie optimiert.
Merkmale (Features)	Die Eingabevariablen oder Attribute eines Datensatzes, die zur Vorhersage oder Klassifizierung verwendet werden.
Label (Zielvariable)	Die korrekte Ausgabe oder Antwort, die einem Datensatz im überwachten Lernen zugeordnet ist und als Referenz für das Training dient.

Vorsicht vor diesen Fehlvorstellungen

Häufige FehlvorstellungMachine Learning funktioniert wie menschliches Lernen mit Intuition.

Was Sie stattdessen lehren sollten

Machine Learning basiert auf statistischen Mustern in Daten, nicht auf Verständnis. Aktive Experimente, bei denen Schüler Modelle mit fehlerhaften Daten trainieren, zeigen schnell, wie Vorurteile entstehen. Peer-Diskussionen klären, dass Algorithmen datenabhängig sind.

Häufige FehlvorstellungÜberwachtes Lernen ist immer überlegen zu unüberwachtem.

Was Sie stattdessen lehren sollten

Unüberwachtes Lernen eignet sich für explorative Analysen ohne Labels. Durch Gruppenvergleiche von Modelloutputs lernen Schüler, wann welches Paradigma passt. Hands-on-Clustering-Aufgaben verdeutlichen den Mehrwert ungelabelter Daten.

Häufige FehlvorstellungBestärkendes Lernen braucht keine Daten.

Was Sie stattdessen lehren sollten

Es lernt aus Interaktionen mit der Umwelt durch Trial-and-Error. Simulationsspiele helfen Schülern, Belohnungsfunktionen zu erleben und zu optimieren. Das korrigiert den Irrtum und zeigt Daten als kumulierte Erfahrungen.

Ideen für aktives Lernen

Alle Aktivitäten ansehen→

Lernen an Stationen

Lernparadigmen erkunden

Richten Sie drei Stationen ein: Überwachtes Lernen mit gelabelten Datensätzen klassifizieren, unüberwachtes Lernen durch Clustering visualisieren, bestärkendes Lernen mit einem einfachen Spiel simulieren. Gruppen rotieren alle 10 Minuten, notieren Beobachtungen und diskutieren Anwendungen. Abschließende Plenumrunde fasst Erkenntnisse zusammen.

45 Min.·Kleingruppen

Concept-Mapping

Datenlabeling-Challenge: Paarbeispiele

In Paaren erhalten Schüler ungelabelte Daten und labeln sie manuell für supervised Learning. Sie trainieren dann ein einfaches Modell mit Tools wie Orange oder Scratch und vergleichen Ergebnisse mit ungelabelten Ansätzen. Diskussion: Welche Datenqualität ist entscheidend?

30 Min.·Partnerarbeit

Concept-Mapping

Reinforcement Learning: Spielsimulation

Die Klasse spielt ein gemeinsames Spiel wie Tic-Tac-Toe, wobei ein Schüler als Agent Belohnungen sammelt. Andere beobachten und notieren Strategieentwicklungen. Danach modellieren Gruppen das in Pseudocode und vergleichen mit realen RL-Beispielen.

50 Min.·Ganze Klasse

Bezüge zur Lebenswelt

Im Kundenservice von Online-Shops wie Zalando werden überwachte Lernmodelle eingesetzt, um eingehende Kundenanfragen automatisch zu klassifizieren und an die zuständigen Abteilungen weiterzuleiten.
Banken nutzen unüberwachtes Lernen, um Muster in Transaktionsdaten zu erkennen und potenzielle Geldwäscheaktivitäten durch Anomalieerkennung zu identifizieren, ohne vorherige Beispiele für solche Aktivitäten zu benötigen.
Autonome Fahrsysteme in Fahrzeugen von Herstellern wie Waymo oder Tesla verwenden bestärkendes Lernen, um Fahrentscheidungen in komplexen Verkehrssituationen zu treffen, basierend auf Belohnungen für sicheres Vorankommen und Strafen für Kollisionen.

Ideen zur Lernstandserhebung

Lernstandskontrolle

Geben Sie jeder Schülerin und jedem Schüler eine Karte mit einem kurzen Szenario (z.B. 'Vorhersage von Aktienkursen', 'Gruppierung von Nachrichtenartikeln', 'Roboter lernt laufen'). Bitten Sie sie, das passende Lernparadigma (überwacht, unüberwacht, bestärkend) zu identifizieren und eine Begründung dafür zu schreiben.

Kurze Überprüfung

Stellen Sie eine Liste von Datensätzen vor (z.B. 'Bilder von Katzen und Hunden mit Beschriftung', 'Kundenbewertungen ohne Sterne', 'Spielbrett mit Punktestand'). Lassen Sie die Schüler per Handzeichen oder digital angeben, ob der Datensatz für überwachtes, unüberwachtes oder bestärkendes Lernen am besten geeignet ist und warum.

Diskussionsfrage

Leiten Sie eine Diskussion mit der Frage: 'Welche Rolle spielt die Qualität und Menge der Daten für den Erfolg eines Machine Learning-Modells? Geben Sie Beispiele, wie schlechte Daten zu Fehlern führen können.' Ermutigen Sie die Schüler, ihre Antworten auf die verschiedenen Lernparadigmen zu beziehen.

Häufig gestellte Fragen

Was ist der Unterschied zwischen überwachtem und unüberwachtem Lernen?

Überwachtes Lernen verwendet gelabelte Daten, um Eingaben zuzuordnen, z.B. Katzenbilder als 'Katze' zu klassifizieren. Unüberwachtes Lernen findet Strukturen in ungelabelten Daten, wie Gruppierungen von Einkaufsgewohnheiten. Beide stärken Modelle, aber supervised ist präziser bei bekannten Klassen, unsupervised explorativ. Praktische Übungen mit Tools verdeutlichen diese Unterschiede durch direkte Vergleiche von Ergebnissen.

Wie wirkt sich die Datenqualität auf Machine-Learning-Modelle aus?

Hohe Datenqualität, also Genauigkeit, Vielfalt und Volumen, verbessert Vorhersagen und vermeidet Bias. Schlechte Daten führen zu fehlerhaften Modellen. Schüler testen das, indem sie Modelle mit manipulierten Datensätzen trainieren. Diskussionen fördern Reflexion über Ethik und Datenvorbereitung in realen Szenarien wie KI in der Medizin.

Wie kann aktives Lernen das Verständnis von Machine Learning vertiefen?

Aktives Lernen macht abstrakte Konzepte greifbar, z.B. durch Stationen zu Lernparadigmen oder das Bauen simpler Modelle. Schüler experimentieren, vergleichen Outputs und diskutieren in Gruppen, was Unterschiede zwischen supervised, unsupervised und RL festigt. Solche Methoden steigern Motivation und Retention, da sie Denken und Handeln verbinden, passend zu KMK-Zielen.

Welche Beispiele gibt es für bestärkendes Lernen?

Bestärkendes Lernen trainiert Agenten durch Belohnungen, z.B. AlphaGo beim Go-Spielen oder Roboter, die Hindernisse umfahren lernen. Schüler simulieren das mit Spielen, wo Strategien iterativ verbessert werden. Das zeigt, wie kumulierte Erfahrungen optimale Entscheidungen erzeugen, ohne explizite Anweisungen.

Planungsvorlagen für Informatik

Unterrichtsplan

MINT

Eine MINT Vorlage, die auf dem Engineering Design Process basiert. Sie integriert Mathematik, Informatik, Naturwissenschaft und Technik durch reale Herausforderungen, die Lernende untersuchen und lösen.

Mehr in Künstliche Intelligenz und Machine Learning

Einführung in Künstliche Intelligenz

Die Schülerinnen und Schüler lernen die Definition, Geschichte und Anwendungsbereiche der KI kennen.

8 methodologies

Lineare Regression und Klassifikation

Die Schülerinnen und Schüler lernen grundlegende Machine Learning-Modelle wie lineare Regression und logistische Regression kennen.

8 methodologies

Grundlagen neuronaler Netze

Modellierung biologischer Lernprozesse durch Perzeptrone und Backpropagation.

8 methodologies

Deep Learning und Convolutional Neural Networks (CNNs)

Die Schülerinnen und Schüler lernen Deep Learning-Architekturen und CNNs für Bilderkennung kennen.

8 methodologies

Training und Evaluierung von ML-Modellen

Die Schülerinnen und Schüler lernen Methoden zur Bewertung und Optimierung von Machine Learning-Modellen.

8 methodologies

Anwendungsfelder und Grenzen von KI

Untersuchung von Large Language Models (LLM) und Computer Vision.

8 methodologies

Edited by Adriana Perusin, Editor-in-Chief, Flip Education