Grundlagen des Machine Learning
Die Schülerinnen und Schüler verstehen die Konzepte von überwachtem, unüberwachtem und bestärkendem Lernen.
Über dieses Thema
Die Grundlagen des Machine Learning drehen sich um die Kernkonzepte des überwachten, unüberwachten und bestärkenden Lernens. Schülerinnen und Schüler verstehen, dass überwachtes Lernen mit gelabelten Daten trainiert, um Muster zu erkennen und Vorhersagen zu treffen, wie bei der Klassifikation von E-Mails als Spam oder Nicht-Spam. Unüberwachtes Lernen gruppiert ungelabelte Daten, etwa durch Clustering von Kundensegmenten in Marketingdaten. Bestärkendes Lernen optimiert Handlungen durch Belohnungen und Strafen, wie ein Agent, der in einem Spiel die beste Strategie lernt.
Dieses Thema verknüpft sich eng mit den KMK-Standards zu Algorithmen und Datenstrukturierung in der Sekundarstufe II. Es betont die zentrale Rolle von Datenqualität und -menge für erfolgreiche Modelle. Schüler analysieren reale Anwendungen, etwa in Medizin oder autonomen Fahrzeugen, und lernen, Paradigmen an Probleme anzupassen. So entsteht ein tiefes Verständnis für KI-Systeme.
Aktive Lernansätze sind hier ideal, weil abstrakte Algorithmen durch praktische Experimente und Simulationen konkret werden. Wenn Schüler mit Tools wie Python oder visuellen Plattformen eigene Modelle bauen und vergleichen, internalisieren sie Unterschiede zwischen Lernarten und entdecken Stärken sowie Grenzen intuitiv. Das stärkt Problemlösungsfähigkeiten nachhaltig.
Leitfragen
- Differentiieren Sie zwischen überwachtem und unüberwachtem Lernen.
- Erklären Sie die Rolle von Daten in Machine Learning-Modellen.
- Analysieren Sie Beispiele für die Anwendung verschiedener Lernparadigmen.
Lernziele
- Klassifizieren Sie gegebene Datensätze als geeignet für überwachtes, unüberwachtes oder bestärkendes Lernen.
- Erklären Sie die Funktion von Merkmalen (Features) und Labels im Kontext von überwachtem Lernen anhand eines Beispiels.
- Analysieren Sie die Ergebnisse eines Clustering-Algorithmus auf einem ungelabelten Datensatz und interpretieren Sie die gefundenen Gruppen.
- Entwerfen Sie ein einfaches Szenario für bestärkendes Lernen, das eine klare Belohnungsfunktion definiert.
- Vergleichen Sie die Vor- und Nachteile von überwachtem und unüberwachtem Lernen für spezifische Problemstellungen.
Bevor es losgeht
Warum: Schüler müssen grundlegende Konzepte wie Datentypen, Variablen und einfache statistische Kennzahlen verstehen, um Daten für Machine Learning vorbereiten und interpretieren zu können.
Warum: Ein Verständnis von Algorithmen und grundlegenden Programmierkonstrukten ist notwendig, um die Funktionsweise von Machine Learning-Modellen nachvollziehen und ggf. einfache Implementierungen verstehen zu können.
Schlüsselvokabular
| Überwachtes Lernen | Ein Lernparadigma, bei dem das Modell mit einem Datensatz trainiert wird, der sowohl Eingabemerkmale als auch die dazugehörigen korrekten Ausgaben (Labels) enthält. |
| Unüberwachtes Lernen | Ein Lernparadigma, bei dem das Modell mit einem Datensatz trainiert wird, der nur Eingabemerkmale ohne vordefinierte Ausgaben (Labels) enthält, um Muster und Strukturen zu finden. |
| Bestärkendes Lernen | Ein Lernparadigma, bei dem ein Agent durch Interaktion mit einer Umgebung lernt, indem er Aktionen ausführt und auf Basis von Belohnungen oder Bestrafungen seine Strategie optimiert. |
| Merkmale (Features) | Die Eingabevariablen oder Attribute eines Datensatzes, die zur Vorhersage oder Klassifizierung verwendet werden. |
| Label (Zielvariable) | Die korrekte Ausgabe oder Antwort, die einem Datensatz im überwachten Lernen zugeordnet ist und als Referenz für das Training dient. |
Vorsicht vor diesen Fehlvorstellungen
Häufige FehlvorstellungMachine Learning funktioniert wie menschliches Lernen mit Intuition.
Was Sie stattdessen lehren sollten
Machine Learning basiert auf statistischen Mustern in Daten, nicht auf Verständnis. Aktive Experimente, bei denen Schüler Modelle mit fehlerhaften Daten trainieren, zeigen schnell, wie Vorurteile entstehen. Peer-Diskussionen klären, dass Algorithmen datenabhängig sind.
Häufige FehlvorstellungÜberwachtes Lernen ist immer überlegen zu unüberwachtem.
Was Sie stattdessen lehren sollten
Unüberwachtes Lernen eignet sich für explorative Analysen ohne Labels. Durch Gruppenvergleiche von Modelloutputs lernen Schüler, wann welches Paradigma passt. Hands-on-Clustering-Aufgaben verdeutlichen den Mehrwert ungelabelter Daten.
Häufige FehlvorstellungBestärkendes Lernen braucht keine Daten.
Was Sie stattdessen lehren sollten
Es lernt aus Interaktionen mit der Umwelt durch Trial-and-Error. Simulationsspiele helfen Schülern, Belohnungsfunktionen zu erleben und zu optimieren. Das korrigiert den Irrtum und zeigt Daten als kumulierte Erfahrungen.
Ideen für aktives Lernen
Alle Aktivitäten ansehenLernen an Stationen: Lernparadigmen erkunden
Richten Sie drei Stationen ein: Überwachtes Lernen mit gelabelten Datensätzen klassifizieren, unüberwachtes Lernen durch Clustering visualisieren, bestärkendes Lernen mit einem einfachen Spiel simulieren. Gruppen rotieren alle 10 Minuten, notieren Beobachtungen und diskutieren Anwendungen. Abschließende Plenumrunde fasst Erkenntnisse zusammen.
Datenlabeling-Challenge: Paarbeispiele
In Paaren erhalten Schüler ungelabelte Daten und labeln sie manuell für supervised Learning. Sie trainieren dann ein einfaches Modell mit Tools wie Orange oder Scratch und vergleichen Ergebnisse mit ungelabelten Ansätzen. Diskussion: Welche Datenqualität ist entscheidend?
Reinforcement Learning: Spielsimulation
Die Klasse spielt ein gemeinsames Spiel wie Tic-Tac-Toe, wobei ein Schüler als Agent Belohnungen sammelt. Andere beobachten und notieren Strategieentwicklungen. Danach modellieren Gruppen das in Pseudocode und vergleichen mit realen RL-Beispielen.
Clustering-Rallye: Muster finden
Individuell clustern Schüler Datenpunkte auf Arbeitsblättern (z.B. Kundendaten). In Kleingruppen teilen sie Ergebnisse, verfeinern Cluster und diskutieren unsupervised vs. supervised. Abschluss: Präsentation eines gemeinsamen Clusters.
Bezüge zur Lebenswelt
- Im Kundenservice von Online-Shops wie Zalando werden überwachte Lernmodelle eingesetzt, um eingehende Kundenanfragen automatisch zu klassifizieren und an die zuständigen Abteilungen weiterzuleiten.
- Banken nutzen unüberwachtes Lernen, um Muster in Transaktionsdaten zu erkennen und potenzielle Geldwäscheaktivitäten durch Anomalieerkennung zu identifizieren, ohne vorherige Beispiele für solche Aktivitäten zu benötigen.
- Autonome Fahrsysteme in Fahrzeugen von Herstellern wie Waymo oder Tesla verwenden bestärkendes Lernen, um Fahrentscheidungen in komplexen Verkehrssituationen zu treffen, basierend auf Belohnungen für sicheres Vorankommen und Strafen für Kollisionen.
Ideen zur Lernstandserhebung
Geben Sie jeder Schülerin und jedem Schüler eine Karte mit einem kurzen Szenario (z.B. 'Vorhersage von Aktienkursen', 'Gruppierung von Nachrichtenartikeln', 'Roboter lernt laufen'). Bitten Sie sie, das passende Lernparadigma (überwacht, unüberwacht, bestärkend) zu identifizieren und eine Begründung dafür zu schreiben.
Stellen Sie eine Liste von Datensätzen vor (z.B. 'Bilder von Katzen und Hunden mit Beschriftung', 'Kundenbewertungen ohne Sterne', 'Spielbrett mit Punktestand'). Lassen Sie die Schüler per Handzeichen oder digital angeben, ob der Datensatz für überwachtes, unüberwachtes oder bestärkendes Lernen am besten geeignet ist und warum.
Leiten Sie eine Diskussion mit der Frage: 'Welche Rolle spielt die Qualität und Menge der Daten für den Erfolg eines Machine Learning-Modells? Geben Sie Beispiele, wie schlechte Daten zu Fehlern führen können.' Ermutigen Sie die Schüler, ihre Antworten auf die verschiedenen Lernparadigmen zu beziehen.
Häufig gestellte Fragen
Was ist der Unterschied zwischen überwachtem und unüberwachtem Lernen?
Wie wirkt sich die Datenqualität auf Machine-Learning-Modelle aus?
Wie kann aktives Lernen das Verständnis von Machine Learning vertiefen?
Welche Beispiele gibt es für bestärkendes Lernen?
Planungsvorlagen für Informatik
Mehr in Künstliche Intelligenz und Machine Learning
Einführung in Künstliche Intelligenz
Die Schülerinnen und Schüler lernen die Definition, Geschichte und Anwendungsbereiche der KI kennen.
2 methodologies
Lineare Regression und Klassifikation
Die Schülerinnen und Schüler lernen grundlegende Machine Learning-Modelle wie lineare Regression und logistische Regression kennen.
2 methodologies
Grundlagen neuronaler Netze
Modellierung biologischer Lernprozesse durch Perzeptrone und Backpropagation.
3 methodologies
Deep Learning und Convolutional Neural Networks (CNNs)
Die Schülerinnen und Schüler lernen Deep Learning-Architekturen und CNNs für Bilderkennung kennen.
2 methodologies
Training und Evaluierung von ML-Modellen
Die Schülerinnen und Schüler lernen Methoden zur Bewertung und Optimierung von Machine Learning-Modellen.
2 methodologies
Anwendungsfelder und Grenzen von KI
Untersuchung von Large Language Models (LLM) und Computer Vision.
3 methodologies