Informatik · Klasse 11 · Informatik, Mensch und Gesellschaft · 2. Halbjahr

Grundlagen des Maschinellen Lernens

Einführung in die Konzepte von überwachtem und unüberwachtem Lernen.

Kurzfassung:Aktives Lernen funktioniert hier besonders gut, weil die Unterscheidung zwischen überwachtem und unüberwachtem Lernen durch konkrete Beispiele und praktische Auseinandersetzung mit echten Daten besser verständlich wird. Schülerinnen und Schüler entwickeln ein intuitives Verständnis für die Unterschiede und Anwendungsfälle, wenn sie die Konzepte direkt anwenden und diskutieren.

KMK BildungsstandardsKMK: Sekundarstufe II - Darstellen und InterpretierenKMK: Sekundarstufe II - Problemlösen

Über dieses Thema

Das Thema 'Grundlagen des Maschinellen Lernens' führt Schülerinnen und Schüler in die Kernkonzepte von überwachtem und unüberwachtem Lernen ein. Überwachtes Lernen basiert auf gelabelten Trainingsdaten, bei denen Algorithmen Eingaben mit korrekten Ausgaben verknüpfen, wie bei der Bildklassifikation von Katzen und Hunden. Unüberwachtes Lernen entdeckt Muster in ungelabelten Daten, etwa durch Clustering von Kundendaten für Marktsegmentierung. Diese Unterschiede verstehen hilft, die Stärken und Schwächen von KI-Modellen zu bewerten.

Trainingsdaten sind entscheidend für die Leistungsfähigkeit: Qualität und Menge beeinflussen Genauigkeit und Generalisierbarkeit. Schüler analysieren, wie Bias in Daten zu verzerrten Modellen führt, und diskutieren Anwendungen in Medizin, autonomem Fahren oder Sozialen Medien. Die KMK-Standards zu Darstellen und Interpretieren sowie Problemlösen werden durch Beispiele und Fallstudien umgesetzt.

Aktives Lernen fördert hier tiefes Verständnis, da Schüler Konzepte selbst anwenden, Beispiele kategorisieren und Grenzen diskutieren. Es stärkt kritisches Denken und verbindet Theorie mit Praxis.

Leitfragen

Erklären Sie den Unterschied zwischen überwachtem und unüberwachtem Lernen anhand von Beispielen.
Analysieren Sie die Bedeutung von Trainingsdaten für die Leistungsfähigkeit von KI-Modellen.
Bewerten Sie die Grenzen und Potenziale des Maschinellen Lernens in verschiedenen Anwendungsbereichen.

Lernziele

Klassifizieren Sie gegebene Datensätze als Beispiele für überwachtes oder unüberwachtes Lernen.
Analysieren Sie die Auswirkungen von Datenqualität und -quantität auf die Vorhersagegenauigkeit eines KI-Modells.
Bewerten Sie die ethischen Implikationen des Einsatzes von KI-Modellen in der personalisierten Werbung.
Erklären Sie den Unterschied zwischen Supervised und Unsupervised Learning anhand von zwei konkreten Anwendungsbeispielen.
Entwerfen Sie ein einfaches Experiment zur Untersuchung des Einflusses von Trainingsdaten auf die Leistung eines Klassifikationsalgorithmus.

Bevor es losgeht

Grundlagen der Datenverarbeitung und -analyse

Warum: Schüler müssen grundlegende Konzepte der Datenorganisation und -analyse verstehen, um die Rolle von Trainingsdaten im maschinellen Lernen nachvollziehen zu können.

Einführung in Algorithmen und ihre Funktionsweise

Warum: Ein Verständnis dafür, wie Algorithmen schrittweise Anweisungen ausführen, ist notwendig, um zu verstehen, wie Lernalgorithmen auf Daten angewendet werden.

Schlüsselvokabular

Überwachtes Lernen	Ein Ansatz des maschinellen Lernens, bei dem ein Modell anhand von gelabelten Trainingsdaten lernt, d.h. Eingabe-Ausgabe-Paaren.
Unüberwachtes Lernen	Ein Ansatz des maschinellen Lernens, bei dem ein Modell Muster in ungelabelten Daten erkennt, ohne vorgegebene Ausgaben.
Trainingsdaten	Die Datenmenge, die verwendet wird, um ein maschinelles Lernmodell zu trainieren und seine Parameter anzupassen.
Label	Die korrekte Ausgabe oder Kategorie, die einem Datensatz im überwachten Lernen zugeordnet ist.
Clustering	Eine Technik des unüberwachten Lernens, die darauf abzielt, eine Menge von Objekten so zu gruppieren, dass Objekte in derselben Gruppe (Cluster) ähnlicher sind als in anderen Gruppen.

Vorsicht vor diesen Fehlvorstellungen

Häufige FehlvorstellungMaschinelles Lernen funktioniert wie menschliches Lernen mit Intuition.

Was Sie stattdessen lehren sollten

Algorithmen lernen rein datenbasiert durch Optimierung mathematischer Funktionen, ohne Bewusstsein oder Verständnis.

Häufige FehlvorstellungÜberwachtes Lernen ist immer besser als unüberwachtes.

Was Sie stattdessen lehren sollten

Unüberwachtes Lernen eignet sich für explorative Aufgaben ohne Labels, wo überwachtes scheitert, z. B. Anomalieerkennung.

Häufige FehlvorstellungMehr Daten bedeuten immer bessere Modelle.

Was Sie stattdessen lehren sollten

Qualität, Vielfalt und Repräsentativität der Daten sind entscheidend; schlechte Daten führen zu Overfitting oder Bias.

Ideen für aktives Lernen

Alle Aktivitäten ansehen→

Forschend-entdeckendes Lernen

Pärchenarbeit: Lernarten klassifizieren

Schüler erhalten Beispiele aus dem Alltag und ordnen sie überwachtem oder unüberwachtem Lernen zu. Sie begründen ihre Entscheidung und notieren Vor- und Nachteile. Gemeinsam erstellen sie ein Vergleichsposter.

20 Min.·Partnerarbeit

Forschend-entdeckendes Lernen

Gruppenarbeit: Trainingsdaten analysieren

Gruppen untersuchen reale Datensätze auf Qualität, Bias und Relevanz. Sie simulieren Modelltraining und prognostizieren Leistungsprobleme. Ergebnisse werden in einer Präsentation zusammengefasst.

30 Min.·Kleingruppen

Forschend-entdeckendes Lernen

Individuelle Aufgabe: Fallstudie bewerten

Jeder Schüler wählt eine Anwendung wie Spracherkennung und bewertet Potenziale sowie Grenzen basierend auf Lernarten. Eine kurze Reflexion schließt ab.

15 Min.·Einzelarbeit

Bezüge zur Lebenswelt

In der Medizin werden KI-Modelle für die Diagnose von Krankheiten eingesetzt. Überwachtes Lernen analysiert medizinische Bilder (z.B. Röntgenaufnahmen) mit bekannten Diagnosen, um neue Bilder zu klassifizieren. Unüberwachtes Lernen kann Muster in Patientendaten erkennen, die auf bisher unbekannte Krankheitscluster hinweisen.
Autonome Fahrzeuge nutzen maschinelles Lernen zur Objekterkennung und Navigation. Sensordaten (Kameras, Lidar) werden mit Labels (z.B. 'Auto', 'Fußgänger') trainiert, um die Umgebung zu verstehen. Unüberwachtes Lernen kann helfen, ungewöhnliche Verkehrssituationen zu identifizieren.
Online-Shopping-Plattformen wie Amazon verwenden Clustering-Algorithmen (unüberwachtes Lernen), um Kundensegmente zu bilden und personalisierte Produktempfehlungen zu generieren. Dies basiert auf dem Kaufverhalten und den angesehenen Produkten, ohne explizite Labels für jeden Kunden.

Ideen zur Lernstandserhebung

Lernstandskontrolle

Die Schüler erhalten zwei kurze Szenarien: 1. Ein System, das Spam-E-Mails erkennt, basierend auf vielen Beispielen von Spam und Nicht-Spam. 2. Ein System, das Kunden in verschiedene Gruppen basierend auf ihrem Einkaufsverhalten einteilt. Die Schüler schreiben für jedes Szenario, ob es sich um überwachtes oder unüberwachtes Lernen handelt und begründen ihre Wahl kurz.

Diskussionsfrage

Stellen Sie die Frage: 'Stellen Sie sich vor, Sie trainieren ein KI-Modell, um die Qualität von Äpfeln anhand von Bildern zu beurteilen. Welche Art von Daten würden Sie benötigen? Wie würden Sie sicherstellen, dass die Daten repräsentativ sind und keine Verzerrungen (Bias) enthalten? Diskutieren Sie die möglichen Konsequenzen von schlechten Trainingsdaten für die Zuverlässigkeit des Modells.'

Kurze Überprüfung

Geben Sie den Schülern eine Liste von Begriffen (z.B. 'Klassifikation', 'Regression', 'Clustering', 'Dimensionsreduktion'). Bitten Sie sie, jeden Begriff entweder dem überwachten oder unüberwachten Lernen zuzuordnen und eine kurze Begründung zu geben.

Häufig gestellte Fragen

Was ist der Hauptunterschied zwischen überwachtem und unüberwachtem Lernen?

Beim überwachten Lernen trainiert das Modell mit gelabelten Daten, also Eingaben mit bekannten Ausgaben, wie Klassifikation von E-Mails als Spam oder nicht. Unüberwachtes Lernen arbeitet mit ungelabelten Daten und findet Strukturen, z. B. Kundenclusterung. Dieser Unterschied beeinflusst die Anwendbarkeit: Überwachtes ist präzise bei klaren Zielen, unüberwachtes explorativ. Beispiele festigen das Verständnis.

Warum sind Trainingsdaten so wichtig für KI-Modelle?

Trainingsdaten bestimmen die Generalisierbarkeit und Genauigkeit eines Modells. Hohe Qualität, Vielfalt und Menge verhindern Overfitting und Bias. Schlechte Daten führen zu Fehlern in der Praxis, z. B. diskriminierende Gesichtserkennung. Schüler lernen, Datenquellen kritisch zu prüfen, um faire Modelle zu fördern. Dies verbindet Informatik mit gesellschaftlichen Aspekten.

Warum ist aktives Lernen in diesem Thema besonders wirksam?

Aktives Lernen lässt Schüler Konzepte wie Lernarten selbst anwenden, z. B. durch Klassifikation realer Beispiele oder Simulation von Datensätzen. Es fördert Problemlösen und kritisches Denken, wie in KMK-Standards gefordert. Diskussionen zu Grenzen stärken Argumentation. Im Vergleich zu Frontalunterricht bleibt Wissen besser haften, da Schüler Verbindungen zu Gesellschaft herstellen.

Welche Grenzen hat maschinelles Lernen in der Praxis?

ML scheitert bei knappen oder biased Daten, erfordert hohe Rechenleistung und interpretiert keine Kausalität. 'Black-Box'-Probleme erschweren Erklärbarkeit, z. B. in Medizin. Potenziale liegen in Skalierbarkeit, Grenzen in Ethik und Robustheit. Schüler bewerten Anwendungen, um verantwortungsvollen Einsatz zu fördern.

Planungsvorlagen für Informatik

Unterrichtsplan

MINT

Eine MINT Vorlage, die auf dem Engineering Design Process basiert. Sie integriert Mathematik, Informatik, Naturwissenschaft und Technik durch reale Herausforderungen, die Lernende untersuchen und lösen.

Mehr in Informatik, Mensch und Gesellschaft

Künstliche Intelligenz und Ethik

Funktionsweise von Machine Learning und die Problematik von Bias in Algorithmen.

8 methodologies

Automatisierung und Arbeitswelt

Veränderung von Berufsbildern und wirtschaftlichen Strukturen durch Software.

8 methodologies

Digitale Souveränität

Bedeutung von Open Source, Standards und Kontrolle über die eigene digitale Identität.

8 methodologies

Urheberrecht und Lizenzen in der Softwareentwicklung

Die Schülerinnen und Schüler verstehen die rechtlichen Rahmenbedingungen für Software und digitale Inhalte.

8 methodologies

Digitale Spuren und Privatsphäre

Reflexion über die Erfassung und Nutzung persönlicher Daten im Internet.

8 methodologies

Cyberkriminalität und IT-Sicherheit

Einführung in gängige Bedrohungen und Schutzmaßnahmen im digitalen Raum.

8 methodologies

Edited by Adriana Perusin, Editor-in-Chief, Flip Education