Zum Inhalt springen
Informatik · Klasse 11 · Informatik, Mensch und Gesellschaft · 2. Halbjahr

Grundlagen des Maschinellen Lernens

Einführung in die Konzepte von überwachtem und unüberwachtem Lernen.

KMK BildungsstandardsKMK: Sekundarstufe II - Darstellen und InterpretierenKMK: Sekundarstufe II - Problemlösen

Über dieses Thema

Das Thema 'Grundlagen des Maschinellen Lernens' führt Schülerinnen und Schüler in die Kernkonzepte von überwachtem und unüberwachtem Lernen ein. Überwachtes Lernen basiert auf gelabelten Trainingsdaten, bei denen Algorithmen Eingaben mit korrekten Ausgaben verknüpfen, wie bei der Bildklassifikation von Katzen und Hunden. Unüberwachtes Lernen entdeckt Muster in ungelabelten Daten, etwa durch Clustering von Kundendaten für Marktsegmentierung. Diese Unterschiede verstehen hilft, die Stärken und Schwächen von KI-Modellen zu bewerten.

Trainingsdaten sind entscheidend für die Leistungsfähigkeit: Qualität und Menge beeinflussen Genauigkeit und Generalisierbarkeit. Schüler analysieren, wie Bias in Daten zu verzerrten Modellen führt, und diskutieren Anwendungen in Medizin, autonomem Fahren oder Sozialen Medien. Die KMK-Standards zu Darstellen und Interpretieren sowie Problemlösen werden durch Beispiele und Fallstudien umgesetzt.

Aktives Lernen fördert hier tiefes Verständnis, da Schüler Konzepte selbst anwenden, Beispiele kategorisieren und Grenzen diskutieren. Es stärkt kritisches Denken und verbindet Theorie mit Praxis.

Leitfragen

  1. Erklären Sie den Unterschied zwischen überwachtem und unüberwachtem Lernen anhand von Beispielen.
  2. Analysieren Sie die Bedeutung von Trainingsdaten für die Leistungsfähigkeit von KI-Modellen.
  3. Bewerten Sie die Grenzen und Potenziale des Maschinellen Lernens in verschiedenen Anwendungsbereichen.

Lernziele

  • Klassifizieren Sie gegebene Datensätze als Beispiele für überwachtes oder unüberwachtes Lernen.
  • Analysieren Sie die Auswirkungen von Datenqualität und -quantität auf die Vorhersagegenauigkeit eines KI-Modells.
  • Bewerten Sie die ethischen Implikationen des Einsatzes von KI-Modellen in der personalisierten Werbung.
  • Erklären Sie den Unterschied zwischen Supervised und Unsupervised Learning anhand von zwei konkreten Anwendungsbeispielen.
  • Entwerfen Sie ein einfaches Experiment zur Untersuchung des Einflusses von Trainingsdaten auf die Leistung eines Klassifikationsalgorithmus.

Bevor es losgeht

Grundlagen der Datenverarbeitung und -analyse

Warum: Schüler müssen grundlegende Konzepte der Datenorganisation und -analyse verstehen, um die Rolle von Trainingsdaten im maschinellen Lernen nachvollziehen zu können.

Einführung in Algorithmen und ihre Funktionsweise

Warum: Ein Verständnis dafür, wie Algorithmen schrittweise Anweisungen ausführen, ist notwendig, um zu verstehen, wie Lernalgorithmen auf Daten angewendet werden.

Schlüsselvokabular

Überwachtes LernenEin Ansatz des maschinellen Lernens, bei dem ein Modell anhand von gelabelten Trainingsdaten lernt, d.h. Eingabe-Ausgabe-Paaren.
Unüberwachtes LernenEin Ansatz des maschinellen Lernens, bei dem ein Modell Muster in ungelabelten Daten erkennt, ohne vorgegebene Ausgaben.
TrainingsdatenDie Datenmenge, die verwendet wird, um ein maschinelles Lernmodell zu trainieren und seine Parameter anzupassen.
LabelDie korrekte Ausgabe oder Kategorie, die einem Datensatz im überwachten Lernen zugeordnet ist.
ClusteringEine Technik des unüberwachten Lernens, die darauf abzielt, eine Menge von Objekten so zu gruppieren, dass Objekte in derselben Gruppe (Cluster) ähnlicher sind als in anderen Gruppen.

Vorsicht vor diesen Fehlvorstellungen

Häufige FehlvorstellungMaschinelles Lernen funktioniert wie menschliches Lernen mit Intuition.

Was Sie stattdessen lehren sollten

Algorithmen lernen rein datenbasiert durch Optimierung mathematischer Funktionen, ohne Bewusstsein oder Verständnis.

Häufige FehlvorstellungÜberwachtes Lernen ist immer besser als unüberwachtes.

Was Sie stattdessen lehren sollten

Unüberwachtes Lernen eignet sich für explorative Aufgaben ohne Labels, wo überwachtes scheitert, z. B. Anomalieerkennung.

Häufige FehlvorstellungMehr Daten bedeuten immer bessere Modelle.

Was Sie stattdessen lehren sollten

Qualität, Vielfalt und Repräsentativität der Daten sind entscheidend; schlechte Daten führen zu Overfitting oder Bias.

Ideen für aktives Lernen

Alle Aktivitäten ansehen

Bezüge zur Lebenswelt

  • In der Medizin werden KI-Modelle für die Diagnose von Krankheiten eingesetzt. Überwachtes Lernen analysiert medizinische Bilder (z.B. Röntgenaufnahmen) mit bekannten Diagnosen, um neue Bilder zu klassifizieren. Unüberwachtes Lernen kann Muster in Patientendaten erkennen, die auf bisher unbekannte Krankheitscluster hinweisen.
  • Autonome Fahrzeuge nutzen maschinelles Lernen zur Objekterkennung und Navigation. Sensordaten (Kameras, Lidar) werden mit Labels (z.B. 'Auto', 'Fußgänger') trainiert, um die Umgebung zu verstehen. Unüberwachtes Lernen kann helfen, ungewöhnliche Verkehrssituationen zu identifizieren.
  • Online-Shopping-Plattformen wie Amazon verwenden Clustering-Algorithmen (unüberwachtes Lernen), um Kundensegmente zu bilden und personalisierte Produktempfehlungen zu generieren. Dies basiert auf dem Kaufverhalten und den angesehenen Produkten, ohne explizite Labels für jeden Kunden.

Ideen zur Lernstandserhebung

Lernstandskontrolle

Die Schüler erhalten zwei kurze Szenarien: 1. Ein System, das Spam-E-Mails erkennt, basierend auf vielen Beispielen von Spam und Nicht-Spam. 2. Ein System, das Kunden in verschiedene Gruppen basierend auf ihrem Einkaufsverhalten einteilt. Die Schüler schreiben für jedes Szenario, ob es sich um überwachtes oder unüberwachtes Lernen handelt und begründen ihre Wahl kurz.

Diskussionsfrage

Stellen Sie die Frage: 'Stellen Sie sich vor, Sie trainieren ein KI-Modell, um die Qualität von Äpfeln anhand von Bildern zu beurteilen. Welche Art von Daten würden Sie benötigen? Wie würden Sie sicherstellen, dass die Daten repräsentativ sind und keine Verzerrungen (Bias) enthalten? Diskutieren Sie die möglichen Konsequenzen von schlechten Trainingsdaten für die Zuverlässigkeit des Modells.'

Kurze Überprüfung

Geben Sie den Schülern eine Liste von Begriffen (z.B. 'Klassifikation', 'Regression', 'Clustering', 'Dimensionsreduktion'). Bitten Sie sie, jeden Begriff entweder dem überwachten oder unüberwachten Lernen zuzuordnen und eine kurze Begründung zu geben.

Häufig gestellte Fragen

Was ist der Hauptunterschied zwischen überwachtem und unüberwachtem Lernen?
Beim überwachten Lernen trainiert das Modell mit gelabelten Daten, also Eingaben mit bekannten Ausgaben, wie Klassifikation von E-Mails als Spam oder nicht. Unüberwachtes Lernen arbeitet mit ungelabelten Daten und findet Strukturen, z. B. Kundenclusterung. Dieser Unterschied beeinflusst die Anwendbarkeit: Überwachtes ist präzise bei klaren Zielen, unüberwachtes explorativ. Beispiele festigen das Verständnis.
Warum sind Trainingsdaten so wichtig für KI-Modelle?
Trainingsdaten bestimmen die Generalisierbarkeit und Genauigkeit eines Modells. Hohe Qualität, Vielfalt und Menge verhindern Overfitting und Bias. Schlechte Daten führen zu Fehlern in der Praxis, z. B. diskriminierende Gesichtserkennung. Schüler lernen, Datenquellen kritisch zu prüfen, um faire Modelle zu fördern. Dies verbindet Informatik mit gesellschaftlichen Aspekten.
Warum ist aktives Lernen in diesem Thema besonders wirksam?
Aktives Lernen lässt Schüler Konzepte wie Lernarten selbst anwenden, z. B. durch Klassifikation realer Beispiele oder Simulation von Datensätzen. Es fördert Problemlösen und kritisches Denken, wie in KMK-Standards gefordert. Diskussionen zu Grenzen stärken Argumentation. Im Vergleich zu Frontalunterricht bleibt Wissen besser haften, da Schüler Verbindungen zu Gesellschaft herstellen.
Welche Grenzen hat maschinelles Lernen in der Praxis?
ML scheitert bei knappen oder biased Daten, erfordert hohe Rechenleistung und interpretiert keine Kausalität. 'Black-Box'-Probleme erschweren Erklärbarkeit, z. B. in Medizin. Potenziale liegen in Skalierbarkeit, Grenzen in Ethik und Robustheit. Schüler bewerten Anwendungen, um verantwortungsvollen Einsatz zu fördern.

Planungsvorlagen für Informatik