Grundlagen des Maschinellen Lernens
Einführung in die Konzepte von überwachtem und unüberwachtem Lernen.
Über dieses Thema
Das Thema 'Grundlagen des Maschinellen Lernens' führt Schülerinnen und Schüler in die Kernkonzepte von überwachtem und unüberwachtem Lernen ein. Überwachtes Lernen basiert auf gelabelten Trainingsdaten, bei denen Algorithmen Eingaben mit korrekten Ausgaben verknüpfen, wie bei der Bildklassifikation von Katzen und Hunden. Unüberwachtes Lernen entdeckt Muster in ungelabelten Daten, etwa durch Clustering von Kundendaten für Marktsegmentierung. Diese Unterschiede verstehen hilft, die Stärken und Schwächen von KI-Modellen zu bewerten.
Trainingsdaten sind entscheidend für die Leistungsfähigkeit: Qualität und Menge beeinflussen Genauigkeit und Generalisierbarkeit. Schüler analysieren, wie Bias in Daten zu verzerrten Modellen führt, und diskutieren Anwendungen in Medizin, autonomem Fahren oder Sozialen Medien. Die KMK-Standards zu Darstellen und Interpretieren sowie Problemlösen werden durch Beispiele und Fallstudien umgesetzt.
Aktives Lernen fördert hier tiefes Verständnis, da Schüler Konzepte selbst anwenden, Beispiele kategorisieren und Grenzen diskutieren. Es stärkt kritisches Denken und verbindet Theorie mit Praxis.
Leitfragen
- Erklären Sie den Unterschied zwischen überwachtem und unüberwachtem Lernen anhand von Beispielen.
- Analysieren Sie die Bedeutung von Trainingsdaten für die Leistungsfähigkeit von KI-Modellen.
- Bewerten Sie die Grenzen und Potenziale des Maschinellen Lernens in verschiedenen Anwendungsbereichen.
Lernziele
- Klassifizieren Sie gegebene Datensätze als Beispiele für überwachtes oder unüberwachtes Lernen.
- Analysieren Sie die Auswirkungen von Datenqualität und -quantität auf die Vorhersagegenauigkeit eines KI-Modells.
- Bewerten Sie die ethischen Implikationen des Einsatzes von KI-Modellen in der personalisierten Werbung.
- Erklären Sie den Unterschied zwischen Supervised und Unsupervised Learning anhand von zwei konkreten Anwendungsbeispielen.
- Entwerfen Sie ein einfaches Experiment zur Untersuchung des Einflusses von Trainingsdaten auf die Leistung eines Klassifikationsalgorithmus.
Bevor es losgeht
Warum: Schüler müssen grundlegende Konzepte der Datenorganisation und -analyse verstehen, um die Rolle von Trainingsdaten im maschinellen Lernen nachvollziehen zu können.
Warum: Ein Verständnis dafür, wie Algorithmen schrittweise Anweisungen ausführen, ist notwendig, um zu verstehen, wie Lernalgorithmen auf Daten angewendet werden.
Schlüsselvokabular
| Überwachtes Lernen | Ein Ansatz des maschinellen Lernens, bei dem ein Modell anhand von gelabelten Trainingsdaten lernt, d.h. Eingabe-Ausgabe-Paaren. |
| Unüberwachtes Lernen | Ein Ansatz des maschinellen Lernens, bei dem ein Modell Muster in ungelabelten Daten erkennt, ohne vorgegebene Ausgaben. |
| Trainingsdaten | Die Datenmenge, die verwendet wird, um ein maschinelles Lernmodell zu trainieren und seine Parameter anzupassen. |
| Label | Die korrekte Ausgabe oder Kategorie, die einem Datensatz im überwachten Lernen zugeordnet ist. |
| Clustering | Eine Technik des unüberwachten Lernens, die darauf abzielt, eine Menge von Objekten so zu gruppieren, dass Objekte in derselben Gruppe (Cluster) ähnlicher sind als in anderen Gruppen. |
Vorsicht vor diesen Fehlvorstellungen
Häufige FehlvorstellungMaschinelles Lernen funktioniert wie menschliches Lernen mit Intuition.
Was Sie stattdessen lehren sollten
Algorithmen lernen rein datenbasiert durch Optimierung mathematischer Funktionen, ohne Bewusstsein oder Verständnis.
Häufige FehlvorstellungÜberwachtes Lernen ist immer besser als unüberwachtes.
Was Sie stattdessen lehren sollten
Unüberwachtes Lernen eignet sich für explorative Aufgaben ohne Labels, wo überwachtes scheitert, z. B. Anomalieerkennung.
Häufige FehlvorstellungMehr Daten bedeuten immer bessere Modelle.
Was Sie stattdessen lehren sollten
Qualität, Vielfalt und Repräsentativität der Daten sind entscheidend; schlechte Daten führen zu Overfitting oder Bias.
Ideen für aktives Lernen
Alle Aktivitäten ansehenPärchenarbeit: Lernarten klassifizieren
Schüler erhalten Beispiele aus dem Alltag und ordnen sie überwachtem oder unüberwachtem Lernen zu. Sie begründen ihre Entscheidung und notieren Vor- und Nachteile. Gemeinsam erstellen sie ein Vergleichsposter.
Gruppenarbeit: Trainingsdaten analysieren
Gruppen untersuchen reale Datensätze auf Qualität, Bias und Relevanz. Sie simulieren Modelltraining und prognostizieren Leistungsprobleme. Ergebnisse werden in einer Präsentation zusammengefasst.
Individuelle Aufgabe: Fallstudie bewerten
Jeder Schüler wählt eine Anwendung wie Spracherkennung und bewertet Potenziale sowie Grenzen basierend auf Lernarten. Eine kurze Reflexion schließt ab.
Ganzer-Klasse-Diskussion: Ethikfragen
Die Klasse diskutiert gesellschaftliche Implikationen von ML, z. B. Datenschutz. Moderatoren leiten und notieren Konsenspunkte.
Bezüge zur Lebenswelt
- In der Medizin werden KI-Modelle für die Diagnose von Krankheiten eingesetzt. Überwachtes Lernen analysiert medizinische Bilder (z.B. Röntgenaufnahmen) mit bekannten Diagnosen, um neue Bilder zu klassifizieren. Unüberwachtes Lernen kann Muster in Patientendaten erkennen, die auf bisher unbekannte Krankheitscluster hinweisen.
- Autonome Fahrzeuge nutzen maschinelles Lernen zur Objekterkennung und Navigation. Sensordaten (Kameras, Lidar) werden mit Labels (z.B. 'Auto', 'Fußgänger') trainiert, um die Umgebung zu verstehen. Unüberwachtes Lernen kann helfen, ungewöhnliche Verkehrssituationen zu identifizieren.
- Online-Shopping-Plattformen wie Amazon verwenden Clustering-Algorithmen (unüberwachtes Lernen), um Kundensegmente zu bilden und personalisierte Produktempfehlungen zu generieren. Dies basiert auf dem Kaufverhalten und den angesehenen Produkten, ohne explizite Labels für jeden Kunden.
Ideen zur Lernstandserhebung
Die Schüler erhalten zwei kurze Szenarien: 1. Ein System, das Spam-E-Mails erkennt, basierend auf vielen Beispielen von Spam und Nicht-Spam. 2. Ein System, das Kunden in verschiedene Gruppen basierend auf ihrem Einkaufsverhalten einteilt. Die Schüler schreiben für jedes Szenario, ob es sich um überwachtes oder unüberwachtes Lernen handelt und begründen ihre Wahl kurz.
Stellen Sie die Frage: 'Stellen Sie sich vor, Sie trainieren ein KI-Modell, um die Qualität von Äpfeln anhand von Bildern zu beurteilen. Welche Art von Daten würden Sie benötigen? Wie würden Sie sicherstellen, dass die Daten repräsentativ sind und keine Verzerrungen (Bias) enthalten? Diskutieren Sie die möglichen Konsequenzen von schlechten Trainingsdaten für die Zuverlässigkeit des Modells.'
Geben Sie den Schülern eine Liste von Begriffen (z.B. 'Klassifikation', 'Regression', 'Clustering', 'Dimensionsreduktion'). Bitten Sie sie, jeden Begriff entweder dem überwachten oder unüberwachten Lernen zuzuordnen und eine kurze Begründung zu geben.
Häufig gestellte Fragen
Was ist der Hauptunterschied zwischen überwachtem und unüberwachtem Lernen?
Warum sind Trainingsdaten so wichtig für KI-Modelle?
Warum ist aktives Lernen in diesem Thema besonders wirksam?
Welche Grenzen hat maschinelles Lernen in der Praxis?
Planungsvorlagen für Informatik
Mehr in Informatik, Mensch und Gesellschaft
Künstliche Intelligenz und Ethik
Funktionsweise von Machine Learning und die Problematik von Bias in Algorithmen.
2 methodologies
Automatisierung und Arbeitswelt
Veränderung von Berufsbildern und wirtschaftlichen Strukturen durch Software.
2 methodologies
Digitale Souveränität
Bedeutung von Open Source, Standards und Kontrolle über die eigene digitale Identität.
2 methodologies
Urheberrecht und Lizenzen in der Softwareentwicklung
Die Schülerinnen und Schüler verstehen die rechtlichen Rahmenbedingungen für Software und digitale Inhalte.
2 methodologies
Digitale Spuren und Privatsphäre
Reflexion über die Erfassung und Nutzung persönlicher Daten im Internet.
2 methodologies
Cyberkriminalität und IT-Sicherheit
Einführung in gängige Bedrohungen und Schutzmaßnahmen im digitalen Raum.
2 methodologies