Zum Inhalt springen
Informatik · Klasse 13 · Künstliche Intelligenz und Machine Learning · 2. Halbjahr

Deep Learning und Convolutional Neural Networks (CNNs)

Die Schülerinnen und Schüler lernen Deep Learning-Architekturen und CNNs für Bilderkennung kennen.

KMK BildungsstandardsKMK: Sekundarstufe II - AlgorithmenKMK: Sekundarstufe II - Informatiksysteme

Über dieses Thema

Deep Learning und Convolutional Neural Networks (CNNs) stellen fortgeschrittene Architekturen dar, die Schülerinnen und Schüler in der Oberstufe intensiv mit Bilderkennung vertraut machen. CNNs basieren auf mehreren Schichten: Konvolutionsschichten extrahieren lokale Merkmale wie Kanten und Texturen durch Filterkerne, Pooling-Schichten reduzieren die Datenmenge und erhöhen die Translationinvarianz, während voll verbundene Schichten die Klassifikation abschließen. Diese Struktur ermöglicht es Modellen, komplexe Bilder wie Fotos von Tieren oder Gesichtern präzise zu analysieren.

Im Rahmen der KMK-Standards zu Algorithmen und Informatiksystemen lernen Schülerinnen und Schüler, die Funktionsweise zu erklären, Anwendungen in der Computer Vision wie autonomes Fahren oder medizinische Diagnostik zu analysieren und Herausforderungen beim Training wie Overfitting, benötigte Rechenleistung oder Datensätze zu bewerten. Dies fördert systemisches Denken über neuronale Netze als komplexe Algorithmen.

Aktives Lernen eignet sich hervorragend für dieses Thema, da abstrakte Schichten durch praktische Experimente mit Tools wie Keras greifbar werden. Wenn Schülerinnen und Schüler eigene CNNs für Bildklassifikation trainieren und Parameter anpassen, verstehen sie Trainingsdynamiken intuitiv und entdecken Limitationen durch Trial-and-Error.

Leitfragen

  1. Erklären Sie die Funktionsweise von Convolutional Neural Networks (CNNs).
  2. Analysieren Sie die Anwendungsbereiche von CNNs in der Computer Vision.
  3. Bewerten Sie die Herausforderungen beim Training von Deep Learning-Modellen.

Lernziele

  • Erklären Sie die Funktionsweise von Konvolutions-, Pooling- und voll verbundenen Schichten in einem CNN.
  • Analysieren Sie die Schritte zur Bilderkennung mit einem CNN, von der Merkmalsextraktion bis zur Klassifikation.
  • Bewerten Sie die Auswirkungen von Hyperparametern wie Lernrate und Batch-Größe auf die Trainingsleistung eines CNN.
  • Entwerfen Sie ein einfaches CNN-Modell für eine gegebene Bildklassifikationsaufgabe.
  • Vergleichen Sie die Effektivität von CNNs mit traditionellen Machine-Learning-Algorithmen für Bildverarbeitungsaufgaben.

Bevor es losgeht

Grundlagen Neuronaler Netze

Warum: Ein grundlegendes Verständnis von Neuronen, Schichten, Gewichten und Aktivierungsfunktionen ist notwendig, um die Funktionsweise von CNNs nachzuvollziehen.

Algorithmen und Datenstrukturen

Warum: Kenntnisse über Algorithmen und die Verarbeitung von Datenstrukturen (wie Matrizen) sind essenziell für das Verständnis der Operationen in Konvolutions- und Pooling-Schichten.

Lineare Algebra (Grundlagen)

Warum: Grundlegende Kenntnisse über Matrizenoperationen und Vektoren sind hilfreich, um die mathematischen Operationen innerhalb der Schichten eines CNN zu verstehen.

Schlüsselvokabular

KonvolutionsschichtEine Schicht in einem CNN, die Filter verwendet, um lokale Muster und Merkmale wie Kanten oder Texturen in einem Eingabebild zu erkennen.
Pooling-SchichtEine Schicht, die die räumliche Größe von Merkmalen reduziert, um die Rechenlast zu verringern und die Robustheit gegenüber Verschiebungen zu erhöhen, z. B. Max-Pooling.
Filter (Kernel)Eine kleine Matrix von Gewichten, die über das Eingabebild geschoben wird, um spezifische Merkmale zu extrahieren.
OverfittingEin Problem beim Training, bei dem ein Modell die Trainingsdaten zu gut lernt und schlecht auf neuen, ungesehenen Daten generalisiert.
AktivierungsfunktionEine nichtlineare Funktion (z. B. ReLU), die auf die Ausgabe einer Schicht angewendet wird, um dem Netzwerk die Modellierung komplexer Beziehungen zu ermöglichen.

Vorsicht vor diesen Fehlvorstellungen

Häufige FehlvorstellungCNNs verstehen Bilder wie Menschen.

Was Sie stattdessen lehren sollten

CNNs lernen statistische Muster durch Pixelkorrelationen, ohne semantisches Verständnis. Aktive Experimente, bei denen Schüler manipulierte Bilder testen, zeigen dies: Das Modell scheitert bei Rotationen, während Menschen adaptieren. Gruppendiskussionen klären den Unterschied.

Häufige FehlvorstellungMehr Schichten bedeuten immer bessere Ergebnisse.

Was Sie stattdessen lehren sollten

Tiefe erhöht Kapazität, birgt aber Vanishing Gradients und Overfitting. Schüler entdecken dies durch schrittweises Hinzufügen von Schichten in Simulationen. Peer-Reviews der Trainingskurven fördern kritisches Bewerten.

Häufige FehlvorstellungCNNs brauchen keine großen Datensätze.

Was Sie stattdessen lehren sollten

Ohne ausreichend Daten generalisieren sie schlecht. Hands-on-Training mit kleinen vs. großen Sets verdeutlicht Bias. Kollaborative Datensammlung in der Klasse unterstreicht die Notwendigkeit.

Ideen für aktives Lernen

Alle Aktivitäten ansehen

Bezüge zur Lebenswelt

  • Automobilhersteller wie Tesla und Waymo nutzen CNNs intensiv für die Objekterkennung in autonomen Fahrsystemen, um Fußgänger, Fahrzeuge und Verkehrszeichen zu identifizieren.
  • In der medizinischen Bildgebung setzen Radiologen und Forscher CNNs zur Analyse von Röntgenbildern, CT-Scans und MRTs ein, um Anomalien wie Tumore frühzeitig zu erkennen und die Diagnose zu unterstützen.
  • Soziale Medienplattformen wie Facebook und Instagram verwenden CNNs zur automatischen Bilderkennung und -kategorisierung, was Funktionen wie Gesichtserkennung oder das Vorschlagen von Bildunterschriften ermöglicht.

Ideen zur Lernstandserhebung

Lernstandskontrolle

Geben Sie den Schülerinnen und Schülern ein einfaches Bild (z. B. Katze, Hund). Bitten Sie sie, die wichtigsten Schichten eines CNN zu benennen, die zur Klassifikation dieses Bildes benötigt werden, und kurz zu erklären, welche Funktion jede Schicht erfüllt.

Kurze Überprüfung

Stellen Sie eine Frage wie: 'Was passiert, wenn die Filtergröße in der Konvolutionsschicht eines CNN verringert wird?' oder 'Welche Gefahr besteht, wenn ein CNN mit zu wenigen Trainingsdaten trainiert wird?' Sammeln Sie Antworten per Handzeichen oder digital.

Diskussionsfrage

Leiten Sie eine Diskussion mit der Frage: 'Welche ethischen Überlegungen sind beim Einsatz von CNNs für die Gesichtserkennung relevant?' Ermutigen Sie die Schülerinnen und Schüler, verschiedene Perspektiven zu beleuchten, wie Datenschutz und potenzielle Diskriminierung.

Häufig gestellte Fragen

Wie funktioniert eine Convolutional Neural Network (CNN)?
Eine CNN verarbeitet Bilder schrittweise: Konvolutionsschichten wenden Filter an, um Merkmale wie Kanten zu extrahieren. Pooling reduziert Dimensionen, Aktivierungsfunktionen wie ReLU fügen Nichtlinearität hinzu. Am Ende klassifizieren fully connected layers. Dies ermöglicht hierarchische Merkmalsextraktion für hohe Genauigkeit in der Bilderkennung, wie bei Objekterkennung in Fotos.
Welche Anwendungen haben CNNs in der Computer Vision?
CNNs dienen autonomem Fahren zur Objekterkennung, medizinischer Bildanalyse für Tumore, Gesichtserkennung in Smartphones und Qualitätskontrolle in der Industrie. Sie analysieren Echtzeitvideos effizient. Schülerinnen und Schüler lernen, ethische Aspekte wie Bias in Trainingsdaten zu bewerten, was reale Systeme verbessert.
Wie kann aktives Lernen beim Verständnis von CNNs helfen?
Aktives Lernen macht CNNs durch praktische Umsetzung greifbar: Schüler bauen Modelle in Python, trainieren mit realen Datensätzen und visualisieren Filter. Gruppendiskussionen zu Fehlern wie Overfitting vertiefen Einsichten. Solche Ansätze steigern Retention um 30 Prozent, da abstrakte Algorithmen zu experimentierbaren Prozessen werden und Motivation fördern.
Welche Herausforderungen gibt es beim Training von Deep Learning-Modellen?
Herausforderungen umfassen Overfitting durch zu wenige Daten, hohen Rechenaufwand für GPUs, Vanishing Gradients in tiefen Netzen und Hyperparameter-Tuning. Regelmäßige Validierung und Techniken wie Dropout mildern dies. Praktische Sessions lehren Schüler, Metriken wie Accuracy und Loss zu überwachen und Modelle zu optimieren.

Planungsvorlagen für Informatik