Zum Inhalt springen
Informatik · Klasse 10 · Datenbanksysteme und Datenmodellierung · 1. Halbjahr

Big Data und NoSQL

Die Schülerinnen und Schüler erhalten einen Einblick in moderne Ansätze zur Verarbeitung unstrukturierter Massendaten.

KMK BildungsstandardsKMK: STD.06KMK: STD.10

Über dieses Thema

Big Data und NoSQL geben Schülerinnen und Schüler Einblicke in die Verarbeitung unstrukturierter Massendaten. Sie erkunden, warum klassische relationale Datenbanken bei sozialen Netzwerken an Grenzen stoßen: flexible Daten wie Posts, Bilder und Likes passen nicht in starre Tabellen. Stattdessen lernen sie NoSQL-Ansätze kennen, die Schemalosigkeit und horizontale Skalierung ermöglichen, um Milliarden Datensätze zu handhaben. Vertikale Skalierung durch stärkere Server wird mit horizontaler über Cluster verglichen.

Im Kontext der Einheit Datenbanksysteme und Datenmodellierung (KMK STD.06, STD.10) verbindet das Thema Theorie mit Praxis. Schülerinnen und Schüler diskutieren Chancen wie personalisierte Empfehlungen und Risiken wie Datenschutzverletzungen oder Bias in Algorithmen. Dies fördert systemisches Denken und ethische Reflexion über Daten in der digitalen Welt.

Aktives Lernen eignet sich hervorragend, da abstrakte Konzepte durch Simulationen und Gruppenaufgaben konkret werden. Wenn Schülerinnen und Schüler eigene Big-Data-Szenarien modellieren oder Skalierungsstrategien testen, verstehen sie Zusammenhänge besser und behalten Wissen länger. Solche Methoden machen den Unterricht dynamisch und praxisnah.

Leitfragen

  1. Warum stoßen klassische Tabellen bei sozialen Netzwerken an ihre Grenzen?
  2. Welche Chancen und Risiken bietet die Analyse von Milliarden Datensätzen?
  3. Wie unterscheidet sich die horizontale von der vertikalen Skalierung?

Lernziele

  • Analysieren Sie die Grenzen relationaler Datenbanken bei der Speicherung und Abfrage von Social-Media-Daten.
  • Vergleichen Sie die Konzepte der horizontalen und vertikalen Skalierung von Datenbanksystemen.
  • Erklären Sie die Kernprinzipien von mindestens zwei verschiedenen NoSQL-Datenbanktypen (z. B. Dokumenten-, Schlüssel-Wert-, Spaltenfamilien-Datenbanken).
  • Bewerten Sie die Chancen und Risiken der Analyse großer, unstrukturierter Datensätze im Hinblick auf Datenschutz und algorithmische Verzerrungen.

Bevor es losgeht

Grundlagen relationaler Datenbanken

Warum: Ein Verständnis von Tabellen, Spalten, Zeilen und Primärschlüsseln ist notwendig, um die Unterschiede zu NoSQL-Datenbanken zu verstehen.

Datenmodellierung

Warum: Grundkenntnisse über die Strukturierung von Daten helfen den Schülerinnen und Schülern, die Vorteile flexiblerer Datenmodelle zu erkennen.

Schlüsselvokabular

Big DataEine riesige Menge an Daten, die so schnell generiert werden, dass sie mit herkömmlichen Datenbankmethoden nicht mehr effizient verarbeitet werden können.
NoSQLEine Kategorie von Datenbanken, die flexiblere Datenmodelle als relationale Datenbanken bieten und oft für die Verarbeitung großer, verteilter Datensätze konzipiert sind.
Horizontale SkalierungDas Hinzufügen weiterer Maschinen (Knoten) zu einem Cluster, um die Rechenlast zu verteilen und die Kapazität zu erhöhen.
Vertikale SkalierungDas Erhöhen der Kapazität einer einzelnen Maschine, z. B. durch Hinzufügen von mehr RAM oder einer schnelleren CPU.
SchemaDie Struktur oder der Bauplan einer Datenbank, der definiert, wie Daten organisiert und miteinander verbunden sind.

Vorsicht vor diesen Fehlvorstellungen

Häufige FehlvorstellungNoSQL-Datenbanken ersetzen relationale Systeme vollständig.

Was Sie stattdessen lehren sollten

NoSQL eignet sich für unstrukturierte Daten, relationale für konsistente Transaktionen. Aktive Modellierungsaufgaben lassen Schüler beide testen und Vor- Nachteile erleben, was starre Vorurteile abbaut.

Häufige FehlvorstellungBig Data bedeutet nur riesige Datenmengen.

Was Sie stattdessen lehren sollten

Big Data umfasst Volumen, Velocity, Variety und Veracity. Simulationsspiele mit wachsenden Datensätzen zeigen diese Dimensionen, Gruppenreflexion klärt das multidimensionale Konzept.

Häufige FehlvorstellungHorizontale Skalierung ist immer einfacher als vertikale.

Was Sie stattdessen lehren sollten

Horizontale erfordert Verteilung und Konsistenzmanagement. Stationenexperimente demonstrieren Komplexitäten, Peer-Diskussionen helfen, nuancierte Einsichten zu gewinnen.

Ideen für aktives Lernen

Alle Aktivitäten ansehen

Bezüge zur Lebenswelt

  • Soziale Netzwerke wie Facebook oder Instagram nutzen NoSQL-Datenbanken, um Milliarden von Beiträgen, Likes und Nutzerprofilen effizient zu speichern und abzurufen, was eine schnelle Anzeige von Feeds und personalisierten Inhalten ermöglicht.
  • Streaming-Dienste wie Netflix oder Spotify verwenden Big-Data-Analysen, um Nutzerverhalten zu analysieren und personalisierte Empfehlungen für Filme, Serien oder Musik zu generieren, basierend auf riesigen Mengen an Wiedergabedaten.
  • E-Commerce-Plattformen wie Amazon setzen auf Big-Data-Technologien, um Produktkataloge, Kundenbewertungen und Kaufhistorien zu verwalten und so personalisierte Einkaufserlebnisse sowie Logistikoptimierungen zu ermöglichen.

Ideen zur Lernstandserhebung

Lernstandskontrolle

Die Schülerinnen und Schüler erhalten eine Karte mit einem der folgenden Begriffe: 'Big Data', 'NoSQL', 'Horizontale Skalierung'. Sie sollen eine kurze Erklärung (2-3 Sätze) schreiben, warum dieser Begriff für moderne Anwendungen wichtig ist, und ein konkretes Beispiel nennen.

Diskussionsfrage

Stellen Sie die Frage: 'Welche ethischen Bedenken ergeben sich, wenn Unternehmen Milliarden von Datensätzen über ihre Nutzer sammeln und analysieren?' Leiten Sie eine Klassendiskussion, die sich auf Datenschutz, Diskriminierung durch Algorithmen und die Notwendigkeit von Transparenz konzentriert.

Kurze Überprüfung

Zeigen Sie eine einfache Datenstruktur, die nicht gut in eine relationale Tabelle passt (z. B. verschachtelte JSON-Objekte für ein Nutzerprofil mit vielen variablen Feldern). Bitten Sie die Schülerinnen und Schüler, auf einem Zettel zu notieren, warum eine relationale Datenbank hier an ihre Grenzen stößt und welche Art von NoSQL-Datenbank besser geeignet wäre.

Häufig gestellte Fragen

Was ist der Unterschied zwischen horizontaler und vertikaler Skalierung?
Vertikale Skalierung stärkt einen Server durch mehr Leistung, stößt aber an Hardwaregrenzen. Horizontale Skalierung verteilt Daten auf viele Server via Cluster, ideal für Big Data. Schüler verstehen das durch Modelle: Bei vertikaler wird ein Karton 'stärker', horizontal teilt man Karten aus. Dies vermeidet Ausfälle und nutzt Cloud-Ressourcen effizient (ca. 65 Wörter).
Warum stoßen relationale Datenbanken bei Big Data an Grenzen?
Relationale Systeme fordern feste Schemata und ACID-Eigenschaften, ungeeignet für unstrukturierte, schnelle Datenströme wie in sozialen Netzwerken. NoSQL erlaubt flexible Speicherung und Skalierung. Praktische Übungen mit realen Beispielen wie Tweets machen den Kontrast klar und zeigen, wann welches System passt (ca. 70 Wörter).
Wie hilft aktives Lernen beim Verständnis von Big Data und NoSQL?
Aktives Lernen macht abstrakte Konzepte greifbar: Durch Stationen, Simulationen und Modellierungen testen Schüler Skalierung selbst, diskutieren Risiken in Gruppen. Das fördert tieferes Verständnis, da sie Engpässe erleben und Lösungen erarbeiten. Im Gegensatz zu Frontalunterricht bleibt Wissen durch Hands-on länger haften und verbindet Theorie mit Praxis (ca. 75 Wörter).
Welche Risiken birgt die Analyse von Big Data?
Risiken umfassen Datenschutzverletzungen, Algorithmen-Bias und Monopolisierung von Macht. Milliarden Datensätze können Profile erstellen, die diskriminieren. Unterricht mit Fallstudien und ethischen Debatten sensibilisiert Schüler, fördert verantwortungsvollen Umgang. KMK-Standards betonen diese Reflexion für digitale Kompetenz (ca. 60 Wörter).

Planungsvorlagen für Informatik