Informatik · Klasse 10 · Datenbanksysteme und Datenmodellierung · 1. Halbjahr

Big Data und NoSQL

Die Schülerinnen und Schüler erhalten einen Einblick in moderne Ansätze zur Verarbeitung unstrukturierter Massendaten.

Kurzfassung:Aktives Lernen funktioniert hier besonders gut, weil Schülerinnen und Schüler die Grenzen relationaler Datenbanken beim Umgang mit unstrukturierten Daten direkt erleben können. Durch praktische Modellierung und Simulation verstehen sie, warum NoSQL und horizontale Skalierung in modernen Anwendungen unverzichtbar sind. Die Kombination aus Stationenlernen und Fallstudien macht abstrakte Konzepte greifbar und fördert ein tiefes Verständnis.

KMK BildungsstandardsKMK: STD.06KMK: STD.10

Über dieses Thema

Big Data und NoSQL geben Schülerinnen und Schüler Einblicke in die Verarbeitung unstrukturierter Massendaten. Sie erkunden, warum klassische relationale Datenbanken bei sozialen Netzwerken an Grenzen stoßen: flexible Daten wie Posts, Bilder und Likes passen nicht in starre Tabellen. Stattdessen lernen sie NoSQL-Ansätze kennen, die Schemalosigkeit und horizontale Skalierung ermöglichen, um Milliarden Datensätze zu handhaben. Vertikale Skalierung durch stärkere Server wird mit horizontaler über Cluster verglichen.

Im Kontext der Einheit Datenbanksysteme und Datenmodellierung (KMK STD.06, STD.10) verbindet das Thema Theorie mit Praxis. Schülerinnen und Schüler diskutieren Chancen wie personalisierte Empfehlungen und Risiken wie Datenschutzverletzungen oder Bias in Algorithmen. Dies fördert systemisches Denken und ethische Reflexion über Daten in der digitalen Welt.

Aktives Lernen eignet sich hervorragend, da abstrakte Konzepte durch Simulationen und Gruppenaufgaben konkret werden. Wenn Schülerinnen und Schüler eigene Big-Data-Szenarien modellieren oder Skalierungsstrategien testen, verstehen sie Zusammenhänge besser und behalten Wissen länger. Solche Methoden machen den Unterricht dynamisch und praxisnah.

Leitfragen

Warum stoßen klassische Tabellen bei sozialen Netzwerken an ihre Grenzen?
Welche Chancen und Risiken bietet die Analyse von Milliarden Datensätzen?
Wie unterscheidet sich die horizontale von der vertikalen Skalierung?

Lernziele

Analysieren Sie die Grenzen relationaler Datenbanken bei der Speicherung und Abfrage von Social-Media-Daten.
Vergleichen Sie die Konzepte der horizontalen und vertikalen Skalierung von Datenbanksystemen.
Erklären Sie die Kernprinzipien von mindestens zwei verschiedenen NoSQL-Datenbanktypen (z. B. Dokumenten-, Schlüssel-Wert-, Spaltenfamilien-Datenbanken).
Bewerten Sie die Chancen und Risiken der Analyse großer, unstrukturierter Datensätze im Hinblick auf Datenschutz und algorithmische Verzerrungen.

Bevor es losgeht

Grundlagen relationaler Datenbanken

Warum: Ein Verständnis von Tabellen, Spalten, Zeilen und Primärschlüsseln ist notwendig, um die Unterschiede zu NoSQL-Datenbanken zu verstehen.

Datenmodellierung

Warum: Grundkenntnisse über die Strukturierung von Daten helfen den Schülerinnen und Schülern, die Vorteile flexiblerer Datenmodelle zu erkennen.

Schlüsselvokabular

Big Data	Eine riesige Menge an Daten, die so schnell generiert werden, dass sie mit herkömmlichen Datenbankmethoden nicht mehr effizient verarbeitet werden können.
NoSQL	Eine Kategorie von Datenbanken, die flexiblere Datenmodelle als relationale Datenbanken bieten und oft für die Verarbeitung großer, verteilter Datensätze konzipiert sind.
Horizontale Skalierung	Das Hinzufügen weiterer Maschinen (Knoten) zu einem Cluster, um die Rechenlast zu verteilen und die Kapazität zu erhöhen.
Vertikale Skalierung	Das Erhöhen der Kapazität einer einzelnen Maschine, z. B. durch Hinzufügen von mehr RAM oder einer schnelleren CPU.
Schema	Die Struktur oder der Bauplan einer Datenbank, der definiert, wie Daten organisiert und miteinander verbunden sind.

Vorsicht vor diesen Fehlvorstellungen

Häufige FehlvorstellungNoSQL-Datenbanken ersetzen relationale Systeme vollständig.

Was Sie stattdessen lehren sollten

NoSQL eignet sich für unstrukturierte Daten, relationale für konsistente Transaktionen. Aktive Modellierungsaufgaben lassen Schüler beide testen und Vor- Nachteile erleben, was starre Vorurteile abbaut.

Häufige FehlvorstellungBig Data bedeutet nur riesige Datenmengen.

Was Sie stattdessen lehren sollten

Big Data umfasst Volumen, Velocity, Variety und Veracity. Simulationsspiele mit wachsenden Datensätzen zeigen diese Dimensionen, Gruppenreflexion klärt das multidimensionale Konzept.

Häufige FehlvorstellungHorizontale Skalierung ist immer einfacher als vertikale.

Was Sie stattdessen lehren sollten

Horizontale erfordert Verteilung und Konsistenzmanagement. Stationenexperimente demonstrieren Komplexitäten, Peer-Diskussionen helfen, nuancierte Einsichten zu gewinnen.

Ideen für aktives Lernen

Alle Aktivitäten ansehen→

Lernen an Stationen

Skalierungsarten

Richten Sie Stationen ein: Station 1 simuliert vertikale Skalierung mit einem Server-Modell aus Kartons, Station 2 horizontale mit verteilten Karten als Daten. Gruppen testen Last durch Würfeln und notieren Engpässe. Abschließende Plenumdiskussion vergleicht Ergebnisse.

45 Min.·Kleingruppen

Debatte

NoSQL-Modellierung: Social-Media-Daten

Paare modellieren Daten eines Posts (Text, Likes, Bilder) erst relational, dann NoSQL. Sie zeichnen Schemata und diskutieren Vorteile. Präsentationen zeigen, warum NoSQL flexibler ist.

30 Min.·Partnerarbeit

Debatte

Risiko-Analyse: Big Data Fallstudie

Klassen teilen sich in Expertengruppen: Datenschutz, Bias, Skalierbarkeit. Jede Gruppe analysiert ein reales Beispiel wie Facebook und erstellt Infografiken. Plenum-Runde teilt Erkenntnisse.

50 Min.·Kleingruppen

Bezüge zur Lebenswelt

Soziale Netzwerke wie Facebook oder Instagram nutzen NoSQL-Datenbanken, um Milliarden von Beiträgen, Likes und Nutzerprofilen effizient zu speichern und abzurufen, was eine schnelle Anzeige von Feeds und personalisierten Inhalten ermöglicht.
Streaming-Dienste wie Netflix oder Spotify verwenden Big-Data-Analysen, um Nutzerverhalten zu analysieren und personalisierte Empfehlungen für Filme, Serien oder Musik zu generieren, basierend auf riesigen Mengen an Wiedergabedaten.
E-Commerce-Plattformen wie Amazon setzen auf Big-Data-Technologien, um Produktkataloge, Kundenbewertungen und Kaufhistorien zu verwalten und so personalisierte Einkaufserlebnisse sowie Logistikoptimierungen zu ermöglichen.

Ideen zur Lernstandserhebung

Lernstandskontrolle

Die Schülerinnen und Schüler erhalten eine Karte mit einem der folgenden Begriffe: 'Big Data', 'NoSQL', 'Horizontale Skalierung'. Sie sollen eine kurze Erklärung (2-3 Sätze) schreiben, warum dieser Begriff für moderne Anwendungen wichtig ist, und ein konkretes Beispiel nennen.

Diskussionsfrage

Stellen Sie die Frage: 'Welche ethischen Bedenken ergeben sich, wenn Unternehmen Milliarden von Datensätzen über ihre Nutzer sammeln und analysieren?' Leiten Sie eine Klassendiskussion, die sich auf Datenschutz, Diskriminierung durch Algorithmen und die Notwendigkeit von Transparenz konzentriert.

Kurze Überprüfung

Zeigen Sie eine einfache Datenstruktur, die nicht gut in eine relationale Tabelle passt (z. B. verschachtelte JSON-Objekte für ein Nutzerprofil mit vielen variablen Feldern). Bitten Sie die Schülerinnen und Schüler, auf einem Zettel zu notieren, warum eine relationale Datenbank hier an ihre Grenzen stößt und welche Art von NoSQL-Datenbank besser geeignet wäre.

Häufig gestellte Fragen

Was ist der Unterschied zwischen horizontaler und vertikaler Skalierung?

Vertikale Skalierung stärkt einen Server durch mehr Leistung, stößt aber an Hardwaregrenzen. Horizontale Skalierung verteilt Daten auf viele Server via Cluster, ideal für Big Data. Schüler verstehen das durch Modelle: Bei vertikaler wird ein Karton 'stärker', horizontal teilt man Karten aus. Dies vermeidet Ausfälle und nutzt Cloud-Ressourcen effizient (ca. 65 Wörter).

Warum stoßen relationale Datenbanken bei Big Data an Grenzen?

Relationale Systeme fordern feste Schemata und ACID-Eigenschaften, ungeeignet für unstrukturierte, schnelle Datenströme wie in sozialen Netzwerken. NoSQL erlaubt flexible Speicherung und Skalierung. Praktische Übungen mit realen Beispielen wie Tweets machen den Kontrast klar und zeigen, wann welches System passt (ca. 70 Wörter).

Wie hilft aktives Lernen beim Verständnis von Big Data und NoSQL?

Aktives Lernen macht abstrakte Konzepte greifbar: Durch Stationen, Simulationen und Modellierungen testen Schüler Skalierung selbst, diskutieren Risiken in Gruppen. Das fördert tieferes Verständnis, da sie Engpässe erleben und Lösungen erarbeiten. Im Gegensatz zu Frontalunterricht bleibt Wissen durch Hands-on länger haften und verbindet Theorie mit Praxis (ca. 75 Wörter).

Welche Risiken birgt die Analyse von Big Data?

Risiken umfassen Datenschutzverletzungen, Algorithmen-Bias und Monopolisierung von Macht. Milliarden Datensätze können Profile erstellen, die diskriminieren. Unterricht mit Fallstudien und ethischen Debatten sensibilisiert Schüler, fördert verantwortungsvollen Umgang. KMK-Standards betonen diese Reflexion für digitale Kompetenz (ca. 60 Wörter).

Planungsvorlagen für Informatik

Unterrichtsplan

MINT

Eine MINT Vorlage, die auf dem Engineering Design Process basiert. Sie integriert Mathematik, Informatik, Naturwissenschaft und Technik durch reale Herausforderungen, die Lernende untersuchen und lösen.

Mehr in Datenbanksysteme und Datenmodellierung

Grundlagen des Relationalen Datenmodells

Die Schülerinnen und Schüler verstehen die Konzepte von Tabellen, Attributen und Tupeln im relationalen Datenmodell.

8 methodologies

Entity-Relationship-Modellierung (ERM)

Die Schülerinnen und Schüler entwerfen Datenbankstrukturen mittels Entity-Relationship-Diagrammen zur Abbildung komplexer Beziehungen.

8 methodologies

Normalisierung von Datenbanken

Die Schülerinnen und Schüler wenden Normalisierungsregeln an, um Redundanzen zu vermeiden und die Datenintegrität zu gewährleisten.

8 methodologies

SQL: Daten abfragen (SELECT)

Die Schülerinnen und Schüler formulieren SQL-Abfragen, um gezielt Informationen aus Datenbanken zu extrahieren.

8 methodologies

SQL: Daten manipulieren (INSERT, UPDATE, DELETE)

Die Schülerinnen und Schüler nutzen SQL-Befehle zur Manipulation von Datenbeständen in einer Datenbank.

8 methodologies

Datensicherheit und Transaktionen

Die Schülerinnen und Schüler verstehen Mechanismen zum Schutz vor Datenverlust und zur Sicherstellung der Datenintegrität.

8 methodologies

Edited by Adriana Perusin, Editor-in-Chief, Flip Education