Informatik · Klasse 11 · Datenbanken und Informationssysteme · 1. Halbjahr

Big Data und NoSQL-Datenbanken

Einführung in die Herausforderungen großer Datenmengen und alternative Datenbankkonzepte.

Kurzfassung:Aktives Lernen funktioniert hier besonders gut, weil die Schülerinnen und Schüler die Unterschiede zwischen relationalen und NoSQL-Datenbanken nicht nur theoretisch verstehen, sondern durch praktische Anwendung begreifen. Big Data und NoSQL sind Konzepte, die sich am besten durch eigenes Ausprobieren erschließen lassen, da die Flexibilität und Skalierbarkeit dieser Systeme nur im direkten Vergleich erfahrbar werden.

KMK BildungsstandardsKMK: Sekundarstufe II - Darstellen und InterpretierenKMK: Sekundarstufe II - Informatik, Mensch und Gesellschaft

Über dieses Thema

Big Data bezeichnet enorme Datenmengen, die durch hohes Volumen, Geschwindigkeit und Vielfalt gekennzeichnet sind. Relationale Datenbanken mit festen Schemata erreichen hier ihre Grenzen, da sie Skalierbarkeit und Flexibilität für unstrukturierte Daten vermissen lassen. NoSQL-Datenbanken lösen diese Herausforderungen mit Modellen wie Dokumentenspeichern, Key-Value-Stores, Spaltenspeichern oder Graphdatenbanken. Schülerinnen und Schüler vergleichen Anwendungsbereiche, etwa SQL für transaktionale Systeme und NoSQL für soziale Netzwerke oder IoT-Daten.

Der Unterricht verbindet technische Aspekte mit gesellschaftlichen Implikationen. Big Data beeinflusst Entscheidungsfindung in Wirtschaft und Politik, etwa durch prädiktive Analysen oder personalisierte Dienste. Ethische Fragen zur Datensammlung, Privatsphäre, Algorithmus-Bias und Konzentration von Macht bei Plattformbetreibern regen zum kritischen Diskurs an. Standards wie Darstellen und Interpretieren sowie Informatik, Mensch und Gesellschaft fördern systemisches Denken.

Aktives Lernen macht diese abstrakten Konzepte greifbar, da Simulationen und reale Datasets die Vor- und Nachteile erlebbar werden. Praktische Übungen stärken Problemlösungsfähigkeiten und ethische Reflexion, was für die Oberstufe essenziell ist.

Leitfragen

Vergleichen Sie die Anwendungsbereiche von relationalen und NoSQL-Datenbanken.
Analysieren Sie die ethischen Implikationen der Sammlung und Analyse riesiger Datenmengen.
Erklären Sie, wie Big Data die Entscheidungsfindung in Wirtschaft und Gesellschaft beeinflusst.

Lernziele

Vergleichen Sie die Skalierbarkeit und Flexibilität von relationalen Datenbanken mit verschiedenen NoSQL-Datenbanktypen (Dokument, Key-Value, Spaltenfamilie, Graph) für spezifische Anwendungsfälle.
Analysieren Sie die ethischen Implikationen der Sammlung und Nutzung von Big Data in Bezug auf Datenschutz, Voreingenommenheit und Machtkonzentration.
Erklären Sie anhand konkreter Beispiele, wie Big-Data-Analysen Entscheidungen in Wirtschaft (z.B. personalisierte Werbung) und Gesellschaft (z.B. Stadtplanung) beeinflussen.
Bewerten Sie die Vor- und Nachteile des Einsatzes von Big Data und NoSQL-Datenbanken für komplexe Problemstellungen.

Bevor es losgeht

Grundlagen relationaler Datenbanken und SQL

Warum: Ein grundlegendes Verständnis von Tabellen, Beziehungen, Primär- und Fremdschlüsseln sowie der Abfragesprache SQL ist notwendig, um die Unterschiede und Grenzen relationaler Systeme zu verstehen.

Datenmodelle und Datenstrukturen

Warum: Grundkenntnisse über verschiedene Datenstrukturen (z.B. Listen, Bäume) helfen beim Verständnis der unterschiedlichen Datenmodelle, die von NoSQL-Datenbanken verwendet werden.

Schlüsselvokabular

Big Data	Umfasst Datenmengen, die sich durch extrem hohes Volumen, hohe Geschwindigkeit und große Vielfalt (unstrukturiert, semi-strukturiert) auszeichnen und traditionelle Datenbanken überfordern.
NoSQL-Datenbanken	Eine Kategorie von Datenbanken, die nicht primär auf dem relationalen Modell basieren und oft flexiblere Schemata sowie horizontale Skalierbarkeit für große, verteilte Datenmengen bieten.
Schema (Datenbank)	Die Struktur oder der Bauplan einer Datenbank, der die Organisation, die Beziehungen und die Datentypen definiert. Relationale Datenbanken verwenden feste Schemata, NoSQL-Datenbanken oft dynamische oder schemalose Ansätze.
Skalierbarkeit (horizontal/vertikal)	Die Fähigkeit eines Systems, mit wachsender Last umzugehen. Horizontale Skalierbarkeit (Scale-out) fügt mehr Maschinen hinzu, vertikale Skalierbarkeit (Scale-up) erhöht die Ressourcen einer einzelnen Maschine.
Datenethik	Beschäftigt sich mit den moralischen Prinzipien und gesellschaftlichen Auswirkungen, die bei der Erhebung, Speicherung, Verarbeitung und Nutzung von Daten zu beachten sind.

Vorsicht vor diesen Fehlvorstellungen

Häufige FehlvorstellungNoSQL-Datenbanken ersetzen relationale Datenbanken vollständig.

Was Sie stattdessen lehren sollten

NoSQL eignet sich für flexible, skalierbare Szenarien, relationale für ACID-Transaktionen. Stationenrotationen helfen, da Schüler beide Modelle hands-on testen und Vorzüge praxisnah entdecken.

Häufige FehlvorstellungBig Data-Analyse ist immer ethisch neutral.

Was Sie stattdessen lehren sollten

Analysen bergen Risiken wie Bias oder Überwachung. Rollenspiele fördern Diskussionen, in denen Schüler Implikationen erleben und Korrekturen entwickeln.

Häufige FehlvorstellungBig Data verarbeitet nur strukturierte Daten.

Was Sie stattdessen lehren sollten

Vielfalt umfasst unstrukturierte Quellen wie Social Media. Dataset-Analysen machen dies evident, da Schüler echte Vielfalt kategorisieren.

Ideen für aktives Lernen

Alle Aktivitäten ansehen→

Expertenrunde

Stationenrotation: Datenbankvergleich

Richten Sie vier Stationen ein: 1. Relationale DB mit SQL-Beispiel modellieren. 2. NoSQL-Dokumentenspeicher simulieren. 3. Skalierbarkeitsherausforderungen mit Karten sortieren. 4. Anwendungsfälle diskutieren. Gruppen rotieren alle 10 Minuten und protokollieren Unterschiede.

45 Min.·Kleingruppen

Fallstudienanalyse

Big Data in der Wirtschaft

Teilen Sie reale Datasets aus E-Commerce aus. Schüler analysieren in Gruppen Volumen und Velocity, erstellen NoSQL-Schemata und bewerten Entscheidungseinflüsse. Abschließende Präsentation vergleicht mit relationalen Ansätzen.

50 Min.·Kleingruppen

Debatte

Datensammlung

Schüler erhalten Szenarien zu Big Data Missbrauch. In Paaren notieren Pro und Contra, dann ganztägig debattieren. Erstellen Sie eine Klassencharta zu ethischen Regeln.

40 Min.·Partnerarbeit

Bezüge zur Lebenswelt

Unternehmen wie Netflix nutzen Big-Data-Analysen und NoSQL-Datenbanken (z.B. Cassandra) zur Speicherung und Analyse von Nutzerverhalten, um personalisierte Film- und Serienempfehlungen zu generieren und die Streaming-Qualität zu optimieren.
Im Gesundheitswesen analysieren Forscher riesige Mengen an Patientendaten (elektronische Gesundheitsakten, genetische Informationen) mithilfe von Big-Data-Technologien, um Krankheitsmuster zu erkennen, personalisierte Behandlungen zu entwickeln und die Effizienz von Kliniken zu steigern.
Soziale Netzwerke wie Facebook oder Twitter verarbeiten täglich Petabytes an Nutzerdaten (Posts, Likes, Verbindungen) in verteilten NoSQL-Datenbanksystemen, um Inhalte zu personalisieren, Trends zu identifizieren und gezielte Werbung zu schalten.

Ideen zur Lernstandserhebung

Lernstandskontrolle

Geben Sie jedem Schüler eine Karte mit einem Szenario (z.B. 'Verwaltung von Echtzeit-Sensordaten eines autonomen Fahrzeugs', 'Speicherung von Kundenrezensionen für einen Online-Shop'). Die Schüler sollen entscheiden, ob eine relationale oder eine NoSQL-Datenbank besser geeignet ist, und dies in ein bis zwei Sätzen begründen.

Diskussionsfrage

Stellen Sie die Frage: 'Welche ethischen Bedenken ergeben sich, wenn ein Unternehmen mithilfe von Big Data das Kaufverhalten von Kunden vorhersagt und dieses Wissen zur Beeinflussung von Kaufentscheidungen nutzt?' Leiten Sie eine Diskussion über Datenschutz, Manipulation und Fairness.

Kurze Überprüfung

Präsentieren Sie eine Liste von Eigenschaften (z.B. 'Hohes Volumen', 'Strukturierte Daten', 'Flexibles Schema', 'ACID-Konformität'). Die Schüler ordnen diese Eigenschaften den Begriffen 'Relationale Datenbank' und 'NoSQL-Datenbank' zu und begründen kurz ihre Zuordnung.

Häufig gestellte Fragen

Was sind die Hauptunterschiede zwischen relationalen und NoSQL-Datenbanken?

Relationale Datenbanken nutzen Tabellen mit festen Schemata und SQL für Joins, ideal für konsistente Transaktionen. NoSQL bietet flexible Modelle ohne Schemata, skalierbar horizontal für Big Data. Schüler lernen durch Vergleiche, wann welches Modell passt, z. B. Banken vs. Streaming-Dienste. Dies stärkt Entscheidungskompetenz in der Praxis.

Welche ethischen Implikationen hat Big Data?

Datensammlung birgt Risiken wie Privatsphärverletzungen, Diskriminierung durch biased Algorithmen und Monopolbildung. Schüler analysieren Fälle wie Cambridge Analytica. Der Unterricht betont Transparenz, Einwilligung und Regulierungen wie DSGVO, um verantwortungsvolles Handeln zu fördern.

Wie wirkt sich Big Data auf die Entscheidungsfindung aus?

Big Data ermöglicht prädiktive Modelle für personalisierte Empfehlungen, Risikovorhersagen oder Politikberatung. In Wirtschaft optimiert es Lieferketten, gesellschaftlich beeinflusst es Wahlen. Schüler evaluieren Vor- und Nachteile, entwickeln kritisches Bewusstsein für datenbasierte Entscheidungen.

Wie hilft aktives Lernen beim Verständnis von Big Data und NoSQL?

Aktive Methoden wie Prototyping mit Tools oder Debatten machen abstrakte Konzepte erfahrbar. Schüler simulieren Skalierbarkeit, testen Queries und diskutieren Ethik, was Retention steigert. Kollaborative Analysen von Datasets offenbaren Muster, fördern Problemlösung und verbinden Technik mit Gesellschaft.

Planungsvorlagen für Informatik

Unterrichtsplan

MINT

Eine MINT Vorlage, die auf dem Engineering Design Process basiert. Sie integriert Mathematik, Informatik, Naturwissenschaft und Technik durch reale Herausforderungen, die Lernende untersuchen und lösen.

Mehr in Datenbanken und Informationssysteme

Das Relationale Datenmodell

Organisation von Daten in Tabellen und die Bedeutung von Primär- und Fremdschlüsseln.

8 methodologies

Normalisierung von Datenbanken

Die Schülerinnen und Schüler wenden Normalisierungsregeln an, um Datenredundanz zu minimieren und Datenintegrität zu gewährleisten.

8 methodologies

Abfragen mit SQL: SELECT und WHERE

Einführung in die Structured Query Language zur Selektion und Filterung von Daten.

8 methodologies

Abfragen mit SQL: JOINs und Aggregatfunktionen

Die Schülerinnen und Schüler verknüpfen Tabellen und führen Berechnungen über Datensätze durch.

8 methodologies

Datenbank-Design und ER-Modell

Die Schülerinnen und Schüler entwerfen Datenbankstrukturen mithilfe des Entity-Relationship-Modells.

8 methodologies

Datenschutz und Datensicherheit

Rechtliche und ethische Aspekte der Speicherung personenbezogener Daten.

8 methodologies

Edited by Adriana Perusin, Editor-in-Chief, Flip Education