Zum Inhalt springen
Informatik · Klasse 11 · Datenbanken und Informationssysteme · 1. Halbjahr

Big Data und NoSQL-Datenbanken

Einführung in die Herausforderungen großer Datenmengen und alternative Datenbankkonzepte.

KMK BildungsstandardsKMK: Sekundarstufe II - Darstellen und InterpretierenKMK: Sekundarstufe II - Informatik, Mensch und Gesellschaft

Über dieses Thema

Big Data bezeichnet enorme Datenmengen, die durch hohes Volumen, Geschwindigkeit und Vielfalt gekennzeichnet sind. Relationale Datenbanken mit festen Schemata erreichen hier ihre Grenzen, da sie Skalierbarkeit und Flexibilität für unstrukturierte Daten vermissen lassen. NoSQL-Datenbanken lösen diese Herausforderungen mit Modellen wie Dokumentenspeichern, Key-Value-Stores, Spaltenspeichern oder Graphdatenbanken. Schülerinnen und Schüler vergleichen Anwendungsbereiche, etwa SQL für transaktionale Systeme und NoSQL für soziale Netzwerke oder IoT-Daten.

Der Unterricht verbindet technische Aspekte mit gesellschaftlichen Implikationen. Big Data beeinflusst Entscheidungsfindung in Wirtschaft und Politik, etwa durch prädiktive Analysen oder personalisierte Dienste. Ethische Fragen zur Datensammlung, Privatsphäre, Algorithmus-Bias und Konzentration von Macht bei Plattformbetreibern regen zum kritischen Diskurs an. Standards wie Darstellen und Interpretieren sowie Informatik, Mensch und Gesellschaft fördern systemisches Denken.

Aktives Lernen macht diese abstrakten Konzepte greifbar, da Simulationen und reale Datasets die Vor- und Nachteile erlebbar werden. Praktische Übungen stärken Problemlösungsfähigkeiten und ethische Reflexion, was für die Oberstufe essenziell ist.

Leitfragen

  1. Vergleichen Sie die Anwendungsbereiche von relationalen und NoSQL-Datenbanken.
  2. Analysieren Sie die ethischen Implikationen der Sammlung und Analyse riesiger Datenmengen.
  3. Erklären Sie, wie Big Data die Entscheidungsfindung in Wirtschaft und Gesellschaft beeinflusst.

Lernziele

  • Vergleichen Sie die Skalierbarkeit und Flexibilität von relationalen Datenbanken mit verschiedenen NoSQL-Datenbanktypen (Dokument, Key-Value, Spaltenfamilie, Graph) für spezifische Anwendungsfälle.
  • Analysieren Sie die ethischen Implikationen der Sammlung und Nutzung von Big Data in Bezug auf Datenschutz, Voreingenommenheit und Machtkonzentration.
  • Erklären Sie anhand konkreter Beispiele, wie Big-Data-Analysen Entscheidungen in Wirtschaft (z.B. personalisierte Werbung) und Gesellschaft (z.B. Stadtplanung) beeinflussen.
  • Bewerten Sie die Vor- und Nachteile des Einsatzes von Big Data und NoSQL-Datenbanken für komplexe Problemstellungen.

Bevor es losgeht

Grundlagen relationaler Datenbanken und SQL

Warum: Ein grundlegendes Verständnis von Tabellen, Beziehungen, Primär- und Fremdschlüsseln sowie der Abfragesprache SQL ist notwendig, um die Unterschiede und Grenzen relationaler Systeme zu verstehen.

Datenmodelle und Datenstrukturen

Warum: Grundkenntnisse über verschiedene Datenstrukturen (z.B. Listen, Bäume) helfen beim Verständnis der unterschiedlichen Datenmodelle, die von NoSQL-Datenbanken verwendet werden.

Schlüsselvokabular

Big DataUmfasst Datenmengen, die sich durch extrem hohes Volumen, hohe Geschwindigkeit und große Vielfalt (unstrukturiert, semi-strukturiert) auszeichnen und traditionelle Datenbanken überfordern.
NoSQL-DatenbankenEine Kategorie von Datenbanken, die nicht primär auf dem relationalen Modell basieren und oft flexiblere Schemata sowie horizontale Skalierbarkeit für große, verteilte Datenmengen bieten.
Schema (Datenbank)Die Struktur oder der Bauplan einer Datenbank, der die Organisation, die Beziehungen und die Datentypen definiert. Relationale Datenbanken verwenden feste Schemata, NoSQL-Datenbanken oft dynamische oder schemalose Ansätze.
Skalierbarkeit (horizontal/vertikal)Die Fähigkeit eines Systems, mit wachsender Last umzugehen. Horizontale Skalierbarkeit (Scale-out) fügt mehr Maschinen hinzu, vertikale Skalierbarkeit (Scale-up) erhöht die Ressourcen einer einzelnen Maschine.
DatenethikBeschäftigt sich mit den moralischen Prinzipien und gesellschaftlichen Auswirkungen, die bei der Erhebung, Speicherung, Verarbeitung und Nutzung von Daten zu beachten sind.

Vorsicht vor diesen Fehlvorstellungen

Häufige FehlvorstellungNoSQL-Datenbanken ersetzen relationale Datenbanken vollständig.

Was Sie stattdessen lehren sollten

NoSQL eignet sich für flexible, skalierbare Szenarien, relationale für ACID-Transaktionen. Stationenrotationen helfen, da Schüler beide Modelle hands-on testen und Vorzüge praxisnah entdecken.

Häufige FehlvorstellungBig Data-Analyse ist immer ethisch neutral.

Was Sie stattdessen lehren sollten

Analysen bergen Risiken wie Bias oder Überwachung. Rollenspiele fördern Diskussionen, in denen Schüler Implikationen erleben und Korrekturen entwickeln.

Häufige FehlvorstellungBig Data verarbeitet nur strukturierte Daten.

Was Sie stattdessen lehren sollten

Vielfalt umfasst unstrukturierte Quellen wie Social Media. Dataset-Analysen machen dies evident, da Schüler echte Vielfalt kategorisieren.

Ideen für aktives Lernen

Alle Aktivitäten ansehen

Bezüge zur Lebenswelt

  • Unternehmen wie Netflix nutzen Big-Data-Analysen und NoSQL-Datenbanken (z.B. Cassandra) zur Speicherung und Analyse von Nutzerverhalten, um personalisierte Film- und Serienempfehlungen zu generieren und die Streaming-Qualität zu optimieren.
  • Im Gesundheitswesen analysieren Forscher riesige Mengen an Patientendaten (elektronische Gesundheitsakten, genetische Informationen) mithilfe von Big-Data-Technologien, um Krankheitsmuster zu erkennen, personalisierte Behandlungen zu entwickeln und die Effizienz von Kliniken zu steigern.
  • Soziale Netzwerke wie Facebook oder Twitter verarbeiten täglich Petabytes an Nutzerdaten (Posts, Likes, Verbindungen) in verteilten NoSQL-Datenbanksystemen, um Inhalte zu personalisieren, Trends zu identifizieren und gezielte Werbung zu schalten.

Ideen zur Lernstandserhebung

Lernstandskontrolle

Geben Sie jedem Schüler eine Karte mit einem Szenario (z.B. 'Verwaltung von Echtzeit-Sensordaten eines autonomen Fahrzeugs', 'Speicherung von Kundenrezensionen für einen Online-Shop'). Die Schüler sollen entscheiden, ob eine relationale oder eine NoSQL-Datenbank besser geeignet ist, und dies in ein bis zwei Sätzen begründen.

Diskussionsfrage

Stellen Sie die Frage: 'Welche ethischen Bedenken ergeben sich, wenn ein Unternehmen mithilfe von Big Data das Kaufverhalten von Kunden vorhersagt und dieses Wissen zur Beeinflussung von Kaufentscheidungen nutzt?' Leiten Sie eine Diskussion über Datenschutz, Manipulation und Fairness.

Kurze Überprüfung

Präsentieren Sie eine Liste von Eigenschaften (z.B. 'Hohes Volumen', 'Strukturierte Daten', 'Flexibles Schema', 'ACID-Konformität'). Die Schüler ordnen diese Eigenschaften den Begriffen 'Relationale Datenbank' und 'NoSQL-Datenbank' zu und begründen kurz ihre Zuordnung.

Häufig gestellte Fragen

Was sind die Hauptunterschiede zwischen relationalen und NoSQL-Datenbanken?
Relationale Datenbanken nutzen Tabellen mit festen Schemata und SQL für Joins, ideal für konsistente Transaktionen. NoSQL bietet flexible Modelle ohne Schemata, skalierbar horizontal für Big Data. Schüler lernen durch Vergleiche, wann welches Modell passt, z. B. Banken vs. Streaming-Dienste. Dies stärkt Entscheidungskompetenz in der Praxis.
Welche ethischen Implikationen hat Big Data?
Datensammlung birgt Risiken wie Privatsphärverletzungen, Diskriminierung durch biased Algorithmen und Monopolbildung. Schüler analysieren Fälle wie Cambridge Analytica. Der Unterricht betont Transparenz, Einwilligung und Regulierungen wie DSGVO, um verantwortungsvolles Handeln zu fördern.
Wie wirkt sich Big Data auf die Entscheidungsfindung aus?
Big Data ermöglicht prädiktive Modelle für personalisierte Empfehlungen, Risikovorhersagen oder Politikberatung. In Wirtschaft optimiert es Lieferketten, gesellschaftlich beeinflusst es Wahlen. Schüler evaluieren Vor- und Nachteile, entwickeln kritisches Bewusstsein für datenbasierte Entscheidungen.
Wie hilft aktives Lernen beim Verständnis von Big Data und NoSQL?
Aktive Methoden wie Prototyping mit Tools oder Debatten machen abstrakte Konzepte erfahrbar. Schüler simulieren Skalierbarkeit, testen Queries und diskutieren Ethik, was Retention steigert. Kollaborative Analysen von Datasets offenbaren Muster, fördern Problemlösung und verbinden Technik mit Gesellschaft.

Planungsvorlagen für Informatik