Big Data und NoSQL-Datenbanken
Einführung in die Herausforderungen großer Datenmengen und alternative Datenbankkonzepte.
Über dieses Thema
Big Data bezeichnet enorme Datenmengen, die durch hohes Volumen, Geschwindigkeit und Vielfalt gekennzeichnet sind. Relationale Datenbanken mit festen Schemata erreichen hier ihre Grenzen, da sie Skalierbarkeit und Flexibilität für unstrukturierte Daten vermissen lassen. NoSQL-Datenbanken lösen diese Herausforderungen mit Modellen wie Dokumentenspeichern, Key-Value-Stores, Spaltenspeichern oder Graphdatenbanken. Schülerinnen und Schüler vergleichen Anwendungsbereiche, etwa SQL für transaktionale Systeme und NoSQL für soziale Netzwerke oder IoT-Daten.
Der Unterricht verbindet technische Aspekte mit gesellschaftlichen Implikationen. Big Data beeinflusst Entscheidungsfindung in Wirtschaft und Politik, etwa durch prädiktive Analysen oder personalisierte Dienste. Ethische Fragen zur Datensammlung, Privatsphäre, Algorithmus-Bias und Konzentration von Macht bei Plattformbetreibern regen zum kritischen Diskurs an. Standards wie Darstellen und Interpretieren sowie Informatik, Mensch und Gesellschaft fördern systemisches Denken.
Aktives Lernen macht diese abstrakten Konzepte greifbar, da Simulationen und reale Datasets die Vor- und Nachteile erlebbar werden. Praktische Übungen stärken Problemlösungsfähigkeiten und ethische Reflexion, was für die Oberstufe essenziell ist.
Leitfragen
- Vergleichen Sie die Anwendungsbereiche von relationalen und NoSQL-Datenbanken.
- Analysieren Sie die ethischen Implikationen der Sammlung und Analyse riesiger Datenmengen.
- Erklären Sie, wie Big Data die Entscheidungsfindung in Wirtschaft und Gesellschaft beeinflusst.
Lernziele
- Vergleichen Sie die Skalierbarkeit und Flexibilität von relationalen Datenbanken mit verschiedenen NoSQL-Datenbanktypen (Dokument, Key-Value, Spaltenfamilie, Graph) für spezifische Anwendungsfälle.
- Analysieren Sie die ethischen Implikationen der Sammlung und Nutzung von Big Data in Bezug auf Datenschutz, Voreingenommenheit und Machtkonzentration.
- Erklären Sie anhand konkreter Beispiele, wie Big-Data-Analysen Entscheidungen in Wirtschaft (z.B. personalisierte Werbung) und Gesellschaft (z.B. Stadtplanung) beeinflussen.
- Bewerten Sie die Vor- und Nachteile des Einsatzes von Big Data und NoSQL-Datenbanken für komplexe Problemstellungen.
Bevor es losgeht
Warum: Ein grundlegendes Verständnis von Tabellen, Beziehungen, Primär- und Fremdschlüsseln sowie der Abfragesprache SQL ist notwendig, um die Unterschiede und Grenzen relationaler Systeme zu verstehen.
Warum: Grundkenntnisse über verschiedene Datenstrukturen (z.B. Listen, Bäume) helfen beim Verständnis der unterschiedlichen Datenmodelle, die von NoSQL-Datenbanken verwendet werden.
Schlüsselvokabular
| Big Data | Umfasst Datenmengen, die sich durch extrem hohes Volumen, hohe Geschwindigkeit und große Vielfalt (unstrukturiert, semi-strukturiert) auszeichnen und traditionelle Datenbanken überfordern. |
| NoSQL-Datenbanken | Eine Kategorie von Datenbanken, die nicht primär auf dem relationalen Modell basieren und oft flexiblere Schemata sowie horizontale Skalierbarkeit für große, verteilte Datenmengen bieten. |
| Schema (Datenbank) | Die Struktur oder der Bauplan einer Datenbank, der die Organisation, die Beziehungen und die Datentypen definiert. Relationale Datenbanken verwenden feste Schemata, NoSQL-Datenbanken oft dynamische oder schemalose Ansätze. |
| Skalierbarkeit (horizontal/vertikal) | Die Fähigkeit eines Systems, mit wachsender Last umzugehen. Horizontale Skalierbarkeit (Scale-out) fügt mehr Maschinen hinzu, vertikale Skalierbarkeit (Scale-up) erhöht die Ressourcen einer einzelnen Maschine. |
| Datenethik | Beschäftigt sich mit den moralischen Prinzipien und gesellschaftlichen Auswirkungen, die bei der Erhebung, Speicherung, Verarbeitung und Nutzung von Daten zu beachten sind. |
Vorsicht vor diesen Fehlvorstellungen
Häufige FehlvorstellungNoSQL-Datenbanken ersetzen relationale Datenbanken vollständig.
Was Sie stattdessen lehren sollten
NoSQL eignet sich für flexible, skalierbare Szenarien, relationale für ACID-Transaktionen. Stationenrotationen helfen, da Schüler beide Modelle hands-on testen und Vorzüge praxisnah entdecken.
Häufige FehlvorstellungBig Data-Analyse ist immer ethisch neutral.
Was Sie stattdessen lehren sollten
Analysen bergen Risiken wie Bias oder Überwachung. Rollenspiele fördern Diskussionen, in denen Schüler Implikationen erleben und Korrekturen entwickeln.
Häufige FehlvorstellungBig Data verarbeitet nur strukturierte Daten.
Was Sie stattdessen lehren sollten
Vielfalt umfasst unstrukturierte Quellen wie Social Media. Dataset-Analysen machen dies evident, da Schüler echte Vielfalt kategorisieren.
Ideen für aktives Lernen
Alle Aktivitäten ansehenStationenrotation: Datenbankvergleich
Richten Sie vier Stationen ein: 1. Relationale DB mit SQL-Beispiel modellieren. 2. NoSQL-Dokumentenspeicher simulieren. 3. Skalierbarkeitsherausforderungen mit Karten sortieren. 4. Anwendungsfälle diskutieren. Gruppen rotieren alle 10 Minuten und protokollieren Unterschiede.
Fallstudienanalyse: Big Data in der Wirtschaft
Teilen Sie reale Datasets aus E-Commerce aus. Schüler analysieren in Gruppen Volumen und Velocity, erstellen NoSQL-Schemata und bewerten Entscheidungseinflüsse. Abschließende Präsentation vergleicht mit relationalen Ansätzen.
Debatte: Datensammlung
Schüler erhalten Szenarien zu Big Data Missbrauch. In Paaren notieren Pro und Contra, dann ganztägig debattieren. Erstellen Sie eine Klassencharta zu ethischen Regeln.
NoSQL-Prototyping
Nutzen Sie MongoDB-Online-Tools. Schüler importieren ein Dataset, modellieren es noSQL und queryen es. Vergleichen Sie mit SQL-Äquivalent.
Bezüge zur Lebenswelt
- Unternehmen wie Netflix nutzen Big-Data-Analysen und NoSQL-Datenbanken (z.B. Cassandra) zur Speicherung und Analyse von Nutzerverhalten, um personalisierte Film- und Serienempfehlungen zu generieren und die Streaming-Qualität zu optimieren.
- Im Gesundheitswesen analysieren Forscher riesige Mengen an Patientendaten (elektronische Gesundheitsakten, genetische Informationen) mithilfe von Big-Data-Technologien, um Krankheitsmuster zu erkennen, personalisierte Behandlungen zu entwickeln und die Effizienz von Kliniken zu steigern.
- Soziale Netzwerke wie Facebook oder Twitter verarbeiten täglich Petabytes an Nutzerdaten (Posts, Likes, Verbindungen) in verteilten NoSQL-Datenbanksystemen, um Inhalte zu personalisieren, Trends zu identifizieren und gezielte Werbung zu schalten.
Ideen zur Lernstandserhebung
Geben Sie jedem Schüler eine Karte mit einem Szenario (z.B. 'Verwaltung von Echtzeit-Sensordaten eines autonomen Fahrzeugs', 'Speicherung von Kundenrezensionen für einen Online-Shop'). Die Schüler sollen entscheiden, ob eine relationale oder eine NoSQL-Datenbank besser geeignet ist, und dies in ein bis zwei Sätzen begründen.
Stellen Sie die Frage: 'Welche ethischen Bedenken ergeben sich, wenn ein Unternehmen mithilfe von Big Data das Kaufverhalten von Kunden vorhersagt und dieses Wissen zur Beeinflussung von Kaufentscheidungen nutzt?' Leiten Sie eine Diskussion über Datenschutz, Manipulation und Fairness.
Präsentieren Sie eine Liste von Eigenschaften (z.B. 'Hohes Volumen', 'Strukturierte Daten', 'Flexibles Schema', 'ACID-Konformität'). Die Schüler ordnen diese Eigenschaften den Begriffen 'Relationale Datenbank' und 'NoSQL-Datenbank' zu und begründen kurz ihre Zuordnung.
Häufig gestellte Fragen
Was sind die Hauptunterschiede zwischen relationalen und NoSQL-Datenbanken?
Welche ethischen Implikationen hat Big Data?
Wie wirkt sich Big Data auf die Entscheidungsfindung aus?
Wie hilft aktives Lernen beim Verständnis von Big Data und NoSQL?
Planungsvorlagen für Informatik
Mehr in Datenbanken und Informationssysteme
Das Relationale Datenmodell
Organisation von Daten in Tabellen und die Bedeutung von Primär- und Fremdschlüsseln.
2 methodologies
Normalisierung von Datenbanken
Die Schülerinnen und Schüler wenden Normalisierungsregeln an, um Datenredundanz zu minimieren und Datenintegrität zu gewährleisten.
2 methodologies
Abfragen mit SQL: SELECT und WHERE
Einführung in die Structured Query Language zur Selektion und Filterung von Daten.
2 methodologies
Abfragen mit SQL: JOINs und Aggregatfunktionen
Die Schülerinnen und Schüler verknüpfen Tabellen und führen Berechnungen über Datensätze durch.
2 methodologies
Datenbank-Design und ER-Modell
Die Schülerinnen und Schüler entwerfen Datenbankstrukturen mithilfe des Entity-Relationship-Modells.
2 methodologies
Datenschutz und Datensicherheit
Rechtliche und ethische Aspekte der Speicherung personenbezogener Daten.
2 methodologies