Aktivität 01
Pair Programming: Dataset-Aufteilung
Paare laden ein Dataset, teilen es in Train/Validierung/Test auf und trainieren ein einfaches Modell mit Scikit-learn. Sie vergleichen Vorhersagen und notieren erste Metriken. Abschließend diskutieren sie Auswirkungen falscher Aufteilungen.
Erklären Sie die Bedeutung von Trainings-, Validierungs- und Testdatensätzen.
ModerationstippStellen Sie sicher, dass die Paare während der Pair Programming unterschiedliche Datensätze verwenden, damit die Klasse später vielfältige Beispiele diskutieren kann.
Worauf zu achten istGeben Sie den Schülerinnen und Schülern ein Szenario (z.B. Spam-Filter, medizinische Diagnose) und bitten Sie sie, zu entscheiden, welche Metrik (Genauigkeit, Präzision, Recall, F1-Score) für dieses Szenario am wichtigsten ist. Sie sollen ihre Wahl in 2-3 Sätzen begründen.