Skip to content
Informatica · Klas 5 VWO

Ideeën voor actief leren

Data voor Machine Learning: Kwaliteit en Bias

Actief leren werkt bij dit onderwerp omdat leerlingen concepten als datakwaliteit en bias pas écht begrijpen als ze deze kunnen ervaren. Door hands-on activiteiten zoals datasetvergelijkingen en biasaudits ontwikkelen ze kritische blikken op data, wat essentieel is voor verantwoord machine learning. Het direct toepassen van theorie in praktijk versterkt hun vermogen om biases te herkennen en aan te pakken.

SLO Kerndoelen en EindtermenSLO: Voortgezet onderwijs - AnalyseSLO: Voortgezet onderwijs - Ethiek
25–45 minDuo's → Hele klas4 activiteiten

Activiteit 01

Casusanalyse45 min · Kleine groepjes

Station Rotatie: Dataset Kwaliteit

Richt vier stations in: 1) data cleaning met missing values, 2) duplicaten verwijderen, 3) outlier detectie visualiseren, 4) kwantiteit vs kwaliteit vergelijken. Groepen rouleren elke 10 minuten en noteren bevindingen in een gedeeld logboek. Sluit af met een korte presentatie.

Hoe beïnvloedt de kwaliteit van trainingsdata de uitkomst van een model?

FacilitatietipGeef bij de Station Rotatie per station een duidelijke opdrachtkaart met een voorbeeld van een biased dataset en de criteria voor evaluatie.

Waar je op moet lettenStel de klas de vraag: 'Stel je voor dat je een app ontwikkelt die studenten helpt bij het kiezen van een vervolgstudie. Welke potentiële biases zou je kunnen tegenkomen in de data die je hiervoor zou gebruiken, en hoe zou dit de uitkomst beïnvloeden?' Laat leerlingen in kleine groepen brainstormen en hun bevindingen delen.

AnalyserenEvaluerenCreërenBesluitvormingZelfmanagement
Volledige les genereren

Activiteit 02

Casusanalyse30 min · Duo's

Paarwerk: Bias Identificatie

Deel een dataset uit over leningen of sollicitaties. Leerlingen in paren plotten distributies per geslacht of etniciteit, berekenen onevenwichtigheid en bespreken mogelijke gevolgen voor ML-modellen. Ze stellen twee mitigatiestappen voor.

Analyseer hoe vooroordelen in data kunnen leiden tot algoritmische bias.

FacilitatietipBij de Bias Identificatie laat je leerlingen eerst individueel hypotheses formuleren voordat ze in tweetallen de datasets analyseren.

Waar je op moet lettenGeef elke leerling een korte beschrijving van een fictieve dataset (bijvoorbeeld: 'een dataset met foto's van mensen die glimlachen, verzameld via een populaire social media app'). Vraag hen om twee mogelijke bronnen van bias te identificeren en één concrete methode te noemen om deze bias te verminderen.

AnalyserenEvaluerenCreërenBesluitvormingZelfmanagement
Volledige les genereren

Activiteit 03

Casusanalyse40 min · Kleine groepjes

Groepsdebat: Bias Mitigatie

Verdeel de klas in teams die voor- en nadelen bespreken van technieken als resampling of synthetische data. Elke groep bereidt argumenten voor en debatteert met de hele klas. Stem af met een polltool.

Ontwerp een strategie om bias in een dataset te identificeren en te mitigeren.

FacilitatietipBij het Groepsdebat zorg je voor een structuur met rolverdeling (bijv. voorzitter, data-analist, ethicus) om diepgaande discussie te stimuleren.

Waar je op moet lettenPresenteer een korte casestudy over een ML-toepassing met bekende bias (bijvoorbeeld een algoritme dat verkeersboetes uitschrijft). Vraag leerlingen om te beoordelen of de datakwaliteit waarschijnlijk een rol speelde en zo ja, hoe. Gebruik een pollsysteem of een korte schriftelijke reactie.

AnalyserenEvaluerenCreërenBesluitvormingZelfmanagement
Volledige les genereren

Activiteit 04

Casusanalyse25 min · Individueel

Individueel: Strategie Ontwerp

Leerlingen ontwerpen een checklist voor biasdetectie in een nieuwe dataset. Ze testen deze op een voorbeeld en reflecteren op ethische implicaties in een kort verslag.

Hoe beïnvloedt de kwaliteit van trainingsdata de uitkomst van een model?

Waar je op moet lettenStel de klas de vraag: 'Stel je voor dat je een app ontwikkelt die studenten helpt bij het kiezen van een vervolgstudie. Welke potentiële biases zou je kunnen tegenkomen in de data die je hiervoor zou gebruiken, en hoe zou dit de uitkomst beïnvloeden?' Laat leerlingen in kleine groepen brainstormen en hun bevindingen delen.

AnalyserenEvaluerenCreërenBesluitvormingZelfmanagement
Volledige les genereren

Enkele opmerkingen over deze eenheid onderwijzen

Leerlingen leren het meest door concrete voorbeelden en reflectie. Begin met eenvoudige datasets waarin biases zichtbaar zijn, zoals gezichtsherkenning met ongelijke verdeling over huidskleur. Vermijd abstracte theorie vooraf; laat leerlingen zelf patronen ontdekken en hun bevindingen verwoorden. Onderzoek toont aan dat actieve discussie en peerfeedback de diepste inzichten opleveren, dus zorg voor interactieve momenten waarin leerlingen elkaars perspectieven uitdagen.

Succesvolle leerlingen tonen aan dat ze datakwaliteit kunnen beoordelen, biases kunnen identificeren en mitigatiestrategieën kunnen bedenken. Ze gebruiken passende metrics zoals precisie en recall om hun keuzes te onderbouwen en kunnen uitleggen hoe slechte data de prestaties van ML-modellen beïnvloedt. Daarnaast brengen ze ethische overwegingen in verband met technische oplossingen.


Pas op voor deze misvattingen

  • Tijdens de Station Rotatie horen leerlingen vaak dat meer data altijd beter is.

    Tijdens de Station Rotatie vergelijken leerlingen twee datasets: een grote maar noisy dataset versus een kleinere, gereinigde dataset. Ze evalueren welke leidt tot betere modelprestaties en presenteren hun bevindingen aan de klas om het idee dat kwantiteit kwaliteit garandeert te ontkrachten.

  • Tijdens het Groepsdebat nemen leerlingen aan dat ML-modellen objectief zijn.

    Tijdens het Groepsdebat analyseert elke groep een reële casus (bijv. een algoritme voor medische diagnoses) en zoekt naar biases in de data. Ze presenteren hoe deze biases de uitkomsten beïnvloeden en bediscussiëren welke mitigatiestrategieën het meest effectief zijn, gebaseerd op de casus.

  • Tijdens de Bias Identificatie beperken leerlingen bias tot gevoelige thema's zoals ras.

    Tijdens de Bias Identificatie krijgen leerlingen diverse datasets (bijv. e-commerce aanbevelingen, verkeerssensoren) en moeten ze minimaal twee niet-obvious biases identificeren. Ze presenteren hun bevindingen en reflecteren op hoe biases in elk domein kunnen ontstaan, ongeacht het onderwerp.


Methodes gebruikt in dit overzicht