Informatica · Klas 4 VWO · Data en Informatie · Periode 4

Machine Learning: Basisprincipes

Leerlingen krijgen een introductie tot machine learning, differentiëren tussen supervised en unsupervised learning, en begrijpen hoe algoritmen leren van data.

Kort samengevat:Actief leren werkt goed voor machine learning omdat leerlingen abstracte concepten zoals patronenherkenning en bias het beste begrijpen door ze zelf te ervaren. Door data te manipuleren en modellen te testen, ontdekken ze direct hoe algoritmen werken zonder dat het abstract blijft.

SLO Kerndoelen en EindtermenSLO: Voortgezet - Kunstmatige IntelligentieSLO: Voortgezet - Machine Learning

Over dit onderwerp

Machine learning vormt de kern van moderne kunstmatige intelligentie. Leerlingen maken kennis met de basisprincipes: hoe algoritmen patronen leren uit data in plaats van expliciet geprogrammeerd te worden. Ze differentiëren tussen supervised learning, waarbij gelabelde data gebruikt wordt zoals bij beeldherkenning van katten en honden, en unsupervised learning, dat structuren ontdekt in ongelabelde data zoals klantgroepen in een dataset. Concrete voorbeelden maken deze concepten helder.

Dit topic past perfect bij de SLO-kerndoelen voor kunstmatige intelligentie en machine learning in de unit Data en Informatie. Leerlingen beantwoorden kernvragen over het verschil tussen geprogrammeerde algoritmes en zelflerende modellen, en analyseren hoe bias in trainingsdata leidt tot discriminerende uitkomsten, zoals in rekruteringsalgoritmes. Dit ontwikkelt kritisch denken over ethische implicaties.

Actieve leerbenaderingen zijn bijzonder effectief voor dit abstracte onderwerp. Door leerlingen datasets te laten verkennen, eenvoudige modellen te trainen met tools als Teachable Machine, en biases te simuleren, worden theorieën tastbaar. Groepsdiscussies over voorbeelden versterken begrip en onthouden, terwijl ze vaardigheden in data-analyse opbouwen.

Kernvragen

Differentiëer tussen een geprogrammeerd algoritme en een zelflerend machine learning model.
Verklaar het verschil tussen supervised en unsupervised learning met concrete voorbeelden.
Analyseer hoe vooroordelen in trainingsdata kunnen leiden tot discriminerende algoritmen.

Leerdoelen

Vergelijk de werking van een traditioneel geprogrammeerd algoritme met een machine learning model op basis van hun leerprocessen.
Classificeer gegeven voorbeelden als behorende tot supervised of unsupervised learning, met onderbouwing.
Analyseer de impact van bias in trainingsdata op de uitkomst van een machine learning model, met concrete voorbeelden.
Demonstreer de basisprincipes van hoe een machine learning model leert van data aan de hand van een gesimuleerd scenario.

Voordat je begint

Basisprincipes van Algoritmen

Waarom: Leerlingen moeten begrijpen wat een algoritme is en hoe het stap-voor-stap instructies volgt om het concept van zelflerende modellen te kunnen contrasteren.

Datastructuren en Datatypen

Waarom: Kennis van hoe data georganiseerd en gerepresenteerd wordt, is essentieel om te begrijpen hoe machine learning modellen met data werken.

Kernbegrippen

Machine Learning	Een tak van kunstmatige intelligentie die computers in staat stelt te leren van data zonder expliciet geprogrammeerd te zijn. Modellen identificeren patronen en maken voorspellingen of beslissingen.
Supervised Learning	Een type machine learning waarbij het model traint op gelabelde data. Dit betekent dat voor elke invoer de juiste uitvoer bekend is, zoals bij het classificeren van afbeeldingen van dieren.
Unsupervised Learning	Een type machine learning waarbij het model traint op ongelabelde data. Het doel is om verborgen patronen of structuren in de data te ontdekken, zoals het groeperen van vergelijkbare klanten.
Trainingsdata	De dataset die gebruikt wordt om een machine learning model te trainen. De kwaliteit en representativiteit van deze data zijn cruciaal voor de prestaties van het model.
Bias (in data)	Systematische vertekening in trainingsdata die kan leiden tot oneerlijke of discriminerende uitkomsten van het machine learning model. Dit kan voortkomen uit onvolledige of bevooroordeelde dataverzameling.

Pas op voor deze misvattingen

Veelvoorkomende misvattingMachine learning is pure magie zonder wiskunde.

Wat je in plaats daarvan kunt onderwijzen

Modellen leren statistisch uit data, geen tovenarij. Actieve simulaties met datasets laten zien hoe herhaalde patronenherkenning werkt. Groepen die eigen data invoeren, ontdekken dit zelf en corrigeren hun beeld.

Veelvoorkomende misvattingSupervised learning is altijd beter dan unsupervised.

Wat je in plaats daarvan kunt onderwijzen

Beide hebben toepassingen afhankelijk van data. Discussies over concrete cases, zoals clustering voor marktanalyse, tonen sterktes. Leerlingen in paren die voorbeelden wisselen, begrijpen context beter.

Veelvoorkomende misvattingTrainingsdata is altijd neutraal.

Wat je in plaats daarvan kunt onderwijzen

Bias in data leidt tot discriminerende modellen. Simulatie-activiteiten waarbij groepen biased datasets aanpassen, maken dit zichtbaar en leren ze kritisch data evalueren.

Ideeën voor actief leren

Bekijk alle activiteiten→

Simulatiespel

Paarwerk: Supervised vs Unsupervised

Deel eenvoudige datasets uit: gelabelde voor spamdetectie en ongelabelde voor fruitclustering. Laat paren patronen identificeren en classificeren zonder computer. Discussieer verschillen en noteer observaties.

30 min·Duo's

Simulatiespel

Small Groups: Bias Simulatie

Geef groepen een trainingsdataset met genderbias in sollicitaties. Train een simpel model via Google Sheets of Scratch. Analyseer output en pas data aan om bias te verminderen, presenteer bevindingen.

45 min·Kleine groepjes

Simulatiespel

Whole Class: ML Demo met Teachable Machine

Demonstreer live een model trainen op gebaren. Laat klas stemmen op voorspellingen. Bespreken hoe data het model beïnvloedt en experimenteer met eigen data-invoer.

40 min·Hele klas

Verbinding met de Echte Wereld

Grote e-commerce platforms zoals Bol.com en Amazon gebruiken unsupervised learning om klantsegmenten te identificeren. Dit stelt hen in staat om gepersonaliseerde aanbevelingen te doen en gerichte marketingcampagnes op te zetten, wat leidt tot hogere conversiepercentages.
Bij het selecteren van kandidaten voor vacatures worden soms machine learning modellen ingezet. Als de trainingsdata van deze modellen historische, bevooroordeelde aannamepatronen bevatten, kan het model onbewust bepaalde groepen kandidaten benadelen, wat leidt tot discriminatie.
Beveiligingssystemen voor banktransacties maken gebruik van supervised learning om frauduleuze activiteiten te detecteren. Het model wordt getraind op voorbeelden van zowel legitieme als frauduleuze transacties om nieuwe, verdachte patronen te herkennen.

Toetsideeën

Snelle Controle

Stel leerlingen de vraag: 'Geef een voorbeeld van een situatie waarin je supervised learning zou gebruiken en een situatie voor unsupervised learning. Leg kort uit waarom jouw keuze passend is.' Verzamel de antwoorden op kaartjes of via een digitaal formulier.

Discussievraag

Presenteer de volgende casus: 'Een bedrijf gebruikt een algoritme om te beslissen welke nieuwsartikelen aan gebruikers worden getoond. De trainingsdata bevatten voornamelijk artikelen over sport en politiek uit traditionele media.' Vraag: 'Welke problemen kunnen hierdoor ontstaan met betrekking tot bias? Welke groepen gebruikers worden mogelijk benadeeld en waarom?' Leid een klassengesprek hierover.

Uitgangskaart

Laat leerlingen op een briefje de volgende twee vragen beantwoorden: 1. Wat is het belangrijkste verschil tussen een geprogrammeerd algoritme en een machine learning model? 2. Noem één risico van het gebruik van bevooroordeelde data bij het trainen van een machine learning model.

Veelgestelde vragen

Wat is het verschil tussen supervised en unsupervised learning?

Bij supervised learning traint het model met gelabelde data, zoals foto's met 'kat' of 'hond' labels voor herkenning. Unsupervised learning vindt patronen in ongelabelde data, zoals groepen klanten op koopgedrag. Voorbeelden: spamfilters (supervised) versus marktsegmentatie (unsupervised). Dit onderscheid helpt leerlingen toepassingen te herkennen in alledaagse AI.

Hoe ontstaat bias in machine learning modellen?

Bias komt uit onevenwichtige of vooroordelende trainingsdata, zoals meer mannelijke cv's in rekruteringssets, wat vrouwen benadeelt. Leerlingen analyseren dit door datasets te inspecteren en uitkomsten te vergelijken. Ethische discussie benadrukt noodzaak van diverse data voor eerlijke AI.

Hoe active learning toepassen bij basisprincipes machine learning?

Gebruik tools als Teachable Machine voor directe modeltraining op eigen data, zoals gebaren of objecten. Small groups simuleren bias door datasets aan te passen en resultaten te bespreken. Paarwerk met eenvoudige datasets versterkt differentiatie tussen supervised en unsupervised. Deze handen-op methodes maken abstracties concreet en verhogen retentie.

Wat is het verschil tussen een geprogrammeerd algoritme en machine learning?

Een geprogrammeerd algoritme volgt vaste regels die de programmeur definieert, zoals if-then voor verkeerslichten. Machine learning past zich aan via data, leert patronen zonder expliciete regels, zoals voorspellen van weer. Leerlingen ervaren dit door beide te simuleren, wat zelflerend vermogen illustreert.

Meer in Data en Informatie

Wat is Data? Van Ruwe Feiten tot Informatie

Leerlingen differentiëren tussen data, informatie en kennis, en begrijpen het proces van dataverwerking.

8 methodologies

Relationele Databases en SQL

Leerlingen structureren data in tabellen en leren hoe ze informatie kunnen opvragen en manipuleren met SQL-query's.

8 methodologies

Database Ontwerp: Tabellen en Relaties

Leerlingen leren hoe ze data logisch kunnen organiseren in tabellen en hoe ze relaties tussen deze tabellen kunnen definiëren om een efficiënte en consistente database te creëren.

8 methodologies

Big Data: Kenmerken en Uitdagingen

Leerlingen verkennen de '3 V's' van Big Data (Volume, Velocity, Variety) en de uitdagingen die gepaard gaan met het verwerken en analyseren van enorme datasets.

8 methodologies

Datavisualisatie: Effectief Communiceren

Leerlingen leren hoe ze inzichten uit data effectief kunnen communiceren door middel van grafische representaties en kritisch de kwaliteit van visualisaties beoordelen.

8 methodologies

Data-ethiek en Privacy

Leerlingen onderzoeken de ethische implicaties van dataverzameling, -analyse en -gebruik, inclusief privacykwesties en de verantwoordelijkheid van datawetenschappers.

8 methodologies

Edited by Adriana Perusin, Editor-in-Chief, Flip Education