Machine Learning: Basisprincipes
Leerlingen krijgen een introductie tot machine learning, differentiëren tussen supervised en unsupervised learning, en begrijpen hoe algoritmen leren van data.
Over dit onderwerp
Machine learning vormt de kern van moderne kunstmatige intelligentie. Leerlingen maken kennis met de basisprincipes: hoe algoritmen patronen leren uit data in plaats van expliciet geprogrammeerd te worden. Ze differentiëren tussen supervised learning, waarbij gelabelde data gebruikt wordt zoals bij beeldherkenning van katten en honden, en unsupervised learning, dat structuren ontdekt in ongelabelde data zoals klantgroepen in een dataset. Concrete voorbeelden maken deze concepten helder.
Dit topic past perfect bij de SLO-kerndoelen voor kunstmatige intelligentie en machine learning in de unit Data en Informatie. Leerlingen beantwoorden kernvragen over het verschil tussen geprogrammeerde algoritmes en zelflerende modellen, en analyseren hoe bias in trainingsdata leidt tot discriminerende uitkomsten, zoals in rekruteringsalgoritmes. Dit ontwikkelt kritisch denken over ethische implicaties.
Actieve leerbenaderingen zijn bijzonder effectief voor dit abstracte onderwerp. Door leerlingen datasets te laten verkennen, eenvoudige modellen te trainen met tools als Teachable Machine, en biases te simuleren, worden theorieën tastbaar. Groepsdiscussies over voorbeelden versterken begrip en onthouden, terwijl ze vaardigheden in data-analyse opbouwen.
Kernvragen
- Differentiëer tussen een geprogrammeerd algoritme en een zelflerend machine learning model.
- Verklaar het verschil tussen supervised en unsupervised learning met concrete voorbeelden.
- Analyseer hoe vooroordelen in trainingsdata kunnen leiden tot discriminerende algoritmen.
Leerdoelen
- Vergelijk de werking van een traditioneel geprogrammeerd algoritme met een machine learning model op basis van hun leerprocessen.
- Classificeer gegeven voorbeelden als behorende tot supervised of unsupervised learning, met onderbouwing.
- Analyseer de impact van bias in trainingsdata op de uitkomst van een machine learning model, met concrete voorbeelden.
- Demonstreer de basisprincipes van hoe een machine learning model leert van data aan de hand van een gesimuleerd scenario.
Voordat je begint
Waarom: Leerlingen moeten begrijpen wat een algoritme is en hoe het stap-voor-stap instructies volgt om het concept van zelflerende modellen te kunnen contrasteren.
Waarom: Kennis van hoe data georganiseerd en gerepresenteerd wordt, is essentieel om te begrijpen hoe machine learning modellen met data werken.
Kernbegrippen
| Machine Learning | Een tak van kunstmatige intelligentie die computers in staat stelt te leren van data zonder expliciet geprogrammeerd te zijn. Modellen identificeren patronen en maken voorspellingen of beslissingen. |
| Supervised Learning | Een type machine learning waarbij het model traint op gelabelde data. Dit betekent dat voor elke invoer de juiste uitvoer bekend is, zoals bij het classificeren van afbeeldingen van dieren. |
| Unsupervised Learning | Een type machine learning waarbij het model traint op ongelabelde data. Het doel is om verborgen patronen of structuren in de data te ontdekken, zoals het groeperen van vergelijkbare klanten. |
| Trainingsdata | De dataset die gebruikt wordt om een machine learning model te trainen. De kwaliteit en representativiteit van deze data zijn cruciaal voor de prestaties van het model. |
| Bias (in data) | Systematische vertekening in trainingsdata die kan leiden tot oneerlijke of discriminerende uitkomsten van het machine learning model. Dit kan voortkomen uit onvolledige of bevooroordeelde dataverzameling. |
Pas op voor deze misvattingen
Veelvoorkomende misvattingMachine learning is pure magie zonder wiskunde.
Wat je in plaats daarvan kunt onderwijzen
Modellen leren statistisch uit data, geen tovenarij. Actieve simulaties met datasets laten zien hoe herhaalde patronenherkenning werkt. Groepen die eigen data invoeren, ontdekken dit zelf en corrigeren hun beeld.
Veelvoorkomende misvattingSupervised learning is altijd beter dan unsupervised.
Wat je in plaats daarvan kunt onderwijzen
Beide hebben toepassingen afhankelijk van data. Discussies over concrete cases, zoals clustering voor marktanalyse, tonen sterktes. Leerlingen in paren die voorbeelden wisselen, begrijpen context beter.
Veelvoorkomende misvattingTrainingsdata is altijd neutraal.
Wat je in plaats daarvan kunt onderwijzen
Bias in data leidt tot discriminerende modellen. Simulatie-activiteiten waarbij groepen biased datasets aanpassen, maken dit zichtbaar en leren ze kritisch data evalueren.
Ideeën voor actief leren
Bekijk alle activiteitenPaarwerk: Supervised vs Unsupervised
Deel eenvoudige datasets uit: gelabelde voor spamdetectie en ongelabelde voor fruitclustering. Laat paren patronen identificeren en classificeren zonder computer. Discussieer verschillen en noteer observaties.
Small Groups: Bias Simulatie
Geef groepen een trainingsdataset met genderbias in sollicitaties. Train een simpel model via Google Sheets of Scratch. Analyseer output en pas data aan om bias te verminderen, presenteer bevindingen.
Whole Class: ML Demo met Teachable Machine
Demonstreer live een model trainen op gebaren. Laat klas stemmen op voorspellingen. Bespreken hoe data het model beïnvloedt en experimenteer met eigen data-invoer.
Individueel: Reflectie op Voorbeelden
Leerlingen kiezen een dagelijks voorbeeld (bv. Netflix-aanbevelingen) en schrijven of het supervised of unsupervised is, met uitleg van data-gebruik.
Verbinding met de Echte Wereld
- Grote e-commerce platforms zoals Bol.com en Amazon gebruiken unsupervised learning om klantsegmenten te identificeren. Dit stelt hen in staat om gepersonaliseerde aanbevelingen te doen en gerichte marketingcampagnes op te zetten, wat leidt tot hogere conversiepercentages.
- Bij het selecteren van kandidaten voor vacatures worden soms machine learning modellen ingezet. Als de trainingsdata van deze modellen historische, bevooroordeelde aannamepatronen bevatten, kan het model onbewust bepaalde groepen kandidaten benadelen, wat leidt tot discriminatie.
- Beveiligingssystemen voor banktransacties maken gebruik van supervised learning om frauduleuze activiteiten te detecteren. Het model wordt getraind op voorbeelden van zowel legitieme als frauduleuze transacties om nieuwe, verdachte patronen te herkennen.
Toetsideeën
Stel leerlingen de vraag: 'Geef een voorbeeld van een situatie waarin je supervised learning zou gebruiken en een situatie voor unsupervised learning. Leg kort uit waarom jouw keuze passend is.' Verzamel de antwoorden op kaartjes of via een digitaal formulier.
Presenteer de volgende casus: 'Een bedrijf gebruikt een algoritme om te beslissen welke nieuwsartikelen aan gebruikers worden getoond. De trainingsdata bevatten voornamelijk artikelen over sport en politiek uit traditionele media.' Vraag: 'Welke problemen kunnen hierdoor ontstaan met betrekking tot bias? Welke groepen gebruikers worden mogelijk benadeeld en waarom?' Leid een klassengesprek hierover.
Laat leerlingen op een briefje de volgende twee vragen beantwoorden: 1. Wat is het belangrijkste verschil tussen een geprogrammeerd algoritme en een machine learning model? 2. Noem één risico van het gebruik van bevooroordeelde data bij het trainen van een machine learning model.
Veelgestelde vragen
Wat is het verschil tussen supervised en unsupervised learning?
Hoe ontstaat bias in machine learning modellen?
Hoe active learning toepassen bij basisprincipes machine learning?
Wat is het verschil tussen een geprogrammeerd algoritme en machine learning?
Meer in Data en Informatie
Wat is Data? Van Ruwe Feiten tot Informatie
Leerlingen differentiëren tussen data, informatie en kennis, en begrijpen het proces van dataverwerking.
2 methodologies
Relationele Databases en SQL
Leerlingen structureren data in tabellen en leren hoe ze informatie kunnen opvragen en manipuleren met SQL-query's.
2 methodologies
Database Ontwerp: Tabellen en Relaties
Leerlingen leren hoe ze data logisch kunnen organiseren in tabellen en hoe ze relaties tussen deze tabellen kunnen definiëren om een efficiënte en consistente database te creëren.
2 methodologies
Big Data: Kenmerken en Uitdagingen
Leerlingen verkennen de '3 V's' van Big Data (Volume, Velocity, Variety) en de uitdagingen die gepaard gaan met het verwerken en analyseren van enorme datasets.
2 methodologies
Datavisualisatie: Effectief Communiceren
Leerlingen leren hoe ze inzichten uit data effectief kunnen communiceren door middel van grafische representaties en kritisch de kwaliteit van visualisaties beoordelen.
2 methodologies
Data-ethiek en Privacy
Leerlingen onderzoeken de ethische implicaties van dataverzameling, -analyse en -gebruik, inclusief privacykwesties en de verantwoordelijkheid van datawetenschappers.
2 methodologies