Stel je voor: je hebt weken een thema behandeld, leerlingen werkten actief mee, en dan komen de toetsresultaten. Een derde van de klas heeft het doel niet gehaald. Te laat om bij te sturen. Het rapport gaat naar huis, de periode sluit af, en de volgende stof dient zich aan.
Dat gevoel van "te laat ontdekken" is geen onvermijdelijk lot. Het is grotendeels een gevolg van hoe we toetsing hebben georganiseerd: gericht op beoordelen achteraf, in plaats van bijsturen tijdens het leerproces. In het Nederlandse onderwijs komt hier een structureel probleem bij. Met de doorstroomtoets in groep 8, schoolexamens en het centraal eindexamen staan er hoge consequenties op summatieve toetsmomenten. Dat maakt het verleidelijk om alle onderwijstijd daarop af te stemmen, en de ruimte voor formatief handelen te laten slinken.
Hoe vind je als leraar de juiste balans tussen summatief en formatief toetsen? Dat vraagt om helderheid over wat beide begrippen werkelijk betekenen, en over hoe je ze samen kunt laten werken.
Wat is het verschil tussen summatief en formatief toetsen?
Summatief toetsen is een momentopname. Je beoordeelt wat een leerling heeft geleerd aan het einde van een lesperiode, een blok of een schooljaar. Denk aan een schriftelijk proefwerk, het schoolexamen of de doorstroomtoets. Het doel is kwalificeren: heeft deze leerling de stof voldoende beheerst om door te stromen? De uitslag heeft consequenties voor de schoolloopbaan.
Formatief toetsen werkt anders. Het is geen afsluiting maar een tussenstop in het onderwijsleerproces. Je verzamelt informatie over het begrip van leerlingen om je onderwijs bij te sturen, terwijl er nog tijd is om te handelen. Zoals de SLO beschrijft: toetsing vervult meerdere functies, waaronder het bevorderen van leren, het geven van feedback en het ondersteunen van didactische beslissingen van de leraar.
Summatief: beoordelen ván het leren, na afloop. Formatief: beoordelen vóór het einde, om bij te sturen. Beide hebben een legitieme plek in goed onderwijs, maar ze vragen om een fundamenteel andere intentie en opvolging.
Een veelgehoorde misvatting is dat formatief toetsen betekent dat je geen cijfers geeft, of dat een niet-tellende toets automatisch formatief is. Dat klopt niet. Formatief toetsen gaat over de intentie en het gebruik van de informatie, niet over de vorm. Een toets die niet meetelt maar waarvan de uitkomst niet wordt besproken of omgezet in actie, is gewoon een oefentoets. Pas als jij én je leerlingen actief iets doen met de uitkomst, spreken we van formatief handelen.
De rol van feedback in het leerproces
De kracht van formatief evalueren zit in de kwaliteit van de feedback die erop volgt. John Hattie en Helen Timperley van de Universiteit van Auckland beschreven in 2007 een feedbackmodel dat sindsdien wereldwijd invloedrijk is geworden. Zij onderscheiden drie vragen die effectieve feedback beantwoordt.
Feed-up: Waar ga ik naartoe? Wat is het leerdoel? Veel leerlingen weten niet precies wat een goede prestatie inhoudt, ook al staat het in de methode. Maak leerdoelen expliciet en bespreekbaar aan het begin van de les, niet pas bij de toets.
Feedback: Hoe doe ik het nu? Waar zit de kloof tussen mijn huidige begrip en het gestelde doel? Dit is de kern van formatief handelen: je brengt de actuele status van de leerling in kaart en bespreekt die concreet.
Feed-forward: Wat is de volgende stap? Welke concrete actie helpt de leerling verder? Feed-forward verandert feedback van een oordeel in een uitnodiging om door te groeien.
Hattie's synthese plaatst feedback in de absolute top van effectieve onderwijsinterventies. Maar niet alle feedback is gelijk. Feedback gericht op de taak en het leerproces werkt sterk; feedback gericht op de persoon ("goed gedaan!") heeft nauwelijks effect. "Je hebt de oorzaak correct benoemd, maar mist nog de gevolgen. Kijk eens opnieuw naar paragraaf drie." Dat geeft een leerling richting.
De SLO signaleert dat Nederlandse scholen hier nog veel winst kunnen behalen. Het verschil zit zelden in meer toetsmomenten, maar in betere benutting van de informatie die toetsen opleveren.
Validiteit en betrouwbaarheid bij toetsing
Een summatieve toets is alleen waardevol als hij meet wat hij moet meten. Twee kwaliteitscriteria zijn hierbij leidend: validiteit en betrouwbaarheid.
Validiteit vraagt: toetst deze toets werkelijk de kerndoelen die ik heb onderwezen? Een toets die de facto taalvaardigheid meet terwijl het doel rekenoplossingsstrategieën was, heeft een validiteitsprobleem. Sluit je toetsvorm aan op wat je hebt geoefend. Als leerlingen hebben geleerd redeneren via klasgesprekken, vertelt een multiple-choice toets weinig over dat specifieke doel.
Betrouwbaarheid vraagt: geeft deze toets bij herhaalde afname vergelijkbare resultaten? Ambigue formuleringen en te veel interpretatiemarge maken een toets onbetrouwbaar. Gebruik heldere rubrics en voorbeeldantwoorden om de beoordelingsruimte te verkleinen, ook als je zelf de enige corrector bent.
Vraag jezelf voor elke summatieve toets: welk leerdoel meet dit onderdeel precies? Kan een leerling het goede antwoord terugvinden in de lessen die ik heb gegeven, niet alleen in de methode? Is het antwoord op een van beide vragen "nee", herschrijf het onderdeel.
Er is ook een systeemprobleem. De druk van het centraal examen zorgt ervoor dat schoolexamens steeds vaker functioneren als voorbereiding op het CE in plaats van als zelfstandig leermoment. De ruimte voor een rijker, formatief geëvalueerd curriculum krimpt daardoor. Als individuele leraar kun je dat systeem niet veranderen, maar je kunt summatieve toetsen wél transparanter maken: maak de criteria vooraf bekend, bespreek het type vragen, en maak de toets voorspelbaar. Zo verlies je de selectiefunctie niet, maar verklein je onnodige stress.
Van een afrekencultuur naar een groeicultuur met AI
Een afrekencultuur ontstaat wanneer toetsen primair als selectie-instrument functioneren en nauwelijks als spiegel voor leren. De gevolgen zijn gedocumenteerd: leerlingen gaan strategisch studeren voor de toets in plaats van conceptueel te leren, en leraren voelen de druk om stof af te raffelen om alle leerdoelen "af te hebben" vóór het toetsmoment.
Een groeicultuur vraagt iets anders: regelmatige formatieve checks, zichtbaar leren, en ruimte voor fouten als leermoment. Dat klinkt goed op papier, maar stuit op een reëel probleem: tijd. Formatief evalueren kost voorbereidingswerk. Een exit ticket bedenken, een diagnostische vraag formuleren, een korte observatie structureren; dat is werk dat veel leraren niet standaard hebben ingepland.
Generatieve AI maakt dit toegankelijker. Tools die op basis van een leerdoel binnen seconden drie exit ticket-vragen genereren, verlagen de drempel aanzienlijk. Een exit ticket is een kort formatief instrument aan het einde van een les: twee of drie vragen die laten zien of leerlingen de kern hebben begrepen. Zelf schrijven kost een leraar gemiddeld tien tot vijftien minuten. Met AI-ondersteuning duurt het minder dan een minuut.
Gebruik aan het einde van je volgende les een exit ticket met drie vragen: één feitenkennis, één inzichtstoepassing, één reflectievraag ("Wat vind je nog onduidelijk?"). Sorteer de antwoorden in drie stapels: begrijpt het volledig, bijna, nog niet. Begin de volgende les met de "nog niet"-groep terwijl de rest zelfstandig verdiept.
AI kan ook helpen bij het herkennen van patronen in formatieve data. Een leerling die bij elk exit ticket dezelfde conceptuele fout maakt, heeft gerichte ondersteuning nodig. Dat patroon handmatig bijhouden voor 28 leerlingen is vrijwel ondoenlijk; digitale tools worden hier steeds beter in. De leraar blijft de beslisser: de technologie levert informatie, de professional zet die om in actie.
Impact op het welzijn van de leerling
Er is een duidelijk verschil tussen gezonde prestatiemotivatie en de soort toetsstress die het leren actief belemmert. Leerlingen die opgroeien in een omgeving waar elke toets consequenties heeft voor hun rapport, ontwikkelen vaak een vermijdingsreflex: ze kiezen voor veilig en vertrouwd in plaats van voor uitdaging, en vragen minder snel hulp uit angst als "zwak" te worden gezien.
Onderzoek naar de effecten van formatief evalueren laat zien dat een ander toetsklimaat dit patroon kan doorbreken. Als leerlingen weten dat tussentijdse toetsmomenten bedoeld zijn om te leren en niet om af te rekenen, neemt de bereidheid toe om eerlijk aan te geven wat ze niet begrijpen. Dat is de basis voor eigenaarschap over het eigen leerproces, een van de kernambities in de herziene SLO-kerndoelen.
— Dylan Wiliam, Embedded Formative Assessment (2011)"If students go away from a lesson not knowing what they don't know, then feedback has failed its most important job."
De relatie tussen formatief evalueren en motivatie is niet automatisch positief. Dat moet gezegd worden. Formatieve toetsen die leerlingen "betrappen" op wat ze niet weten, zonder dat er iets mee gebeurt, werken demotiverend. Formatieve toetsen waarbij leerlingen hun eigen voortgang kunnen zien en bijsturen, versterken het gevoel van competentie en autonomie. Dat onderscheid maakt het verschil tussen een instrument dat werkt en een instrument dat vermoeit.
Misvattingen spelen hier ook een rol. Op veel scholen heerst het idee dat formatief handelen per definitie geen cijfers bevat, of dat het een "zachter" alternatief is voor serieus onderwijs. Een veelvoorkomende misvatting is dat formatief evalueren synoniem staat aan "toetsen zonder consequenties." Formatief handelen is juist veeleisend, voor leraar én leerling, omdat het vraagt om actieve opvolging.
Hoe vind je de balans in de praktijk?
Een schoolbrede visie op toetsing](https://onderwijskennis.nl/kennisbank/formatief-handelen-als-kans-voor-leren-in-het-voortgezet-onderwijs) is geen luxe maar een noodzaak. Individuele leraren kunnen beginnen in hun eigen klas, maar zonder gedeeld begrip op schoolniveau botsen didactische keuzes met de verwachtingen van collega's, ouders en leerlingen. Ouders die gewend zijn aan wekelijkse cijfers, snappen niet altijd waarom er ineens minder rapporten komen. Leerlingen die zijn gesocialiseerd in een puntensysteem, ervaren formatieve feedback aanvankelijk als vrijblijvend.
Zes concrete stappen om te beginnen:
- Maak het doel van elke toets expliciet. Is dit een leermoment of een beoordelingsmoment? Communiceer dat helder, vóóraf, naar leerlingen.
- Bouw formatieve checkpoints in als standaard. Exit tickets, diagnostische vragen of korte peer assessments zijn geen extra; ze vervangen de laatste vijf minuten samenvatten.
- Gebruik feedback als tweegesprek. Laat leerlingen reageren op de feedback die ze ontvangen. Feedback werkt pas als een leerling er actief mee aan de slag gaat.
- Benut AI voor snelle formatieve instrumenten. Genereer exit tickets en reflectievragen op basis van het leerdoel van de dag, zodat je energie gaat naar interpretatie en opvolging.
- Betrek leerlingen bij succescriteria. Laat hen zelf formuleren wat een goed antwoord inhoudt. Dat verhoogt eigenaarschap en maakt feed-up concreet.
- Evalueer je toetsprogramma als team. Breng de verhouding summatief/formatief in kaart per periode. Pas bij waar de balans te ver doorslaat naar één kant.
Teams die hun beoordelingspraktijk willen heroverwegen, kunnen baat hebben bij het samen herijken van beoordelingscriteria en het vergroten van leerlingbetrokkenheid bij evaluatie.
Conclusie
De discussie over summatief en formatief toetsen is in Nederland geen abstracte beleidsaangelegenheid. Ze raakt direct aan de vraag welk signaal je leerlingen geeft over wat leren is: een reeks prestaties die worden beoordeeld, of een proces van groei dat zichtbaar en begeleidbaar is.
Summatieve toetsen blijven noodzakelijk voor kwalificatie en doorstroom. Maar het onderwijsleerproces vóór die eindmeting verdiende meer aandacht dan het in de meeste klassen systematisch krijgt. Met het feedbackmodel van Hattie en Timperley als kompas, AI-tools die de tijdslast verlagen, en een schoolbrede visie als fundament, is de balans tussen summatief en formatief toetsen geen ideaal maar een haalbare praktijk. Begin klein, wees consistent, en bouw een toetscultuur die leerlingen laat groeien in plaats van alleen beoordeelt.



