Wat is het verschil tussen summatieve en formatieve beoordeling?

Formatieve beoordeling vindt plaats tijdens het leerproces: het is voortdurende feedback die de instructie bijstuurt. Summatieve beoordeling vindt plaats nadat een eenheid of cursus is afgerond en meet wat leerlingen hebben beheerst ten opzichte van een vastgestelde standaard. Zie formatief als de navigatie die onderweg bijstuurt, en summatief als de aankomstcontrole.

Moet een summatieve beoordeling altijd een toets zijn?

Nee. Elke taak waarbij leerlingen aan het einde van een leerperiode beheersing moeten aantonen, voldoet. Portfolio's, debatten, museumtentoonstellingen, onderzoekspresentaties, gesimuleerde rechtszaken en slotprojecten zijn allemaal geldige summatieve beoordelingen, en vaak onthullen ze meer over werkelijk begrip dan een meerkeuzevragenlijst.

Hoe beoordeel je een summatieve taak eerlijk?

Rubrieken zijn het standaardantwoord, maar de kwaliteit van de rubriek is doorslaggevend. Criteria moeten rechtstreeks aansluiten bij de leerstandaarden die worden beoordeeld, beschrijvende taal gebruiken voor elk prestatieniveau, en al voor de beoordeling met leerlingen worden gedeeld. Standaardgerichte beoordelingskaders maken deze afstemming formeel.

Hoeveel summatieve beoordelingen moet een docent per eenheid geven?

De meeste instructieontwerpraamwerken bevelen een of twee summatieve beoordelingen per eenheid aan: genoeg om de breedte van de leerdoelen te dekken zonder beoordelingsmoeheid te veroorzaken. Kwaliteit van ontwerp gaat boven frequentie. Een goed opgezette prestatietaak levert vaak meer bruikbare data op dan drie korte toetsen.

Kunnen resultaten van summatieve beoordeling worden gebruikt om het onderwijs te verbeteren?

Absoluut. Summatieve data op klasniveau onthult patronen: als 70% van de leerlingen hetzelfde concept heeft gemist, moet het ontwerp of de planning van de eenheid worden aangepast. Veel scholen gebruiken summatieve resultaten in formele data-analysecycli om de curriculumplanning voor het volgende jaar te onderbouwen.

Summatieve Beoordeling - Pedagogische Wiki

Definitie

Summatieve beoordeling is de formele evaluatie van leerlingprestaties aan het einde van een afgebakende instructieperiode , een eenheid, semester, cursus of leerjaar. Het doel is te meten in hoeverre leerlingen specifieke leerstandaarden of doelstellingen hebben bereikt, en zo een oordeel over beheersing te vellen in plaats van direct hersteladvies te geven.

De term komt van het Latijnse summa, wat totaal of som betekent. Die etymologie is veelzeggend: summatieve beoordeling telt op wat een leerling op een bepaald moment weet en kan. Het is het controlepunt aan het einde van een reis, niet de routebeschrijving onderweg. Veelvoorkomende voorbeelden zijn eindexamens, afsluitende projecten per eenheid, gestandaardiseerde staatstoetsen, AP-examens, slotpresentaties en portfolio-verdedigingen.

Summatieve beoordeling is niet per definitie een toets. De vorm is veel minder bepalend dan de functie. Wat een beoordeling summatief maakt, is de plaatsing ná de instructie en het evaluatieve doel: heeft deze leerling de standaard gehaald?

Historische Context

Het conceptuele onderscheid tussen formatieve en summatieve evaluatie verscheen in de onderwijsliteratuur via Michael Scrivens artikel uit 1967, "The Methodology of Evaluation," gepubliceerd in de AERA-monografieënreeks over curriculumevaluatie. Scriven schreef over programma-evaluatie, niet over leerlingbeoordeling, maar Benjamin Bloom en zijn collega's aan de University of Chicago vertaalden het kader snel naar de klassenpraktijk.

Bloom, samen met J. Thomas Hastings en George Madaus, beschreef de klassikale toepassing in hun boek uit 1971: Handbook on Formative and Summative Evaluation of Student Learning. In dat kader stuurde formatieve evaluatie de lopende instructie bij, terwijl summatieve evaluatie een eindoordeel velde. Bloom koppelde summatieve beoordeling rechtstreeks aan zijn taxonomie van onderwijsdoelen en betoogde dat de diepste cognitieve niveaus , analyse, synthese, evaluatie , beoordelingstaken vereisen die verder gaan dan reproductie.

Het tijdperk van gestandaardiseerde toetsing in de late twintigste eeuw vernauwde het publieke begrip van summatieve beoordeling tot grootschalige, hoge-inzet examens. De No Child Left Behind Act (2001) in de Verenigde Staten versterkte deze verwarring door schoolfinanciering te koppelen aan gestandaardiseerde summatieve toetsscores, waardoor een generatie docenten de term uitsluitend associeerde met invulformulieren en examenstress.

De tegenreactie deed zich voor in de jaren negentig en versnelde in de jaren 2000. Grant Wiggins en Jay McTighes Understanding by Design (1998) pleitte voor op prestaties gebaseerde summatieve taken die terugwerkend vanuit gewenste begrippen werden ontworpen. Hun werk, samen met de groeiende interesse in portfolio-beoordeling van onderzoekers als Dennie Palmer Wolf bij Harvard Project Zero, herstelde het concept van summatieve beoordeling als een flexibele, betekenisvolle afsluitende ervaring in plaats van een gestandaardiseerde toets als standaardoptie.

Kernprincipes

Afstemming op Leerstandaarden

Een summatieve beoordeling is alleen zo geldig als de verbinding met wat er is onderwezen en wat leerlingen werden geacht te leren. Elk onderdeel, elke vraag of elk prestatiecriterium moet rechtstreeks zijn gekoppeld aan een specifiek leerdoel of een specifieke standaard. Wanneer beoordelingen afdwalen van hun standaarden , wanneer een geschiedenistoets leesvaardigheid meer beoordeelt dan historisch redeneren , produceren ze misleidende data over de beheersing van leerlingen. Deze afstemmingseis vormt de basis van standaardgericht beoordelen, dat de verbinding tussen beoordelingstaken en specifieke competenties expliciet en transparant maakt.

Oordeel Boven Feedback

Het bepalende doel van summatieve beoordeling is evaluerend, niet instructief. Waar formatieve beoordeling feedback genereert waarop leerlingen en docenten direct handelen, genereert summatieve beoordeling een cijfer, score of beheersingsvaststelling die een afgesloten leerepsiode vertegenwoordigt. Dit betekent niet dat summatieve beoordelingen geen leereffect hebben , goed ontworpen taken vereisen diepe cognitieve betrokkenheid , maar de primaire uitkomst is een oordeel, geen instructiemaatregel.

Authenticiteit en Transfer

De meest effectieve summatieve beoordelingen vragen leerlingen kennis toe te passen in nieuwe contexten, niet louter informatie te reproduceren die ze hebben gememoriseerd. Dit principe, geworteld in transfertheorie ontwikkeld door onderzoekers als Robert Bjork aan UCLA en Henry Roediger aan de Washington University, onderscheidt oppervlakkige kennis van duurzaam begrip. Een leerling die de waterkringloop op een diagram kan uitleggen, heeft reproductie aangetoond; een leerling die een waterhergebruiksysteem kan ontwerpen voor een door droogte getroffen regio, heeft transfer aangetoond.

Transparantie Vóór de Beoordeling

Leerlingen presteren beter en gelijkwaardiger wanneer ze begrijpen hoe beheersing eruitziet voordat ze die moeten aantonen. Het vooraf publiceren van rubrieken, bespreken van voorbeeldwerken en expliciet maken van leerdoelen zijn geen vormen van "de antwoorden weggeven." Het zijn voorwaarden voor eerlijke meting. Wanneer leerlingen de criteria niet begrijpen, weerspiegelt hun prestatie vertrouwdheid met toetsformaten evenzeer als daadwerkelijk leren.

Scheiding van Oefening en Beoordeling

Summatieve beoordelingen moeten eindbeheersing evalueren, niet de rommelige middenfase van het leerproces. Ruwe concepten, deelname of lopende labjournalen als summatief beoordelen ondermijnt zowel de nauwkeurigheid (de leerling was nog niet klaar met leren) als de motivatie (leerlingen nemen geen risico's meer als elke poging permanent meetelt). Het scheiden van oefeningsbeoordeling van eindoordeel is zowel een meetkundig als een ethisch principe.

Toepassing in de Klas

Middelbare school (onderbouw)

Afsluitende Prestatietaak per Eenheid (Middenschool)

Een zevende-klas-aardrijkskunde- en biologiedocent sluit een eenheid over ecosystemen af door leerlingen een zelfvoorzienend terrarium te laten ontwerpen en een wetenschappelijke verklaring te schrijven over de energiestroom en voedingscycli daarbinnen. Leerlingen presenteren hun ontwerpen aan een panel bestaande uit de docent en twee als beoordelaars getrainde klasgenoten. De taak vereist reproductie van terminologie, maar de kern is toepassing: leerlingen moeten redeneren over een systeem dat ze zelf hebben gebouwd, niet een dat ze hebben gememoriseerd. De docent gebruikt een rubriek met vier criteria voor wetenschappelijke nauwkeurigheid, systeemdenken, communicatieduidelijkheid en gebruik van bewijs. Elk criterium is gekoppeld aan een specifieke NGSS-prestatieverwachting die tijdens de eenheid is geïntroduceerd.

Middelbare school (bovenbouw)

Slotdebat (Middelbare School Maatschappijleer)

Een twaalfde-klas-docent staatsinrichting sluit een semester lang duurt eenheid over constitutioneel recht af met een gesimuleerde rechtszaak. Leerlingen verdedigen toegewezen standpunten in een gesimuleerde zaak over het Vierde Amendement en huiszoekingen, waarbij ze jurisprudentie en constitutionele tekst citeren. Het gesimuleerde rechtbankformaat is inherent summatief: leerlingen kunnen niets opzoeken, moeten maanden aan inhoud samenvatten en moeten in real time reageren op tegenargumenten. De docent beoordeelt elke leerling op juridisch redeneren, gebruik van bewijs, kwaliteit van weerlegging en procedurele naleving , allemaal afgestemd op de AP Government-cursusstandaarden.

Basisonderwijs

Museumtentoonstelling (Basisonderwijs)

Een vierde klas die lokale geschiedenis bestudeert, presenteert een "levend museum" waarbij elke leerling expert wordt op één aspect van het verleden van hun stad. Leerlingen maken tentoonstellingspanelen, schrijven verklarende labels en beantwoorden vragen van bezoekers in de rol van hun onderwerp. Het museumtentoonstellingsformaat werkt als summatieve beoordeling omdat het leerlingen vraagt onderzoek samen te vatten in een communiceerbaar verhaal en onvoorziene vragen van een authentiek publiek te beantwoorden. Docenten beoordelen met een rubriek voor historische nauwkeurigheid, gebruik van primaire bronnen en kwaliteit van mondelinge toelichting.

Basisonderwijs

Persconferentie (Maatschappijleer, Groep 6-12)

Na een eenheid over klimaatbeleid kiezen leerlingen een stakeholderrol , een kustburgemeester, een directeur van een fossielenbedrijf, een milieuonderzoeker, een vakbondsvertegenwoordiger , en nemen deel aan een gesimuleerde persconferentie. Studentjournalisten (uit de eigen klas of een partnerklas) sturen vragen vooraf in en stellen vervolgvragen in real time. Docenten beoordelen historische nauwkeurigheid, kwaliteit van argumentatie, erkenning van tegenargumenten en gebruik van data. Het format vereist dat leerlingen hun kennis onder druk vasthouden , een betere maatstaf voor werkelijk begrip dan een schriftelijke toets in stilte.

Onderzoeksonderbouwing

Het fundamentele pleidooi voor rigoureuze summatieve beoordeling komt van John Hatties synthese van meer dan 800 meta-analyses, gepubliceerd in Visible Learning (2009). Hattie ontdekte dat beoordelingen met duidelijke criteria en betekenisvolle prestatiestandaarden een effectgrootte van 0,62 hadden op leerlingprestaties , ruim boven de drempel van 0,40 die hij identificeert als een jaar leergroei. De cruciale modererende variabele was of leerlingen de succescriteria begrepen vóórdat ze de taak uitvoerden.

Paul Black en Dylan Wiliams baanbrekende review uit 1998, "Assessment and Classroom Learning," gepubliceerd in Assessment in Education, onderzocht 250 studies over beoordelingspraktijk. Hoewel hun werk het bekendst is om zijn conclusies over formatieve feedback, documenteerden ze ook dat summatieve beoordelingen rondom hoger-orde denken blijvende retentie-effecten produceerden, terwijl beoordelingen gericht op feitenreproductie steile vergeetcurves lieten zien binnen weken na de toets.

Linda Darling-Hammond en haar collega's aan Stanfords Center for Opportunity Policy in Education produceerden in 2010 een vergelijkende studie van prestatiebeoordelingssystemen in de Verenigde Staten en internationaal. Scholen die portfolio-gebaseerde summatieve beoordelingen gebruikten , met name in het New York Performance Standards Consortium , toonden gelijkwaardige of betere doorstroomprestaties naar het hoger onderwijs vergeleken met scholen die gestandaardiseerde summatieve toetsen benadrukten, ondanks het feit dat ze aanzienlijk hogere percentages leerlingen uit lagere-inkomensgroepen bedienden.

Onderzoek naar authenticiteit ondersteunt specifiek prestatiegericht summatief beoordelen. Een meta-analyse uit 2018 door Karen Murphy en collega's aan Penn State, gepubliceerd in Review of Educational Research, onderzocht 53 studies naar samenwerkende, prestatiegericht beoordelingen en vond significante voordelen voor langetermijnretentie en transfer vergeleken met individuele schriftelijke examens. Het effect was het sterkst wanneer taken vereisten dat leerlingen een publieksgericht product maakten , een presentatie, tentoonstelling of gepubliceerd stuk , in plaats van een privé-inzending.

Eén eerlijke beperking: de meeste studies naar prestatiebeoordeling zijn moeilijk te vergelijken omdat taken enorm variëren tussen klassen en scholen. De onderzoeksbasis groeit maar heeft nog niet het soort streng gecontroleerde studies opgeleverd dat een sceptische beleidsmaker zou overtuigen. Wat het bewijs wél duidelijk ondersteunt, is dat afstemming tussen beoordeling en instructiedoelen de sterkste voorspeller is van betekenisvolle data, ongeacht de vorm.

Veelvoorkomende Misvattingen

Verbinding met Actief Leren

Summatieve beoordeling en actief leren zijn niet alleen verenigbaar , de sterkste actieve leermethodieken zijn juist ontworpen met betekenisvolle summatieve taken in gedachten. Grant Wiggins betoogde in Educative Assessment (1998) dat authentieke taken , toepassingen van academische kennis in de echte wereld , tegelijkertijd de beste instructievehicles en de meest geldige summatieve maatstaven zijn.

Het gesimuleerde rechtbankformaat illustreert deze integratie. Leerlingen kunnen juridische concepten niet louter reproduceren; ze moeten ze toepassen onder adversariale omstandigheden en reageren op argumenten die ze niet hadden voorzien. De beoordeling is de activiteit, en de activiteit is de beoordeling. Er is geen aparte "toetsdag" los van de leerervaring.

Op dezelfde wijze produceert de museumtentoonstellingsmethodiek een publiek artefact dat leerlingen vraagt onderzoek samen te vatten in een toegankelijke, nauwkeurige en boeiende presentatie. Het proces van het bouwen van de tentoonstelling is formatief , docenten en peers geven feedback op concepten, nauwkeurigheidscontroles vinden plaats vóór de opening , terwijl de uiteindelijke tentoonstelling als summatieve maatstaf dient. Deze structuur sluit precies aan bij wat Dylan Wiliam "assessment for learning" noemt, dat naast "assessment of learning" opereert.

De persconferentiemethodiek schept omstandigheden voor spontane kennisdemonstrate , aantoonbaar de zuiverste vorm van summatieve beoordeling: leerlingen kunnen niet vertrouwen op aantekeningen of scripts, moeten hun standpunten met bewijs verdedigen en moeten reageren op onverwachte vragen van klasgenoten die hun eigen onderzoek hebben gedaan. Dit soort ongeschreven optreden onthult begrip dat geen enkele schriftelijke toets kan bereiken.

Alle drie de methodieken passen van nature bij rubrieken om de evaluatiecriteria expliciet te maken, en bij formatieve beoordelingscontrolepunten gedurende het voorbereidingsproces. Wanneer ingebed in een standaardgericht beoordelingskader, is het resultaat een samenhangend systeem waarin leerlingen altijd begrijpen hoe beheersing eruitziet, meerdere oefenkansen hebben vóór de uiteindelijke demonstratie en worden beoordeeld aan de hand van consistente, transparante criteria in plaats van onderlinge vergelijking of een curvegebaseerde beoordeling.

Bronnen

Scriven, M. (1967). The methodology of evaluation. In R. W. Tyler, R. M. Gagné, & M. Scriven (Eds.), Perspectives of Curriculum Evaluation (pp. 39-83). Rand McNally.
Bloom, B. S., Hastings, J. T., & Madaus, G. F. (1971). Handbook on Formative and Summative Evaluation of Student Learning. McGraw-Hill.
Black, P., & Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education: Principles, Policy & Practice, 5(1), 7-74.
Wiggins, G., & McTighe, J. (1998). Understanding by Design. Association for Supervision and Curriculum Development.

Summatieve Beoordeling

Definitie

Historische Context

Kernprincipes

Afstemming op Leerstandaarden

Oordeel Boven Feedback

Authenticiteit en Transfer

Transparantie Vóór de Beoordeling

Scheiding van Oefening en Beoordeling

Toepassing in de Klas

Afsluitende Prestatietaak per Eenheid (Middenschool)

Slotdebat (Middelbare School Maatschappijleer)

Museumtentoonstelling (Basisonderwijs)

Persconferentie (Maatschappijleer, Groep 6-12)

Onderzoeksonderbouwing

Veelvoorkomende Misvattingen

Verbinding met Actief Leren

Bronnen

Veelgestelde Vragen

Gerelateerde Concepten

Gerelateerde Artikelen

Hoe implementeer je de nieuwe SLO kerndoelen in je dagelijkse lespraktijk

Hoe je de balans vindt tussen summatief en formatief toetsen in de klas

De ultieme gids voor de vier-hoeken-activiteit: strategieën voor betrokkenheid in het basis- en voortgezet onderwijs

Gerelateerde Methodieken

Oefenrechtbank

Museumopstelling

Persconferentie