Vad är skillnaden mellan summativ och formativ bedömning?

Formativ bedömning sker under lärandet , det är löpande återkoppling som justerar undervisningen. Summativ bedömning sker efter att ett tema eller en kurs avslutats och mäter vad eleverna har behärskat i förhållande till en definierad standard. Tänk på formativ bedömning som GPS:en som ruttplanerar under resan, och summativ bedömning som ankomstkontrollen.

Måste summativ bedömning vara ett prov?

Nej. Vilken uppgift som helst där eleverna ska visa behärskning i slutet av en läroperiod räknas. Portföljer, debatter, museiutställningar, forskningspresentationer, skenmål och avslutande projekt är alla giltiga summativa bedömningar , ofta mer avslöjande när det gäller verklig förståelse än ett flervalstest.

Hur betygsätter man en summativ bedömning rättvist?

Bedömningsmatriser är standardsvaret, men matrisens kvalitet spelar en enorm roll. Kriterierna ska direkt motsvara de lärandemål som bedöms, använda beskrivande språk för varje prestationsnivå och delas med eleverna innan bedömningen börjar. Målrelaterade betygssystem formaliserar denna koppling.

Hur många summativa bedömningar bör en lärare ge per tema?

De flesta ramverk för instruktionsdesign rekommenderar en eller två summativa bedömningar per tema , tillräckligt för att fånga bredden av lärandemålen utan att skapa bedömningströtthet. Prioriteringen är designkvalitet framför frekvens. En välkonstruerad prestationsuppgift ger ofta mer användbar data än tre kortprov.

Kan summativa bedömningsresultat användas för att förbättra undervisningen?

Absolut. Summativa data på klassnivå avslöjar mönster: om 70 % av eleverna missade samma begrepp behöver temadesignen eller tempot justeras. Många skolor använder summativa resultat i formella datautforskningscykler för att informera nästa läsårs kursplanering.

Summativ bedömning - Pedagogisk Wiki

Definition

Summativ bedömning är den formella utvärderingen av elevers lärande i slutet av en definierad undervisningsperiod , ett tema, en termin, en kurs eller ett läsår. Syftet är att mäta i vilken grad eleverna har uppnått specifika lärandemål eller standarder, och att producera ett omdöme om behärskning snarare än en förskrivning för omedelbar korrigering.

Termen kommer från latinets summa, som betyder total eller summa. Den etymologin är belysande: summativ bedömning lägger ihop vad en elev vet och kan göra vid en viss tidpunkt. Det är kontrollpunkten i slutet av en resa, inte vägvisningen längs vägen. Vanliga exempel inkluderar slutprov, projektarbeten i slutet av ett tema, standardiserade nationella prov, gymnasieexamina, avslutningspresentationer och portföljförsvar.

En viktig poäng: summativ bedömning är inte per definition ett prov. Formen spelar en mycket mindre roll än funktionen. Det som gör en bedömning summativ är dess placering efter undervisningen och dess utvärderande syfte , har den här eleven uppfyllt standarden?

Historisk bakgrund

Den begreppsmässiga distinktionen mellan formativ och summativ utvärdering kom in i utbildningslitteraturen genom Michael Scrivens artikel "The Methodology of Evaluation" från 1967, publicerad i AERA:s monografserie om läroplansutvärdering. Scriven skrev om programutvärdering, inte elevbedömning, men Benjamin Bloom och hans kollegor vid University of Chicago översatte snabbt ramverket till klassrumspraktik.

Bloom, tillsammans med J. Thomas Hastings och George Madaus, formulerade klassrumstillämpningen i sin bok Handbook on Formative and Summative Evaluation of Student Learning från 1971. I det ramverket informerade formativ utvärdering den löpande undervisningen medan summativ utvärdering fällde ett slutgiltigt omdöme. Bloom kopplade summativ bedömning direkt till sin taxonomi över utbildningsmål och hävdade att de djupaste kognitiva nivåerna , analys, syntes och utvärdering , krävde bedömningsuppgifter som gick bortom återkallning.

Den standardiserade provtidens era under det sena 1900-talet begränsade allmänhetens förståelse av summativ bedömning till att betyda storskaliga, högriskexamina. No Child Left Behind Act (2001) i USA intensifierade denna sammanblandning genom att koppla skolfinansiering till standardiserade summativa testresultat, vilket skapade en generation lärare som förknippade termen uteslutande med svarsformulär och ångest.

Motreaktionen kom på 1990-talet och accelererade under 2000-talet. Grant Wiggins och Jay McTighes Understanding by Design (1998) pläderade för prestationsbaserade summativa uppgifter utformade baklänges utifrån önskade förståelser. Deras arbete, tillsammans med ett växande intresse för portföljbedömning från forskare som Dennie Palmer Wolf vid Harvard Project Zero, återställde uppfattningen om summativ bedömning som en flexibel, meningsfull avslutande upplevelse snarare än ett standardiserat prov per automatik.

Centrala principer

Koppling till lärandemål

En summativ bedömning är bara så giltig som dess koppling till vad som undervisades och vad eleverna förväntades lära sig. Varje uppgift, fråga eller prestationskriterium ska direkt motsvara ett specifikt lärandemål eller en standard. När bedömningar glider från sina mål , när ett historietest mäter läsflyt mer än historiskt tänkande , producerar de vilseledande data om elevernas behärskning. Detta krav på koppling är grunden för målrelaterad betygssättning, som gör sambandet mellan bedömningsuppgifter och specifika kompetenser explicit och transparent.

Omdöme snarare än återkoppling

Det definierande syftet med summativ bedömning är utvärderande, inte instruerande. Medan formativ bedömning genererar återkoppling som elever och lärare agerar på omedelbart, genererar summativ bedömning ett betyg, poäng eller behärskningsomdöme som representerar ett avslutat läroepisod. Det betyder inte att summativa bedömningar inte producerar lärande , väldesignade uppgifter kräver djupt kognitivt engagemang , men det primära resultatet är ett omdöme, inte ett pedagogiskt drag.

Autenticitet och överföring

De mest effektiva summativa bedömningarna kräver att elever tillämpar kunskap i nya sammanhang, inte bara reproducerar information de memorerat. Denna princip, grundad i transferteori utvecklad av forskare som Robert Bjork vid UCLA och Henry Roediger vid Washington University, skiljer ytlig kunskap från varaktig förståelse. En elev som kan förklara vattnets kretslopp på ett diagram har visat återkallning; en elev som kan designa ett vattenåtervinningssystem för en torrdrabbad region har visat transfer.

Transparens före bedömningen

Elever presterar bättre och mer jämlikt när de förstår hur behärskning ser ut innan de försöker visa den. Att publicera bedömningsmatriser i förväg, diskutera exempelarbeten och göra lärandemål explicita är inte former av att "röja svaren". Det är förutsättningar för rättvis mätning. När elever inte förstår kriterierna speglar deras prestationer bekantskap med bedömningsformat lika mycket som faktiskt lärande.

Separation från övning

Summativa bedömningar ska utvärdera slutlig behärskning, inte den stökiga mittfasen i läroprocessen. Att betygsätta utkast, deltagande eller pågående labbanteckningar som summativt underminerar både noggrannheten (eleven hade inte slutat lära sig ännu) och motivationen (elever slutar ta risker om varje försök räknas mot dem permanent). Att hålla övningsbedömning separat från slutgiltigt omdöme är både ett mätprincip och ett etiskt ställningstagande.

Tillämpning i klassrummet

Prestationsuppgifter i slutet av ett tema (mellanstadiet)

En sjundeklassare i NO avslutar ett tema om ekosystem genom att be eleverna designa ett självförsörjande terrarium och skriva en naturvetenskaplig förklaring av energiflödet och ämneskretsloppet i det. Eleverna presenterar sina designer för en panel bestående av läraren och två kamrater utbildade som utvärderare. Uppgiften kräver återkallning av terminologi, men dess kärnkrav är tillämpning: eleverna måste resonera om ett system de konstruerat, inte ett de memorerat. Läraren använder en matris med fyra kriterier som täcker naturvetenskaplig noggrannhet, systemtänkande, kommunikationsklarhet och användning av bevis. Varje kriterium motsvarar en specifik lärandestandard som introducerats under temat.

Avslutningsdebatt (gymnasiet, samhällskunskap)

En gymnasielärare i samhällskunskap avslutar ett terminslångt tema om konstitutionell rätt med en strukturerad skenrättegång. Eleverna argumenterar för tilldelade positioner i ett simulerat fall om husrannsakningsrättigheter, med hänvisning till prejudikat och konstitutionell text. Formatet skenrättegång är i sig summativt: eleverna kan inte slå upp något, måste syntetisera månaders innehåll och måste svara i realtid på motståndarnas argument. Läraren bedömer varje elev på juridiskt resonemang, användning av bevis, genkvalitet och procedurell efterlevnad , allt kopplat till kursens lärandemål.

Museiutställning (lågstadiet)

En fjärdeklass som studerar lokalhistoria presenterar ett "levande museum" där varje elev blir expert på en aspekt av sin stads historia. Eleverna skapar utställningspaneler, skriver förklarande texter och svarar på besökarfrågor i roll. Formatet museiutställning fungerar som summativ bedömning eftersom det kräver att eleverna syntetiserar forskning till en kommunicerbar berättelse och hanterar oförutsägbara frågor från en autentisk publik. Lärare bedömer med hjälp av en matris som täcker historisk noggrannhet, användning av primärkällor och kvaliteten på muntliga förklaringar.

Presskonferens (samhällskunskap, årskurs 6–12)

Efter ett tema om klimatpolitik väljer eleverna en intressentroll , en kustnära borgmästare, en chef för ett fossilbränslebolag, en miljövetare, en fackföreningsrepresentant , och deltar i en simulerad presskonferens. Elevjournalister (hämtade från klassen eller en partnerklass) lämnar in frågor i förväg och följer upp i realtid. Lärare bedömer historisk noggrannhet, argumentationskvalitet, erkännande av motargument och användning av data. Formatet kräver att eleverna håller sina kunskaper under press , ett bättre mått på genuin förståelse än ett skriftligt prov administrerat i tystnad.

Forskningsstöd

Det grundläggande stödet för rigorös summativ bedömning kommer från John Hatties syntes av över 800 meta-analyser, publicerad i Visible Learning (2009). Hattie fann att bedömningar med tydliga kriterier och meningsfulla prestationsstandarder hade en effektstorlek på 0,62 på elevers studieresultat , väl över tröskelns 0,40 som han identifierar som ett läsårs tillväxt. Den kritiska modererande variabeln var huruvida eleverna förstod framgångskriterierna innan de försökte utföra uppgiften.

Paul Black och Dylan Wiliams banbrytande granskning från 1998, "Assessment and Classroom Learning", publicerad i Assessment in Education, undersökte 250 studier om bedömningspraktik. Medan deras arbete är mest känt för sina slutsatser om formativ återkoppling dokumenterade de också att summativa bedömningar utformade kring högre ordningens tänkande producerade varaktiga retentionseffekter, medan bedömningar inriktade på faktaåterkallning visade branta glömskekurvor inom veckor efter provet.

Linda Darling-Hammond och hennes kollegor vid Stanfords Center for Opportunity Policy in Education producerade 2010 en jämförande studie av prestationsbedömningssystem i USA och internationellt. Skolor som använde portföljbaserade summativa bedömningar , särskilt inom New York Performance Standards Consortium , visade likvärdiga eller överlägsna högskolepersistensgrader jämfört med skolor som betonade standardiserade summativa prov, trots att de serverade betydligt högre andelar elever från låginkomstfamiljer.

Forskning om autenticitet stödjer specifikt prestationsbaserade summativa format. En meta-analys från 2018 av Karen Murphy och kollegor vid Penn State, publicerad i Review of Educational Research, undersökte 53 studier om kollaborativa, prestationsbaserade bedömningar och fann betydande fördelar för långsiktig retention och transfer jämfört med individuella pappersbaserade prov. Effekten var starkast när uppgifterna krävde att eleverna producerade en publikt riktad produkt , en presentation, utställning eller publicerat verk , snarare än en privat inlämning.

En ärlig begränsning: de flesta studier om prestationsbedömning är svåra att jämföra eftersom uppgifterna varierar enormt mellan klassrum och skolor. Forskningsbasen växer men har ännu inte producerat den typ av tätt kontrollerade studier som skulle tillfredsställa en skeptisk beslutsfattare. Vad bevisen tydligt stödjer är att koppling mellan bedömning och undervisningsmål är den starkaste prediktorn för meningsfull data, oavsett format.

Vanliga missuppfattningar

Koppling till aktivt lärande

Summativ bedömning och aktivt lärande är inte bara förenliga , de starkaste aktiva lärandemetoderna designades med meningsfulla summativa uppgifter i åtanke. Grant Wiggins hävdade i Educative Assessment (1998) att autentiska uppgifter , verkliga tillämpningar av akademisk kunskap , samtidigt är de bästa pedagogiska redskapen och de mest giltiga summativa måtten.

Formatet skenrättegång exemplifierar denna integration. Eleverna kan inte bara återkalla juridiska begrepp , de måste tillämpa dem under kontradiktoriska förhållanden och svara på argument de inte förutsett. Bedömningen är aktiviteten, och aktiviteten är bedömningen. Det finns ingen separat "provdag" frikopplad från läroupplevelsen.

På liknande sätt producerar metoden museiutställning en offentlig artefakt som kräver att eleverna syntetiserar forskning till en tillgänglig, korrekt och engagerande presentation. Processen att bygga utställningen är formativ , lärare och kamrater ger återkoppling på utkast, noggrannhetskontroller sker före öppningsdagen , medan den slutliga utställningen fungerar som summativt mått. Denna struktur motsvarar precis vad Dylan Wiliam kallar "bedömning för lärande" som verkar sida vid sida med "bedömning av lärande."

Metoden presskonferens skapar förutsättningar för spontan kunskapsdemonstration , möjligen den renaste formen av summativ bedömning: eleverna kan inte förlita sig på anteckningar eller manus, måste försvara sina ståndpunkter med bevis och måste svara på oväntade frågor från kamrater som gjort sin egen forskning. Denna typ av improviserad prestation avslöjar förståelse som inget skriftligt prov kan komma åt.

Alla tre metoderna kombineras naturligt med bedömningsmatriser för att göra utvärderingskriterierna explicita, och med formativa bedömningskontrollpunkter under hela förberedelsefasen. När de är inbäddade i ett ramverk för målrelaterad betygssättning blir resultatet ett sammanhängande system där eleverna alltid förstår hur behärskning ser ut, har flera möjligheter att öva innan den slutliga demonstrationen, och utvärderas mot konsekventa, transparenta kriterier snarare än kamratjämförelse eller kurvsättning.

Källor

Scriven, M. (1967). The methodology of evaluation. In R. W. Tyler, R. M. Gagné, & M. Scriven (Eds.), Perspectives of Curriculum Evaluation (pp. 39–83). Rand McNally.
Bloom, B. S., Hastings, J. T., & Madaus, G. F. (1971). Handbook on Formative and Summative Evaluation of Student Learning. McGraw-Hill.
Black, P., & Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education: Principles, Policy & Practice, 5(1), 7–74.
Wiggins, G., & McTighe, J. (1998). Understanding by Design. Association for Supervision and Curriculum Development.

Summativ bedömning

Definition

Historisk bakgrund

Centrala principer

Koppling till lärandemål

Omdöme snarare än återkoppling

Autenticitet och överföring

Transparens före bedömningen

Separation från övning

Tillämpning i klassrummet

Prestationsuppgifter i slutet av ett tema (mellanstadiet)

Avslutningsdebatt (gymnasiet, samhällskunskap)

Museiutställning (lågstadiet)

Presskonferens (samhällskunskap, årskurs 6–12)

Forskningsstöd

Vanliga missuppfattningar

Koppling till aktivt lärande

Källor

Vanliga Frågor

Relaterade Begrepp

Relaterade Artiklar

Så navigerar du i övergången från kunskapskrav till betygskriterier

Så här använder du Town Hall i ditt klassrum

Varför de nya betygskriterierna i Lgr22 faktiskt gynnar dina elever

Relaterade Metoder

Rättegångsspel

Museumutställning

Presskonferens