Definition

Formativ bedömning är all bedömningsaktivitet som genomförs under lärprocessen med det uttryckliga syftet att informera undervisningen och förbättra elevernas lärande innan det avslutas. Det är inte ett prov eller ett betyg — det är ett kontinuerligt samtal mellan lärare och elev om var lärandet befinner sig och vart det behöver ta vägen.

Den kanoniska definitionen kommer från Paul Black och Dylan Wiliams syntes från 1998: bedömning är formativ när bevis på elevers lärande framkallas, tolkas och används för att fatta beslut om nästa steg i undervisningen. Tre aktörer deltar i den återkopplingsslingan — läraren, kamrater och eleven själv — och alla tre kan initiera den. En lärare som läser exit cards vid dörren, två elever som jämför sitt resonemang under en think-pair-share, och en elev som kontrollerar sitt utkast mot en checklista för framgångskriterier — alla genomför formativ bedömning.

Ordet "formativ" fångar den tidsmässiga logiken: denna bedömning formar eleven medan formationen fortfarande är möjlig. I kontrast mäter summativ bedömning vad en elev uppnått efter att undervisningen avslutats. Båda tjänar väsentliga syften, men att blanda ihop dem — betygsätta formativt arbete eller behandla summativa resultat som handlingsbar återkoppling — försvagar båda.

Historisk bakgrund

Den intellektuella grunden för formativ bedömning löper genom flera decennier av kognitiv och pedagogisk forskning, som börjar långt innan termen själv blev vanlig.

Benjamin Blooms arbete från 1969 om mastery learning introducerade den centrala insikten: om elever får korrigerande återkoppling vid regelbundna kontrollpunkter under undervisningen förbättras resultaten avsevärt. Bloom observerade att individuell handledning producerade resultat två standardavvikelser över konventionell klassrumsundervisning. Han tillskrev gapet till stor del handledarens konstanta övervakning och anpassning i realtid. Formativ bedömning var i Blooms tolkning en klassrumsapproximation av handledarens återkopplingsslinga.

Michael Scriven myntade termen "formative evaluation" 1967, ursprungligen tillämpad på lärplansutveckling snarare än elevbedömning. Lee Cronbach utvidgade begreppet till elevlärande kort därefter. Men det var 1998 års arbete av Paul Black och Dylan Wiliam vid King's College London som lyfte formativ bedömning till en forskningsprioritet i klassrumspraktiken. Deras översiktsartikel "Inside the Black Box", publicerad i Phi Delta Kappan, sammanfattade 250 studier och fann effektstorlekar från 0,4 till 0,7 — tillräckligt för att flytta en genomsnittlig elev från den 50:e till ungefär den 70:e percentilen. Recensionens omfattning och tillgänglighet gjorde den till ett av de mest citerade verken inom utbildningsforskning.

Wiliam fortsatte att utveckla ramverket genom Assessment Reform Group i Storbritannien, och hans bok Embedded Formative Assessment från 2011 översatte forskningen till strukturerade klassrumsrutiner som praktiker kunde anta utan att göra en fullständig lärplansrevision. Det parallella arbetet av John Hattie, vars meta-analys Visible Learning från 2009 sammanställde resultat från 800 meta-analyser, bekräftade självständigt återkopplingens primat — den rankade bland de högst verkande influenserna på prestation i hans syntes.

Centrala principer

Återkopplingsslingan sluts

Formativ bedömning fungerar bara när bevis på lärande faktiskt förändrar vad som händer härnäst. Att samla in data och lägga undan den är övervakning, inte formativ bedömning. Det utmärkande draget är att informationen sluter cirkeln tillbaka till undervisningen: läraren undervisar om ett förvirrande begrepp på nytt, accelererar förbi innehåll som eleverna redan behärskar, eller omformar en uppgift som misslyckades med att generera det avsedda tänkandet. Om återkopplingsslingan inte sluts var bedömningen inte formativ — oavsett vilket verktyg som användes.

Återkoppling riktar in sig på gapet

Effektiv formativ återkoppling identifierar gapet mellan en elevs nuvarande förståelse och lärandemålet, och ger sedan information som hjälper till att överbrygga det. Detta är det ramverk som artikulerades av Sadler (1989) och senare systematiserades av Hattie och Timperleys 2007 års modell för återkoppling. Återkoppling som helt enkelt markerar ett svar som fel ger eleven ett utlåtande utan en riktning. Återkoppling som namnger vad eleven gjorde, vad målet kräver och hur ett konkret nästa steg ser ut ger dem handlingsutrymme.

Lärandemål måste vara transparenta

Elever kan inte självbedöma, reagera på återkoppling eller lära av kamrater om de inte vet vad de strävar mot. Formativ bedömning förutsätter tydliga, specifika och elevtillgängliga lärandemål. När lärare delar inte bara uppgiften utan också kriterierna för framgång — och hjälper elever att internalisera hur "uppfyllande av standarden" ser ut genom bearbetade exempel eller ankarpapper — blir formativ återkoppling handlingsbar snarare än förvirrande.

Kamrat- och självbedömning utvidgar återkopplingen

Ingen lärare kan generera meningsfull, individualiserad återkoppling för varje elev på varje uppgift. Kamratbedömning och självbedömning skalar återkopplingssystemet utan att skala upp lärarens arbetsbelastning, och bär sina egna lärandefördelar. När elever bedömer en kamrats arbete mot gemensamma kriterier övar de det analytiska tänkande som lärandemålet kräver. När elever ärligt utvärderar sitt eget arbete bygger de den metakognitiva medvetenhet som förutsäger långsiktig akademisk framgång (Zimmerman, 2002).

Låga insatser skyddar ärliga bevis

Om elever tror att deras formativa svar kommer att betygsättas presterar de snarare än att avslöja. Betyg kopplade till formativt arbete undertrycker de ärliga felen som är mest användbara för en lärare som anpassar undervisningen. Forskning visar konsekvent att ta bort betyg från formativa aktiviteter — och vara explicit med eleverna om att fel är förväntade och användbara — förbättrar både kvaliteten på insamlade bevis och elevernas villighet att ta intellektuella risker (Butler, 1988).

Tillämpning i klassrummet

Grundskola: Trafikljuskontrollen

En matematiklärare i årskurs tre introducerar en ny multiplikationsstrategi. Vid en naturlig paus i lektionen ber hon eleverna hålla upp ett rött, gult eller grönt kort (eller visa fingrar): grönt betyder "jag förstår", gult betyder "jag är osäker", rött betyder "jag är borttappad". Hon skannar rummet på några sekunder. Hon tar de röda eleverna i en liten grupp för ytterligare modellering medan de gröna eleverna arbetar med en utmaningsuppgift. De gula eleverna parar ihop sig för att jämföra sina tillvägagångssätt. Läraren har differentierat undervisningen på under en minut med hjälp av bevis från rummet snarare än intuition.

Gymnasiet: Whiteboardgalleri för argumentkartläggning

En engelsklärare i nian ber eleverna skriva sina tesismeningar på miniwhiteboards och hålla upp dem samtidigt. Hon går längs raden och ser omedelbart att ungefär en tredjedel av klassen har skrivit ämnesmeningar snarare än argumenterbara påståenden. I stället för att rätta varje papper väljer hon tre anonyma exempel — ett starkt, ett partiellt, ett underutvecklat — och genomför en kort klassanalys. Eleverna reviderar sina whiteboards. Läraren har samlat in bevis från varje elev och omdirigerat undervisningen utan någon betygsättning.

Högre utbildning och kompetensutveckling: Enpappersmetoden

En facilitator för lärarutbildning pausar workshopen femton minuter innan den är slut och ställer två frågor: "Vad är det viktigaste du lärde dig idag?" och "Vilken fråga har du fortfarande?" Deltagarna skriver i två minuter och lämnar in lapparna. Facilitatorn läser dem samma kväll och öppnar nästa session med att bemöta de tre vanligaste kvarvarande frågorna. Deltagarna lär sig att deras förvirring är förväntad och värderas; facilitatorn lär sig var hen ska börja nästa gång.

Exit tickets är en av de mest praktiska implementeringarna av denna princip över alla årskurser — en strukturerad fråga i slutet av lektionen som genererar handlingsbar information på under fem minuter.

Forskningsbevis

Black och Wiliams granskning från 1998 etablerade den grundläggande evidensbasen. Genom att syntetisera ungefär 250 studier fann de att välimplementerad formativ bedömning producerade effektstorlekar mellan 0,4 och 0,7, med de starkaste effekterna observerade för lågpresterande elever. Detta är anmärkningsvärt: formativ bedömning är inte en strategi som primärt gynnar redan högpresterande elever. De mekanismer de identifierade inkluderade tydligare lärandemål, rikare återkoppling och ett starkare elevansvar för lärandet.

Hattie och Timperleys 2007 artikel "The Power of Feedback", publicerad i Review of Educational Research, meta-analyserade 196 studier med 6 972 effektstorlekar och fann en genomsnittlig effektstorlek på 0,79 för återkoppling — ett av de starkaste undervisningsinflytandena i hela syntesen. Kritiskt nog fann de att återkoppling riktad till självbilden ("du är en duktig elev") var i stort sett ineffektiv. Återkoppling riktad till uppgiften, processen och elevens självregleringsstrategier producerade de starkaste vinsterna.

Kingsley och Grabner-Hagen (2015) undersökte digitala formativa bedömningsverktyg i K-12-klassrum och fann att omedelbar återkoppling — tillgänglig via klassrumsresponssystem — producerade starkare läranderesultat än fördröjd skriftlig återkoppling när eleverna hade tillräcklig vägledning för att agera på vad de fick. Återkopplingens hastighet spelar roll, men bara när den kombineras med tydlighet.

Kingston och Nashs meta-analys från 2011, publicerad i Educational Measurement: Issues and Practice, är värd att nämna för sin intellektuella ärlighet: den fann mindre effektstorlekar (ungefär 0,20) än Black och Wiliams syntes. Kingston och Nash tillskrev skillnaden till studiernas kvalitet och implementeringens trohet. Formativ bedömning med svag implementering ger svaga resultat. Forskningen stödjer praktiken, men inte okritiskt — utförandet spelar roll.

Vanliga missuppfattningar

Formativ bedömning betyder täta quizar. Låginsatsquizar kan tjäna formativa syften, men formativ bedömning definieras av vad som händer med bevisen — inte av verktygets format. En lärare som ger ett femfrågorsprov och sedan fortsätter med nästa lektion oavsett resultat har genomfört ett quiz, inte en formativ bedömning. Å andra sidan är en rik klassdiskussion där läraren lyssnar noga och anpassar dagens riktning baserat på vad eleverna säger mycket formativ — inget quiz krävs.

Formativ bedömning är bara lärarens ansvar. Denna missuppfattning reducerar formativ bedömning till en övervakningsuppgift som utförs på elever snarare än en samarbetsprocess som involverar dem. När elever lär sig att bedöma sin egen förståelse, sätta lärandemål och ge användbar återkoppling till kamrater, blir de aktiva deltagare i sin egen lärandeutveckling. Kamratbedömning genererar i synnerhet återkoppling i en volym och frekvens som ingen enskild lärare kan matcha, och handlingen att utvärdera en annans arbete fördjupar bedömarens egen förståelse.

Formativa bedömningsresultat bör registreras i betygsboken. Att betygsätta formativt arbete blandar ihop dess diagnostiska syfte med det utvärderande syftet hos summativ bedömning. När elever vet att varje svar kommer att poängsättas skyddar de sitt betygsgenomsnitt snarare än att avslöja sitt tänkande. Det mest användbara formativa beviset kommer ofta från ofullständig förståelse, felaktiga vägar och halvformade idéer — precis det som betyg straffar. Att hålla formativa och summativa register separata skyddar den psykologiska trygghet som ärliga formativa bevis kräver.

Koppling till aktivt lärande

Formativ bedömning och aktivt lärande förstärker varandra ömsesidigt: aktivt lärande genererar observerbara bevis på tänkande, och formativ bedömning ger lärare och elever en mekanism för att använda dessa bevis. Utan formativ återkoppling kan aktivt lärande vara engagerande men riktningslöst; utan strukturer för aktivt lärande saknar formativ bedömning de rika bevis den behöver för att vara användbar.

Think-pair-share är ett av de mest kraftfulla formativa bedömningsverktygen i allmänt bruk. När elever parar ihop sig för att diskutera en fråga innan de delar med klassen cirkulerar och lyssnar läraren — och samlar in bevis i realtid om vad eleverna förstår, vad de förvirrar och vad de finner genuint svårt. Delningsfasen avslöjar vilka idéer som är utbredda och vilka som är idiosynkratiska. Läraren kan anpassa undervisningen på plats baserat på vad paren lyfte fram.

Gallery walk omvandlar formativa bevis till ett fysiskt artefakt som klassen kan undersöka kollektivt. När grupper sätter upp sitt arbete på väggarna och roterar runt kan både läraren och eleverna se bredden av svar i klassen. Läraren får snabb bedömningsdata för hela gruppen; eleverna kalibrerar sin egen förståelse mot sina kamraters. De anteckningar eleverna lägger till under promenaden är själva formativa bevis.

Chalk talk — det tysta, kollaborativa skrivprotokollet — genererar ett synligt register över elevtänkande utan det sociala trycket från verbala diskussioner. Elever skriver frågor och svar direkt på gemensamt papper eller en whiteboard. Läraren kan fotografera samtalet och granska det som formativ data, medan elever ser var deras kamraters tänkande konvergerar och divergerar från deras eget.

Begreppet bedömning för lärande ger det bredare filosofiska ramverk som förenar dessa praktiker. Där formativ bedömning namnger den tekniska praktiken, namnger bedömning för lärande inriktningen: bedömning som används inte för att sortera eller certifiera, utan för att stödja eleven i att göra framsteg.

Källor

  1. Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. Phi Delta Kappan, 80(2), 139–148.
  2. Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81–112.
  3. Wiliam, D. (2011). Embedded Formative Assessment. Solution Tree Press.
  4. Sadler, D. R. (1989). Formative assessment and the design of instructional systems. Instructional Science, 18(2), 119–144.