Vad är skillnaden mellan holistiska och analytiska bedömningsmatriser?

En holistisk matris tilldelar ett enda samlat betyg baserat på ett helhetsintryck av arbetet, medan en analytisk matris bedömer varje kriterium separat och kombinerar dem. Analytiska matriser ger eleverna mer specifik återkoppling; holistiska matriser är snabbare att tillämpa och fungerar väl för snabba, impressionistiska bedömningar.

Bör eleverna hjälpa till att skapa bedömningsmatriser?

Ja, när det är möjligt. Forskning av Heidi Goodrich Andrade visar att elever som medkonstruerar matriser utvecklar djupare förståelse för kvalitetsstandarder och tar större ägandeskap över sitt eget lärande. Även att låta elever kommentera eller diskutera en lärarskapad matris innan en uppgift påbörjas ger mätbara fördelar.

Hur många kriterier bör en bedömningsmatris ha?

De flesta effektiva matriser innehåller mellan tre och sex kriterier. Färre än tre riskerar att missa viktiga dimensioner av arbetet; fler än sex skapar kognitiv överbelastning för både lärare som betygsätter och elever som självbedömer. Prioritera kriterier som återspeglar uppgiftens centrala lärandemål.

Kan bedömningsmatriser användas för formativ bedömning?

Absolut. En matris som delas ut innan en uppgift är ett formativt verktyg , den sätter förväntningar, vägleder självbedömning och styr revision. Elever kan använda matrisen för att utvärdera utkast eller kamraters arbete mitt i ett projekt och göra korrigeringar innan slutbetyget sätts. Det är ett av de kraftfullaste sätten att använda bedömningsmatriser.

Vad är en enpunktmatris?

En enpunktmatris beskriver endast den godkända nivån för varje kriterium och lämnar tomma kolumner på vardera sidan för lärarens kommentarer om var eleven överträffade eller inte nådde upp till den standarden. Den minskar risken att elever förankrar sig vid minimikraven och producerar mer individualiserad skriftlig återkoppling.

Bedömningsmatriser i undervisningen - Pedagogisk Wiki

Definition

En bedömningsmatris är en bedömningsguide som formulerar kriterierna för att utvärdera ett arbete och beskriver prestationen på flera kvalitetsnivåer för varje kriterium. I stället för att sätta ett betyg på magkänsla gör en matris lärarens mentala modell av "bra arbete" explicit, kommunicerbar och konsekvent över elever och bedömare.

Den kanoniska formen av en analytisk matris är ett rutnät. Rader representerar kriterier (till exempel argumentationens tydlighet, användning av evidens, struktur). Kolumner representerar prestationsnivåer, vanligtvis märkta med beskrivningar som "Nybörjare", "Under utveckling", "Godkänd" och "Exemplarisk", eller numeriska poängvärden. Varje cell innehåller en specifik beskrivning av hur arbetet ser ut i skärningspunkten mellan kriterium och nivå. Holistiska matriser komprimerar detta rutnät till en uppsättning styckesbeskrivningar, där varje stycke representerar hela produkten på en given kvalitetsnivå.

Matriser tjänar två distinkta syften som är lätta att blanda ihop. De är bedömningsinstrument som hjälper lärare att betygsätta konsekvent, och de är pedagogiska verktyg som kommunicerar förväntningar och vägleder elevers revision. Den andra funktionen är minst lika viktig som den första, och det är den som oftast underutnyttjas.

Historisk kontext

Ordet "rubric" kommer från latinets rubrica, som betyder röd ockra eller röd jord, och syftar på den röda bläcket som medeltida skrivare använde för att markera rubriker och instruktioner i manuskript. Den moderna pedagogiska innebörden framträdde gradvis under nittonhundratalet när forskare sökte systematiska sätt att utvärdera komplexa elevprestationer som inte lät sig bedömas med enkla rätt-eller-fel-poängsättningar.

Tidiga formaliserade matriser dök upp i storskaliga skrivbedömningsprogram under 1960- och 1970-talen, drivna av behovet att träna flera bedömare att poängsätta elevuppsatser konsekvent. Educational Testing Service och liknande organisationer utvecklade protokoll för interbedömarreliabilitet som lade grunden för matrisdesign. Paul Diederich's arbete från 1974, Measuring Growth in English, beskrev viktad egenskapsbedömning för skrivande , ett tidigt analytiskt ramverk som påverkade senare matrisutveckling.

Termen trädde in i vanlig klassrumspraktik framför allt genom Heidi Goodrich Andrades arbete, vars artikel från 1997 "Understanding Rubrics" i Educational Leadership gav praktiserande lärare en tydlig, praktisk introduktion till analytisk matrisdesign. Andrade hävdade att matriser inte bara var genvägar för betygssättning utan verktyg för att göra kvalitetskriterier transparenta för elever innan de börjar arbeta. Hennes forskning under slutet av 1990-talet och 2000-talet etablerade elevernas självbedömning med hjälp av matriser som en distinkt, evidensbaserad praktik.

W. James Popham erbjöd en viktig korrigering i sin artikel från 1997 i Educational Leadership, "What's Wrong , and What's Right, with Rubrics", och varnade för att dåligt utformade matriser beskriver uppgiften snarare än den underliggande färdigheten, vilket leder till matrisspecifik coaching som inte överförs. Hans kritik drev fältet mot matriser som mäter hållbara lärandekonstruktioner snarare än uppgiftsspecifika beteenden.

Susan Brookhart konsoliderade årtionden av praktik och forskning i sin bok från 2013 How to Create and Use Rubrics for Formative Assessment and Grading, som förblir den mest citerade praktikervägledningen. Brookhart betonade att matrisens beskrivare måste skrivas i termer av arbetets kvaliteter, inte elevens beteende eller uppgiftens krav , en distinktion som har väsentliga konsekvenser för hur användbar en matris blir.

Nyckelprinciper

Kriterier återspeglar lärandemål, inte uppgiftssteg

Varje rad i en matris bör motsvara ett lärandemål, inte ett inslag i uppdraget. En matris för ett historieuppsats som listar "Inkluderade fem källor", "Använde MLA-format" och "Lämnade in i tid" mäter efterlevnad, inte lärande. En matris som mäter "Korsreferering av evidens mellan källor", "Historisk argumentation" och "Kontextuell analys" mäter de intellektuella färdigheter som uppdraget var avsett att bygga. När matrisens kriterier stämmer överens med lärandemålen blir bedömningsinstrumentet och det pedagogiska målet ett och samma objekt.

Prestationsbeskrivare är kvalitativa, inte kvantitativa

Beskrivningarna i varje cell bör beskriva observerbara kvaliteter hos arbetet på den nivån, inte kvantiteter. "Använder tre eller fler exempel" talar om för elever hur många exempel de ska inkludera; "stöder påståenden med specifika, välvalda exempel som stärker argumentet" talar om vad bra användning av evidens ser ut som. Kvantitativa beskrivare är lättare att skriva och lättare att poängsätta, men de inbjuder till spel med systemet. Kvalitativa beskrivare utvecklar omdöme.

Nivåer är jämnt fördelade längs ett kontinuum

Varje prestationsnivå bör representera ett meningsfullt, ungefär lika stort steg upp från den föregående. Ett vanligt misslyckande är matriser där de tre lägsta nivåerna beskriver mindre variationer av dålig prestation och den översta nivån representerar ett onåbart ideal. Elever som använder sådana matriser för självbedömning förlorar signalen om var de faktiskt befinner sig och vad de behöver göra härnäst. Att granska matrisnivåer genom att fråga "Vad skulle en elev behöva göra annorlunda för att gå från den här cellen till nästa?" är en användbar designkontroll.

Matriser är kraftfullast när de delas innan uppgiften börjar

Att dela en matris med elever i början av ett uppdrag inverterar den traditionella bedömningssekvensen. Elever ser hur kvalitet ser ut innan de producerar arbete, inte efteråt. Detta gör att de kan självövervakas under processen, söka återkoppling anpassad till specifika kriterier och revidera med riktning. Andrades forskning visar konsekvent att denna delning innan uppgiften, kombinerat med strukturerad självbedömning, producerar arbete av högre kvalitet än betygssättning med en matris som eleverna aldrig sett.

Medkonstruktion fördjupar förståelsen

När elever deltar i att bygga eller förfina en matris måste de formulera vad kvalitet betyder inom domänen. Det är kognitivt krävande arbete som tvingar fram engagemang med standarder. Även partiell medkonstruktion , som att be elever utarbeta beskrivare för den godkända nivån innan de ser lärarens version , producerar bättre internalisering av förväntningar än att bara ta emot en färdig matris.

Klassrumstillämpning

Lågstadiet: Skrivande i alla ämnen

En lärare i årskurs 2 använder en analytisk matris med tre kriterier för naturvetenskapliga observationsdagböcker: "Vetenskaplig detaljrikedom" (vad eleven noterade), "Noggrannhet" (om observationerna stämmer överens med evidens) och "Fullständighet" (om alla avsnitt försöktes). Innan eleverna gör sin första dagboksanteckning visar läraren matrisen på projektorn och går igenom varje nivå med hjälp av anonymiserade prov från tidigare år. Eleverna använder självhäftande lappar för att markera var de tror att deras anteckning befinner sig på varje kriterium. Läraren läser och markerar sedan samma matris, och paret diskuterar eventuella luckor. Denna självbedömningskonversation tar fyra minuter per elev men ersätter längre skriftlig återkoppling som elever sällan läser.

Mellanstadiet: Projektbaserade inlärningspresentationer

En sjundeklasshumnaiorklass presenterar problemlösningsprojekt för lokalsamhället för en autentisk publik. Matrisen täcker "Problemanalys", "Kvalitet på föreslagen lösning", "Användning av evidens", "Muntlig framföring" och "Svar på frågor". Eleverna får matrisen när projektet introduceras, tre veckor innan presentationen. Halvvägs igenom använder varje elev matrisen för att poängsätta en video av sin träningskörning och skriver ett mål för varje kriterium. En kamrat poängsätter sedan samma video och paret jämför bedömningar. Läraren betygsätter bara den slutliga presentationen, men matrisen har fungerat som ett coachningsverktyg under tre veckor innan det ögonblicket. Det är en kärnapplikation inom projektbaserat lärande, där komplexa, flerveckorsuppgifter kräver att elever självreglerar sig över en lång arbetsperiod.

Gymnasiet: Galleri- och utställningsbedömningar

Vid ett avslutande evenemang i museiutställningsstil, där elevers arbeten visas för kamrater, föräldrar och samhällsmedlemmar, tjänar matrisen både lärare och publik. En lärare i AP Environmental Science skapar en tvåsidig analytisk matris för elevers forskningsaffischer och delar en förenklad ensides version med externa domare. Den förenklade versionen täcker samma kriterier men använder ett enkelt språk som är tillgängligt för icke-specialister. Eleverna självbedömer innan utställningen öppnar, lämnar sin självbedömning vänd nedåt bakom affischen, och domarna bedömer oberoende. Efter evenemanget jämför eleverna sin självbedömning med domarens och lärarens poäng i en skriftlig reflektion. Denna struktur, inbyggd i museiutställnings-metodiken, förvandlar offentlig visning till en trevägs kalibreringsövning.

Forskningsevidens

Panadero och Jonssons meta-analys från 2013 i Studies in Educational Evaluation, som undersökte 21 studier om matrisanvändning, fann konsekventa positiva effekter på elevers self-efficacy, minskad ångest inför bedömning och förbättrade läranderesultat. Effekten var starkare när matriser delades ut innan uppgiften och när elever använde dem för självbedömning snarare än att ta emot dem som återkoppling efter betygssättning. Författarna varnade för att effektstorlekarna varierade avsevärt beroende på matrisens kvalitet och hur lärare implementerade dem.

Andrade och Du (2005), som studerade universitetsskrivande, fann att elever som använde matriser för självbedömning innan de lämnade in ett slututkast producerade arbete som anonyma bedömare bedömde som signifikant högre än elever som bara fick läraråterkoppling. Den viktigaste mekanismen verkade vara revision: matrisanvändare reviderade mer omfattande och mer strategiskt. Eleverna rapporterade att det hjälpte dem att förstå vad lärarna faktiskt värderade att se kriterierna i förväg , något de beskrev som annorlunda från vad de tidigare antagit.

Jonsson och Svingby (2007), som granskade 75 studier om matristillförlitlighet, fann att analytiska matriser producerade mer konsekvent poängsättning än holistiska matriser, särskilt för uppgifter med flera distinkta dimensioner. De fann också att träning av bedömare med hjälp av matriser avsevärt förbättrade interbedömarreliabiliteten, vilket stöder matriser som nödvändig infrastruktur för varje bedömning som involverar mer än en utvärderare. De noterade dock att dåligt konstruerade matriser kunde sänka reliabiliteten genom att införa irrelevanta distinktioner eller dåligt ordnade nivåer.

Forskning om enpunktmatriser är mer aktuell. Fluckiger (2010) beskrev enpunktformatet och dess pedagogiska motivering och hävdade att att beskriva endast den godkända nivån fokuserar elevernas uppmärksamhet på kvalitet snarare än på att ackumulera minimala poängtrösklar. Praktikernas rapporterade resultat tyder på att elever producerar mer ambitiöst arbete när de inte är förankrade till en detaljerad beskrivare för låg prestation, även om kontrollerade studier av detta format fortfarande är begränsade.

Vanliga missuppfattningar

Koppling till aktivt lärande

Matriser är kraftfullast inuti aktiva lärandestrukturer, just för att dessa strukturer genererar komplext, flerdimensionellt arbete som inte låter sig poängsättas enkelt.

I projektbaserat lärande tillbringar elever veckor med att producera artefakter, bedriva forskning och förbereda presentationer. Utan en matris som delas vid lanseringen har eleverna ingen grund för att styra sig själva under den utdragna perioden. Med en matris blir varje milstolpskontroll meningsfull: elever kan lokalisera sig på specifika kriterier, identifiera gapet mellan nuvarande och godkänd prestation och sätta ett konkret revisionsmål. Lärare som använder PBL utan matriser befinner sig vanligtvis överväldigade av variabiliteten hos slutprodukter. Matriser löser inte den variabiliteten; de gör den tolkningsbar och pedagogisk.

Museiutställnings-metodiken gör matrisdesign till en social handling. När samhällsmedlemmar, kamrater och lärare alla utvärderar samma arbete behöver de ett gemensamt ordförråd. Matrisen tillhandahåller det ordförrådet. Elever som känner till matrisen i förväg upplever den offentliga utvärderingen inte som ett omdöme från utomstående utan som ett samtal fört på ett språk de redan talar.

Matriser kopplar också direkt till formativ bedömning. En matris som delas ut innan en uppgift fungerar formativt: den ger eleverna information de kan agera på medan lärandet fortfarande pågår. Självbedömningar mitt i projekt med hjälp av en matris är bland de mest praktiska formativa bedömnings-rörelserna tillgängliga för en klasslärare, eftersom de bara tar minuter och producerar elevgenererade data om lärandegap.

I kriteriebaserade betygssättnings-system är matriser den nödvändiga infrastrukturen. Kriteriebaserad betygssättning kräver explicita, kriterierefererade prestationsnivåer anpassade till lärandestandarter , vilket är en beskrivning av vad en väldesignad matris redan är. Många skolor som övergår till kriteriebaserad betygssättning upptäcker att de har använt svaga holistiska matriser som inte kartläggs tydligt mot standarder, och de måste omdesigna sina bedömningsverktyg innan betygssättningsfilosofin kan implementeras koherent.

Matriser stöder också autentisk bedömning. Autentiska uppgifter kräver per definition att elever tillämpar kunskap i verkliga sammanhang där kvalitet är flerdimensionell. Matriser tillhandahåller ramverket för att utvärdera den flerdimensionella kvaliteten på ett sätt som är transparent för elever och försvarbart för föräldrar, administratörer och eleverna själva.

Källor

Andrade, H. G. (1997). Understanding rubrics. Educational Leadership, 54(4), 14–17.
Brookhart, S. M. (2013). How to Create and Use Rubrics for Formative Assessment and Grading. ASCD.
Panadero, E., & Jonsson, A. (2013). The use of scoring rubrics for formative assessment purposes revisited: A review. Educational Research Review, 9, 129–144.
Jonsson, A., & Svingby, G. (2007). The use of scoring rubrics: Reliability, validity and educational consequences. Educational Research Review, 2(2), 130–144.

Bedömningsmatriser i undervisningen

Definition

Historisk kontext

Nyckelprinciper

Kriterier återspeglar lärandemål, inte uppgiftssteg

Prestationsbeskrivare är kvalitativa, inte kvantitativa

Nivåer är jämnt fördelade längs ett kontinuum

Matriser är kraftfullast när de delas innan uppgiften börjar

Medkonstruktion fördjupar förståelsen

Klassrumstillämpning

Lågstadiet: Skrivande i alla ämnen

Mellanstadiet: Projektbaserade inlärningspresentationer

Gymnasiet: Galleri- och utställningsbedömningar

Forskningsevidens

Vanliga missuppfattningar

Koppling till aktivt lärande

Källor

Vanliga Frågor

Relaterade Begrepp

Relaterade Artiklar

Så navigerar du i övergången från kunskapskrav till betygskriterier

Så här använder du Town Hall i ditt klassrum

Varför de nya betygskriterierna i Lgr22 faktiskt gynnar dina elever

Relaterade Metoder

Projektbaserat lärande

Museumutställning