Datainsamling och Representativitet
Eleverna undersöker hur data samlas in, olika metoder för datainsamling och vikten av representativitet.
Om detta ämne
Big Data handlar om de enorma mängder information som genereras varje sekund och hur vi kan använda mönsterigenkänning för att förstå den. I årskurs 8 kopplas detta till kursplanens mål om digitala verktyg för databehandling och hur teknikval får konsekvenser för samhället. Eleverna får lära sig att data i sig är neutral, men att analysen av den kan användas för allt från att förutsäga epidemier till att rikta politisk reklam.
Genom att arbeta med mönsterigenkänning tränar eleverna sin förmåga att se samband i komplex information. Detta är en nyckelkompetens i en tid där algoritmer fattar allt fler beslut åt oss. Ämnet blir särskilt engagerande när eleverna får prova på att vara 'mänskliga algoritmer' och försöka hitta dolda trender i stora pappershögar med anonymiserad data.
Nyckelfrågor
- Hur påverkar metoden för datainsamling kvaliteten och tillförlitligheten hos datan?
- Analysera riskerna med att fatta beslut baserade på icke-representativ data.
- Designa en strategi för att samla in data om en specifik fråga i skolan.
Lärandemål
- Jämföra olika metoder för datainsamling och förklara hur metodvalet påverkar datans kvalitet och tillförlitlighet.
- Analysera konsekvenserna av att fatta beslut baserade på icke-representativ data, med konkreta exempel.
- Skapa en strategi för att samla in data om en specifik fråga inom skolmiljön, inklusive val av metod och urval.
- Identifiera och klassificera olika typer av bias som kan uppstå vid datainsamling.
Innan du börjar
Varför: Eleverna behöver en grundläggande förståelse för vad data är och hur det kan användas för att kunna gå vidare till mer komplexa begrepp som representativitet och bias.
Varför: Kunskap om hur man söker och hittar information digitalt är en förutsättning för att kunna undersöka olika metoder för datainsamling och analys.
Nyckelbegrepp
| Datainsamling | Processen att samla in information eller observationer, antingen manuellt eller med hjälp av verktyg, för att analysera och dra slutsatser. |
| Representativitet | Egenskapen hos ett urval att på ett korrekt sätt återspegla egenskaperna hos den större population det kommer ifrån. |
| Urval | En mindre grupp individer eller objekt som väljs ut från en större population för att studeras, med syftet att generalisera resultaten till hela populationen. |
| Bias (urvalsfel) | Systematiska fel som uppstår när urvalet inte är representativt för populationen, vilket leder till snedvridna resultat. |
| Datakvalitet | Ett mått på hur fullständig, korrekt, konsekvent och tillförlitlig insamlad data är för sitt avsedda ändamål. |
Se upp för dessa missuppfattningar
Vanlig missuppfattningAtt mer data alltid leder till bättre beslut.
Vad man ska lära ut istället
Om datan är vinklad eller av dålig kvalitet blir besluten felaktiga (garbage in, garbage out). Genom att ge eleverna ofullständig data kan de själva se hur felaktiga slutsatser dras.
Vanlig missuppfattningAtt mönsterigenkänning är samma sak som sanning.
Vad man ska lära ut istället
Korrelation innebär inte alltid kausalitet. Bara för att två saker händer samtidigt betyder det inte att den ena orsakar den andra, vilket bäst belyses genom absurda exempel på statistiska samband.
Idéer för aktivt lärande
Se alla aktiviteterUtforskande cirkel: Data-detektiverna
Eleverna får stora mängder 'skräpdata' (t.ex. kvitton eller fiktiva loggar). De ska i grupper försöka hitta mönster: Vilken tid handlar folk mest? Finns det samband mellan väder och inköp?
EPA (Enskilt-Par-Alla): Algoritmernas filterbubblor
Eleverna reflekterar över sina egna flöden i sociala medier. De diskuterar i par hur mönsterigenkänning avgör vad de ser och vilka röster som eventuellt sorteras bort.
Simuleringsövning: Träna en analog algoritm
Eleverna ska 'träna' en klasskamrat att känna igen en specifik typ av teckning genom att bara visa exempel och ge feedback (ja/nej), för att förstå hur mönsterigenkänning fungerar utan programmering.
Kopplingar till Verkligheten
- Marknadsundersökningsföretag som Ipsos eller Kantar använder olika urvalsmetoder, som slumpmässiga urval eller stratifierade urval, för att samla in åsikter om nya produkter eller politiska kampanjer. Felaktig representativitet kan leda till att företag missbedömer marknadens respons.
- Forskare inom folkhälsa använder enkäter och registerdata för att studera sjukdomsmönster. Om urvalet inte är representativt för hela befolkningen (t.ex. bara inkluderar personer från en viss region eller åldersgrupp) kan slutsatserna om folkhälsan bli missvisande.
- Kommuner samlar in data om trafikflöden för att planera nya vägar eller kollektivtrafik. Om datainsamlingen endast sker under rusningstid eller på specifika platser kan det leda till felaktiga beslut om infrastrukturinvesteringar.
Bedömningsidéer
Ge eleverna en kort beskrivning av ett fiktivt datainsamlingsprojekt (t.ex. 'Undersöka hur många elever som äter frukt i skolan'). Be dem skriva ner två potentiella problem med representativiteten och en konkret åtgärd för att förbättra den.
Ställ frågan: 'Tänk er att ni ska samla in data om hur nöjda eleverna är med skolmaten. Vilka metoder kan ni använda för att samla in data? Vilka risker finns det att datan inte blir representativ för alla elever, och hur kan ni minimera dessa risker?' Låt eleverna diskutera i smågrupper och sedan dela med sig av sina idéer.
Visa eleverna två olika diagram som presenterar samma typ av data men med olika urval. Be eleverna identifiera vilket diagram som troligen är mest representativt och motivera sitt svar med hänvisning till urvalsmetoden.
Vanliga frågor
Vad är skillnaden mellan vanlig statistik och Big Data?
Hur används Big Data i den svenska välfärden?
Är Big Data farligt för demokratin?
Hur kan aktivt lärande hjälpa elever att förstå datamängder?
Planeringsmallar för Teknik
Mer i Data, Analys och Integritet
Datavisualisering och Tolkning
Eleverna lär sig att presentera data på ett tydligt sätt med grafer och diagram samt att kritiskt tolka visualiserad information.
2 methodologies
Big Data och Mönsterigenkänning
Eleverna undersöker hur stora datamängder kan analyseras för att förutsäga trender och beteenden.
2 methodologies
Personlig Integritet och GDPR
Eleverna diskuterar vikten av personlig integritet online och hur lagar som GDPR skyddar individens rättigheter.
2 methodologies
Kryptering och Säkerhet
Eleverna utforskar metoder för att skydda information och vikten av cybersäkerhet i ett digitalt samhälle.
2 methodologies
Digital Etik och Ansvar
Eleverna diskuterar vem som bär ansvaret när algoritmer fattar felaktiga eller skadliga beslut.
2 methodologies