Qual é a diferença entre avaliação entre pares e classificação por pares?

A avaliação entre pares é uma actividade de aprendizagem estruturada em que os alunos avaliam o trabalho uns dos outros com base em critérios explícitos, com o objectivo principal de desenvolver o pensamento crítico e a literacia de feedback. A classificação por pares atribui pontuações que contribuem para as notas oficiais. A investigação demonstra consistentemente que os benefícios de aprendizagem advêm do acto de avaliar e dar feedback, não da nota em si , muitos modelos eficazes de avaliação entre pares nunca atribuem qualquer classificação.

A partir de que idade podem os alunos começar a fazer avaliação entre pares?

Alunos a partir dos 6–7 anos podem participar em formas simples de avaliação entre pares quando a tarefa e os critérios são concretos (por exemplo, 'O desenho do teu parceiro tem as três partes que listámos?'). O essencial é adequar a complexidade dos critérios ao estágio de desenvolvimento dos alunos. No final do 1.º ciclo, os alunos já conseguem trabalhar com rubricas de múltiplos critérios e feedback escrito. O julgamento avaliativo abstracto desenvolve-se mais na adolescência, tornando as turmas do ensino secundário particularmente adequadas para a revisão estruturada entre pares.

Como evito que os alunos atribuam classificações altas aos amigos?

O efeito de amizade é real, mas pode ser gerido. A submissão anónima (quando possível) reduz-o significativamente. Mais importante ainda, critérios estruturados e guias de pontuação dão aos alunos algo concreto a que responder, para além do sentimento pessoal. Treinar os alunos sobre como é um bom feedback , com exemplos modelados antes da primeira revisão , também altera a norma social de 'ser simpático' para 'ser útil'. A investigação de Topping (1998) concluiu que as classificações dos pares convergem para as dos professores quando os critérios de avaliação são claros e os alunos têm prática no processo.

O feedback entre pares ajuda realmente os alunos a melhorar o seu trabalho?

Sim, quando o processo é estruturado. Uma meta-análise de Falchikov e Goldfinch (2000) concluiu que as classificações dos pares se correlacionam fortemente com as dos professores quando os critérios são explícitos. De forma mais abrangente, a investigação em avaliação formativa mostra que gerar feedback para os outros exige que o avaliador aplique os critérios de forma activa , um acto que aprofunda a sua própria compreensão da qualidade. O avaliador aprende frequentemente tanto quanto o destinatário.

Como se relaciona a avaliação entre pares com a aprendizagem autorregulada?

A avaliação entre pares desenvolve as mesmas competências de monitorização interna que sustentam a aprendizagem autorregulada: reconhecer a diferença entre o desempenho actual e o desempenho-alvo, identificar causas específicas e considerar estratégias de revisão. Quando os alunos avaliam regularmente o trabalho dos outros com critérios explícitos, interiorizam esses padrões e aplicam-nos ao seu próprio trabalho com maior facilidade. Nicol e Macfarlane-Dick (2006) identificam o feedback entre pares como uma das sete condições fundamentais para formar aprendentes autorregulados.

Avaliação entre Pares - Wiki Pedagógica

Definição

A avaliação entre pares é uma prática educativa estruturada em que os alunos avaliam o trabalho, o desempenho ou a compreensão dos colegas com base em critérios predefinidos. O aluno avaliador produz comentários escritos, classificações ou ambos, e o aluno avaliado utiliza esse feedback para rever ou reflectir. Ao contrário do feedback casual entre pares , "parece-me bem" ,, a avaliação entre pares estruturada exige critérios explícitos, um processo definido e, normalmente, alguma forma de responsabilização.

O conceito insere-se no domínio mais amplo da avaliação formativa: a avaliação cuja função principal é melhorar a aprendizagem, e não medi-la para efeitos de classificação. Keith Topping, cuja meta-análise de 1998 na Universidade de Dundee permanece a revisão fundacional do campo, definiu a avaliação entre pares como "uma disposição para que os aprendentes considerem e especifiquem o nível, o valor ou a qualidade de um produto ou desempenho de outros aprendentes com estatuto equivalente." A definição realça duas características essenciais: o julgamento avaliativo envolvido e a igualdade de estatuto social entre avaliador e avaliado.

A avaliação entre pares distingue-se da autoavaliação, em que os alunos avaliam o seu próprio trabalho, embora as duas práticas sejam frequentemente combinadas. Distingue-se igualmente da aprendizagem cooperativa, que estrutura a interdependência de grupo para a criação de um produto conjunto. A avaliação entre pares pode ocorrer em estruturas cooperativas, mas funciona como um acto reflexivo autónomo , não apenas como uma característica do trabalho de grupo.

Contexto Histórico

As raízes intelectuais da avaliação entre pares remontam às décadas de 1960 e 1970, quando os psicólogos cognitivos começaram a questionar o modelo passivo de aprendizagem que dominava as escolas. O modelo de aprendizagem por domínio de Bloom (1968) estabeleceu que o feedback formativo dentro dos ciclos de aprendizagem era essencial para o progresso dos alunos , premissa que tornava o feedback entre pares uma ferramenta lógica.

A prática ganhou a sua primeira base de investigação sistemática no ensino superior durante as décadas de 1980 e 1990. Nancy Falchikov, na Napier University, foi uma das primeiras investigadoras a estudar a classificação por pares de forma sistemática, relatando num artigo de 1986 que os alunos conseguiam produzir classificações fiávelmente próximas das dos professores quando treinados com critérios explícitos. A revisão de Keith Topping de 1998 na Review of Educational Research consolidou as evidências de 109 estudos, estabelecendo que a avaliação entre pares produzia ganhos consistentes no rendimento académico, na consciência metacognitiva e na qualidade do feedback escrito que os alunos conseguiam gerar.

A revisão marcante de Paul Black e Dylan Wiliam de 1998, "Inside the Black Box" (publicada no Phi Delta Kappan), reformulou toda a discussão. A sua análise de 250 estudos concluiu que as práticas de avaliação formativa , incluindo a avaliação entre pares e a autoavaliação , produziam alguns dos maiores tamanhos de efeito alguma vez documentados na investigação educacional, particularmente para alunos com menor rendimento. O seu trabalho transformou a avaliação entre pares de uma técnica de nicho do ensino superior em prática corrente em escolas de todo o mundo.

David Nicol e Debra Macfarlane-Dick desenvolveram esta base com um modelo teórico de 2006, publicado em Studies in Higher Education, argumentando que o feedback entre pares é mais valioso não porque informa o destinatário, mas porque desenvolve a capacidade do avaliador para monitorizar e regular a sua própria aprendizagem.

Princípios-Chave

Os Critérios Devem Ser Explícitos Antes de a Avaliação Começar

A avaliação entre pares só produz feedback fiável e útil quando tanto o avaliador como o avaliado compreendem como é a qualidade antes de a avaliação começar. Critérios apresentados apenas após a submissão do trabalho funcionam como julgamento a posteriori. Critérios co-construídos com os alunos antes de uma tarefa funcionam como andaime de aprendizagem ao longo de toda a produção. A investigação de Andrade e Du (2005) concluiu que os alunos que ajudaram a desenvolver rubricas produziram trabalhos significativamente melhores do que os que receberam a mesma rubrica de forma passiva. O acto de articular a qualidade é, em si mesmo, um acto de aprendizagem.

O Avaliador Aprende Tanto quanto o Destinatário

Um equívoco persistente trata a avaliação entre pares como um mecanismo de entrega de feedback. As evidências mais sólidas apontam noutra direcção: o trabalho cognitivo de aplicar critérios ao trabalho de outrem obriga o avaliador a envolver-se activamente com padrões que de outro modo poderia ignorar. A análise de Topping de 1998 documentou este benefício para o avaliador em várias áreas disciplinares. Os alunos a quem se pede que avaliem um argumento têm de construir primeiro um modelo mental do que é um argumento sólido , essa construção é a aprendizagem.

O Treino e os Exemplos Modelados São Inegociáveis

Sem preparação, os alunos tendem para o elogio vago ("bom trabalho") ou para a crítica directa sem explicação. Nenhum destes ajuda o destinatário. Os programas eficazes de avaliação entre pares investem tempo de instrução explícito na literacia de feedback: o que torna o feedback específico, o que o torna accionável, como distinguir descrição de avaliação. A prática comum inclui a análise de exemplos fortes e fracos de feedback entre pares antes de os alunos escreverem o seu.

O Anonimato É uma Ferramenta, Não um Requisito

A avaliação entre pares anónima reduz a pressão social e o efeito de amizade em alguns contextos, particularmente quando as classificações estão em jogo. Contudo, elimina também a responsabilização e pode reduzir o cuidado que os alunos dedicam aos comentários escritos. Muitos praticantes experientes utilizam feedback entre pares identificado para trabalhos formativos , onde a relação entre quem dá e quem recebe o feedback pode tornar-se uma conversa de aprendizagem , e revisão anónima quando as pontuações contribuem para as notas.

A Frequência Importa Mais do que a Ocasião

A avaliação entre pares praticada uma vez por semestre tem um efeito duradouro mínimo na literacia de feedback ou na autorregulação. Investigadores como Nicol e Macfarlane-Dick (2006) argumentam que o objectivo é que os alunos interiorizem padrões avaliativos , um processo que exige exposição repetida em diferentes tarefas e áreas disciplinares. Ciclos breves e frequentes de revisão entre pares, mesmo trocas estruturadas de 10 minutos, constroem o hábito de forma mais eficaz do que eventos elaborados realizados uma única vez.

Aplicação em Sala de Aula

Básico

Listas de Verificação de Critérios para Escritores Iniciantes

No 2.º e 3.º anos de escolaridade, a avaliação entre pares funciona melhor com critérios concretos e binários que os alunos possam verificar. Após uma tarefa de escrita breve, os alunos trocam os textos e percorrem uma lista de verificação: "Tem letra maiúscula no início? Tem ponto final? Consegues encontrar uma palavra descritiva?" O avaliador assinala cada critério. O feedback é suficientemente estruturado para ser accionável e suficientemente específico para ser honesto, sem exigir a linguagem avaliativa matizada que os alunos mais novos ainda não desenvolveram.

O papel do professor nesta fase é modelar o processo repetidamente com exemplos de turma, nomeando o que observa e por que razão cumpre ou não o critério. Esta modelação não é um andaime opcional , é a instrução efectiva em literacia de feedback.

Secundário

Revisão Estruturada entre Pares de Escrita Argumentativa

Uma turma do 10.º ano de história a escrever ensaios analíticos beneficia de uma estrutura de revisão entre pares em duas passagens. Na primeira, cada aluno lê o ensaio do parceiro e sublinha a tese e cada elemento de evidência. Na segunda, preenche um guião de feedback: "O teu argumento é mais forte quando... Um sítio onde a evidência não apoia completamente a tua tese é... Uma revisão específica que sugiro é..." O guião previne o feedback vago sem sobrescrever a resposta.

Devolver o trabalho com feedback escrito entre pares antes da entrega da versão final dá aos alunos um objectivo concreto de revisão. Os estudos que comparam condições de feedback-seguido-de-revisão com condições sem feedback mostram consistentemente ganhos de qualidade nas versões revistas.

Turma Completa: Visita à Galeria com Anotação entre Pares

Uma adaptação da visita à galeria para avaliação entre pares coloca o trabalho dos alunos ao longo da sala. Cada aluno circula com notas adesivas de duas cores: uma para pontos fortes específicos ("utilização forte de dados no painel 3"), outra para questões ou sugestões específicas ("qual é a fonte da estatística no parágrafo 2?"). Os alunos regressam ao seu trabalho com um conjunto de anotações dos pares que representa múltiplas perspectivas, em vez da visão de um único revisor.

Este formato funciona particularmente bem para trabalhos visuais e baseados em projectos, onde a exposição em si comunica algo sobre organização e decisões de design que só o texto escrito pode não transmitir.

Evidência Científica

A meta-análise de Topping de 1998 na Review of Educational Research sintetizou 109 estudos de avaliação entre pares em diferentes níveis de ensino e disciplinas. A revisão concluiu que a avaliação entre pares produzia efeitos positivos consistentes no rendimento académico, com tamanhos de efeito comparáveis a outras intervenções formativas bem estabelecidas. Crucialmente, Topping verificou que os tamanhos de efeito eram maiores quando os critérios de avaliação eram explícitos, quando os alunos eram treinados no processo e quando a avaliação entre pares estava integrada no currículo, em vez de ser acrescentada como actividade pontual.

Falchikov e Goldfinch (2000), também na Review of Educational Research, realizaram uma meta-análise de 48 estudos a comparar classificações de pares com classificações de professores. Concluíram que a concordância entre as classificações de pares e professores era significativamente mais forte quando a avaliação envolvia múltiplos critérios (em vez de uma classificação holística única), quando os critérios eram co-construídos com os alunos e quando o trabalho avaliado era bem estruturado. A descoberta responde a uma preocupação comum: as classificações dos pares podem ser fiáveis quando as condições são adequadas.

Van Zundert, Sluijsmans e Van Merrienboer (2010), em Learning and Instruction, revisaram investigação centrada no processo de avaliação entre pares e encontraram evidências sólidas de que a qualidade do feedback entre pares melhora quando os avaliadores recebem treino, quando as tarefas exigem avaliação específica em vez de global e quando o feedback está associado a oportunidades de revisão. Os estudos que forneceram feedback sem oportunidade de revisão mostraram ganhos de aprendizagem menores ou negligenciáveis.

Vale a pena reconhecer uma limitação: a maior parte da investigação sobre avaliação entre pares foi conduzida em contextos de ensino superior. A base de evidências para a avaliação entre pares estruturada no 1.º ciclo é mais escassa e menos consistente. A adequação ao nível etário , tanto em termos de complexidade dos critérios como de dinâmicas sociais , exige julgamento cuidadoso por parte do professor, e a transferência directa de conclusões baseadas no ensino universitário para o 1.º ciclo não é justificada.

Equívocos Comuns

Ligação à Aprendizagem Activa

A avaliação entre pares é, por natureza, um acto de aprendizagem activa. Aplicar critérios, gerar justificações escritas e fazer julgamentos avaliativos exigem elaboração, análise e síntese , os níveis superiores da taxonomia de Bloom , em vez da recepção passiva de comentários do professor.

O ensino entre pares e a avaliação entre pares partilham o mesmo mecanismo subjacente: ambos exigem que os alunos se envolvam com conteúdos ou critérios a uma profundidade que a recepção por si só não consegue produzir. No ensino entre pares, explicar um conceito obriga quem explica a identificar e resolver lacunas na sua própria compreensão. Na avaliação entre pares, avaliar um trabalho obriga o avaliador a construir um modelo interno de qualidade. Os professores que combinam o ensino entre pares com a revisão estruturada entre pares criam um ciclo de reforço em que os alunos tanto ensinam conteúdos como avaliam a qualidade da aplicação uns dos outros.

As visitas à galeria proporcionam um enquadramento natural para a avaliação entre pares de trabalhos em formato visual ou de exposição. Protocolos de anotação estruturados , que exigem comentários específicos com referência a critérios, em vez de reacções gerais , transformam a visita à galeria de uma exposição num ciclo de feedback.

O brainstorming em carrossel pode ser adaptado para a avaliação entre pares de rascunhos escritos ou argumentos estruturados. Os grupos rodam pelo trabalho uns dos outros, acrescentando comentários específicos em cada estação. O formato de múltiplos avaliadores garante que qualquer trabalho receba feedback diversificado, reduzindo o peso de qualquer julgamento individual de um par.

A ligação ao feedback em educação é directa: a avaliação entre pares é um dos contextos de maior impacto para desenvolver a literacia de feedback, porque os alunos têm de gerar feedback activamente, em vez de o receberem passivamente. A investigação sobre feedback mostra consistentemente que o acto de dar feedback detalhado melhora o trabalho subsequente de quem o dá , uma conclusão que reforça o argumento para integrar a avaliação entre pares em ciclos de instrução regulares, em vez de a tratar como uma actividade de enriquecimento ocasional.

Fontes

Topping, K.J. (1998). Peer assessment between students in colleges and universities. Review of Educational Research, 68(3), 249–276.
Black, P., & Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education: Principles, Policy & Practice, 5(1), 7–74.
Falchikov, N., & Goldfinch, J. (2000). Student peer assessment in higher education: A meta-analysis comparing peer and teacher marks. Review of Educational Research, 70(3), 287–322.
Nicol, D.J., & Macfarlane-Dick, D. (2006). Formative assessment and self-regulated learning: A model and seven principles of good feedback practice. Studies in Higher Education, 31(2), 199–218.

Avaliação entre Pares

Definição

Contexto Histórico

Princípios-Chave

Os Critérios Devem Ser Explícitos Antes de a Avaliação Começar

O Avaliador Aprende Tanto quanto o Destinatário

O Treino e os Exemplos Modelados São Inegociáveis

O Anonimato É uma Ferramenta, Não um Requisito

A Frequência Importa Mais do que a Ocasião

Aplicação em Sala de Aula

Listas de Verificação de Critérios para Escritores Iniciantes

Revisão Estruturada entre Pares de Escrita Argumentativa

Turma Completa: Visita à Galeria com Anotação entre Pares

Evidência Científica

Equívocos Comuns

Ligação à Aprendizagem Activa

Fontes

Perguntas Frequentes

Conceitos Relacionados

Artigos Relacionados

A diferenciação pedagógica é a chave para o sucesso escolar no DL 54/2018

14 Instrumentos de avaliação formativa para transformar a sua sala de aula

Como implementar as Aprendizagens Essenciais na sala de aula em 7 passos

Metodologias Relacionadas

Ensino pelos Pares

Galeria de Exposição

Brainstorming em Carrossel