Definição
A avaliação entre pares é uma prática educativa estruturada em que os alunos avaliam o trabalho, o desempenho ou a compreensão dos colegas com base em critérios predefinidos. O aluno avaliador produz comentários escritos, classificações ou ambos, e o aluno avaliado utiliza esse feedback para rever ou reflectir. Ao contrário do feedback casual entre pares — "parece-me bem" —, a avaliação entre pares estruturada exige critérios explícitos, um processo definido e, normalmente, alguma forma de responsabilização.
O conceito insere-se no domínio mais amplo da avaliação formativa: a avaliação cuja função principal é melhorar a aprendizagem, e não medi-la para efeitos de classificação. Keith Topping, cuja meta-análise de 1998 na Universidade de Dundee permanece a revisão fundacional do campo, definiu a avaliação entre pares como "uma disposição para que os aprendentes considerem e especifiquem o nível, o valor ou a qualidade de um produto ou desempenho de outros aprendentes com estatuto equivalente." A definição realça duas características essenciais: o julgamento avaliativo envolvido e a igualdade de estatuto social entre avaliador e avaliado.
A avaliação entre pares distingue-se da autoavaliação, em que os alunos avaliam o seu próprio trabalho, embora as duas práticas sejam frequentemente combinadas. Distingue-se igualmente da aprendizagem cooperativa, que estrutura a interdependência de grupo para a criação de um produto conjunto. A avaliação entre pares pode ocorrer em estruturas cooperativas, mas funciona como um acto reflexivo autónomo — não apenas como uma característica do trabalho de grupo.
Contexto Histórico
As raízes intelectuais da avaliação entre pares remontam às décadas de 1960 e 1970, quando os psicólogos cognitivos começaram a questionar o modelo passivo de aprendizagem que dominava as escolas. O modelo de aprendizagem por domínio de Bloom (1968) estabeleceu que o feedback formativo dentro dos ciclos de aprendizagem era essencial para o progresso dos alunos — premissa que tornava o feedback entre pares uma ferramenta lógica.
A prática ganhou a sua primeira base de investigação sistemática no ensino superior durante as décadas de 1980 e 1990. Nancy Falchikov, na Napier University, foi uma das primeiras investigadoras a estudar a classificação por pares de forma sistemática, relatando num artigo de 1986 que os alunos conseguiam produzir classificações fiávelmente próximas das dos professores quando treinados com critérios explícitos. A revisão de Keith Topping de 1998 na Review of Educational Research consolidou as evidências de 109 estudos, estabelecendo que a avaliação entre pares produzia ganhos consistentes no rendimento académico, na consciência metacognitiva e na qualidade do feedback escrito que os alunos conseguiam gerar.
A revisão marcante de Paul Black e Dylan Wiliam de 1998, "Inside the Black Box" (publicada no Phi Delta Kappan), reformulou toda a discussão. A sua análise de 250 estudos concluiu que as práticas de avaliação formativa — incluindo a avaliação entre pares e a autoavaliação — produziam alguns dos maiores tamanhos de efeito alguma vez documentados na investigação educacional, particularmente para alunos com menor rendimento. O seu trabalho transformou a avaliação entre pares de uma técnica de nicho do ensino superior em prática corrente em escolas de todo o mundo.
David Nicol e Debra Macfarlane-Dick desenvolveram esta base com um modelo teórico de 2006, publicado em Studies in Higher Education, argumentando que o feedback entre pares é mais valioso não porque informa o destinatário, mas porque desenvolve a capacidade do avaliador para monitorizar e regular a sua própria aprendizagem.
Princípios-Chave
Os Critérios Devem Ser Explícitos Antes de a Avaliação Começar
A avaliação entre pares só produz feedback fiável e útil quando tanto o avaliador como o avaliado compreendem como é a qualidade antes de a avaliação começar. Critérios apresentados apenas após a submissão do trabalho funcionam como julgamento a posteriori. Critérios co-construídos com os alunos antes de uma tarefa funcionam como andaime de aprendizagem ao longo de toda a produção. A investigação de Andrade e Du (2005) concluiu que os alunos que ajudaram a desenvolver rubricas produziram trabalhos significativamente melhores do que os que receberam a mesma rubrica de forma passiva. O acto de articular a qualidade é, em si mesmo, um acto de aprendizagem.
O Avaliador Aprende Tanto quanto o Destinatário
Um equívoco persistente trata a avaliação entre pares como um mecanismo de entrega de feedback. As evidências mais sólidas apontam noutra direcção: o trabalho cognitivo de aplicar critérios ao trabalho de outrem obriga o avaliador a envolver-se activamente com padrões que de outro modo poderia ignorar. A análise de Topping de 1998 documentou este benefício para o avaliador em várias áreas disciplinares. Os alunos a quem se pede que avaliem um argumento têm de construir primeiro um modelo mental do que é um argumento sólido — essa construção é a aprendizagem.
O Treino e os Exemplos Modelados São Inegociáveis
Sem preparação, os alunos tendem para o elogio vago ("bom trabalho") ou para a crítica directa sem explicação. Nenhum destes ajuda o destinatário. Os programas eficazes de avaliação entre pares investem tempo de instrução explícito na literacia de feedback: o que torna o feedback específico, o que o torna accionável, como distinguir descrição de avaliação. A prática comum inclui a análise de exemplos fortes e fracos de feedback entre pares antes de os alunos escreverem o seu.
O Anonimato É uma Ferramenta, Não um Requisito
A avaliação entre pares anónima reduz a pressão social e o efeito de amizade em alguns contextos, particularmente quando as classificações estão em jogo. Contudo, elimina também a responsabilização e pode reduzir o cuidado que os alunos dedicam aos comentários escritos. Muitos praticantes experientes utilizam feedback entre pares identificado para trabalhos formativos — onde a relação entre quem dá e quem recebe o feedback pode tornar-se uma conversa de aprendizagem — e revisão anónima quando as pontuações contribuem para as notas.
A Frequência Importa Mais do que a Ocasião
A avaliação entre pares praticada uma vez por semestre tem um efeito duradouro mínimo na literacia de feedback ou na autorregulação. Investigadores como Nicol e Macfarlane-Dick (2006) argumentam que o objectivo é que os alunos interiorizem padrões avaliativos — um processo que exige exposição repetida em diferentes tarefas e áreas disciplinares. Ciclos breves e frequentes de revisão entre pares, mesmo trocas estruturadas de 10 minutos, constroem o hábito de forma mais eficaz do que eventos elaborados realizados uma única vez.
Aplicação em Sala de Aula
1.º Ciclo: Listas de Verificação de Critérios para Escritores Iniciantes
No 2.º e 3.º anos de escolaridade, a avaliação entre pares funciona melhor com critérios concretos e binários que os alunos possam verificar. Após uma tarefa de escrita breve, os alunos trocam os textos e percorrem uma lista de verificação: "Tem letra maiúscula no início? Tem ponto final? Consegues encontrar uma palavra descritiva?" O avaliador assinala cada critério. O feedback é suficientemente estruturado para ser accionável e suficientemente específico para ser honesto, sem exigir a linguagem avaliativa matizada que os alunos mais novos ainda não desenvolveram.
O papel do professor nesta fase é modelar o processo repetidamente com exemplos de turma, nomeando o que observa e por que razão cumpre ou não o critério. Esta modelação não é um andaime opcional — é a instrução efectiva em literacia de feedback.
Ensino Secundário: Revisão Estruturada entre Pares de Escrita Argumentativa
Uma turma do 10.º ano de história a escrever ensaios analíticos beneficia de uma estrutura de revisão entre pares em duas passagens. Na primeira, cada aluno lê o ensaio do parceiro e sublinha a tese e cada elemento de evidência. Na segunda, preenche um guião de feedback: "O teu argumento é mais forte quando... Um sítio onde a evidência não apoia completamente a tua tese é... Uma revisão específica que sugiro é..." O guião previne o feedback vago sem sobrescrever a resposta.
Devolver o trabalho com feedback escrito entre pares antes da entrega da versão final dá aos alunos um objectivo concreto de revisão. Os estudos que comparam condições de feedback-seguido-de-revisão com condições sem feedback mostram consistentemente ganhos de qualidade nas versões revistas.
Turma Completa: Visita à Galeria com Anotação entre Pares
Uma adaptação da visita à galeria para avaliação entre pares coloca o trabalho dos alunos ao longo da sala. Cada aluno circula com notas adesivas de duas cores: uma para pontos fortes específicos ("utilização forte de dados no painel 3"), outra para questões ou sugestões específicas ("qual é a fonte da estatística no parágrafo 2?"). Os alunos regressam ao seu trabalho com um conjunto de anotações dos pares que representa múltiplas perspectivas, em vez da visão de um único revisor.
Este formato funciona particularmente bem para trabalhos visuais e baseados em projectos, onde a exposição em si comunica algo sobre organização e decisões de design que só o texto escrito pode não transmitir.
Evidência Científica
A meta-análise de Topping de 1998 na Review of Educational Research sintetizou 109 estudos de avaliação entre pares em diferentes níveis de ensino e disciplinas. A revisão concluiu que a avaliação entre pares produzia efeitos positivos consistentes no rendimento académico, com tamanhos de efeito comparáveis a outras intervenções formativas bem estabelecidas. Crucialmente, Topping verificou que os tamanhos de efeito eram maiores quando os critérios de avaliação eram explícitos, quando os alunos eram treinados no processo e quando a avaliação entre pares estava integrada no currículo, em vez de ser acrescentada como actividade pontual.
Falchikov e Goldfinch (2000), também na Review of Educational Research, realizaram uma meta-análise de 48 estudos a comparar classificações de pares com classificações de professores. Concluíram que a concordância entre as classificações de pares e professores era significativamente mais forte quando a avaliação envolvia múltiplos critérios (em vez de uma classificação holística única), quando os critérios eram co-construídos com os alunos e quando o trabalho avaliado era bem estruturado. A descoberta responde a uma preocupação comum: as classificações dos pares podem ser fiáveis quando as condições são adequadas.
Van Zundert, Sluijsmans e Van Merrienboer (2010), em Learning and Instruction, revisaram investigação centrada no processo de avaliação entre pares e encontraram evidências sólidas de que a qualidade do feedback entre pares melhora quando os avaliadores recebem treino, quando as tarefas exigem avaliação específica em vez de global e quando o feedback está associado a oportunidades de revisão. Os estudos que forneceram feedback sem oportunidade de revisão mostraram ganhos de aprendizagem menores ou negligenciáveis.
Vale a pena reconhecer uma limitação: a maior parte da investigação sobre avaliação entre pares foi conduzida em contextos de ensino superior. A base de evidências para a avaliação entre pares estruturada no 1.º ciclo é mais escassa e menos consistente. A adequação ao nível etário — tanto em termos de complexidade dos critérios como de dinâmicas sociais — exige julgamento cuidadoso por parte do professor, e a transferência directa de conclusões baseadas no ensino universitário para o 1.º ciclo não é justificada.
Equívocos Comuns
A avaliação entre pares é um substituto que poupa tempo ao feedback do professor. O feedback entre pares não é um feedback do professor mais barato ou mais rápido — é um tipo diferente de actividade de aprendizagem. Quando utilizada como estratégia de redução de carga de trabalho sem treino ou estrutura, produz feedback de baixa qualidade que frustra os alunos e erode a confiança no processo. O seu valor reside no trabalho cognitivo que cria para o avaliador. Os professores que implementam a avaliação entre pares de forma eficaz investem tipicamente tempo de instrução significativo a treinar os alunos; a recompensa é o desenvolvimento a longo prazo do julgamento avaliativo, não a redução da carga de correcção.
Os alunos não estão qualificados para avaliar o trabalho uns dos outros. Esta preocupação é compreensível, mas assenta numa leitura equivocada do que a avaliação entre pares pede aos alunos. Os avaliadores entre pares não são convidados a fazer julgamentos sumativos sobre a capacidade de um colega — são convidados a aplicar critérios explícitos a um trabalho específico. Quando os critérios são claros e os alunos são treinados, esta é uma tarefa dentro das suas competências. A meta-análise de Falchikov e Goldfinch de 2000 demonstrou correlações entre classificações de pares e professores acima de 0,80 em estudos bem concebidos.
As relações positivas entre pares inflacionam as classificações e as negativas deflacionam-nas. Os efeitos de amizade são reais, mas são contextuais e geríveis. A investigação revista por Topping (1998) concluiu que os efeitos de amizade eram mais fortes em tarefas de avaliação holística não estruturada e mais fracos quando múltiplos critérios específicos exigiam justificação individual. A submissão anónima reduz a pressão social em contextos de maior risco. Mais importante ainda, investir na cultura de feedback — construindo normas de turma em torno de um feedback honesto e útil como forma de respeito — altera progressivamente o significado social da avaliação entre pares.
Ligação à Aprendizagem Activa
A avaliação entre pares é, por natureza, um acto de aprendizagem activa. Aplicar critérios, gerar justificações escritas e fazer julgamentos avaliativos exigem elaboração, análise e síntese — os níveis superiores da taxonomia de Bloom — em vez da recepção passiva de comentários do professor.
O ensino entre pares e a avaliação entre pares partilham o mesmo mecanismo subjacente: ambos exigem que os alunos se envolvam com conteúdos ou critérios a uma profundidade que a recepção por si só não consegue produzir. No ensino entre pares, explicar um conceito obriga quem explica a identificar e resolver lacunas na sua própria compreensão. Na avaliação entre pares, avaliar um trabalho obriga o avaliador a construir um modelo interno de qualidade. Os professores que combinam o ensino entre pares com a revisão estruturada entre pares criam um ciclo de reforço em que os alunos tanto ensinam conteúdos como avaliam a qualidade da aplicação uns dos outros.
As visitas à galeria proporcionam um enquadramento natural para a avaliação entre pares de trabalhos em formato visual ou de exposição. Protocolos de anotação estruturados — que exigem comentários específicos com referência a critérios, em vez de reacções gerais — transformam a visita à galeria de uma exposição num ciclo de feedback.
O brainstorming em carrossel pode ser adaptado para a avaliação entre pares de rascunhos escritos ou argumentos estruturados. Os grupos rodam pelo trabalho uns dos outros, acrescentando comentários específicos em cada estação. O formato de múltiplos avaliadores garante que qualquer trabalho receba feedback diversificado, reduzindo o peso de qualquer julgamento individual de um par.
A ligação ao feedback em educação é directa: a avaliação entre pares é um dos contextos de maior impacto para desenvolver a literacia de feedback, porque os alunos têm de gerar feedback activamente, em vez de o receberem passivamente. A investigação sobre feedback mostra consistentemente que o acto de dar feedback detalhado melhora o trabalho subsequente de quem o dá — uma conclusão que reforça o argumento para integrar a avaliação entre pares em ciclos de instrução regulares, em vez de a tratar como uma actividade de enriquecimento ocasional.
Fontes
-
Topping, K.J. (1998). Peer assessment between students in colleges and universities. Review of Educational Research, 68(3), 249–276.
-
Black, P., & Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education: Principles, Policy & Practice, 5(1), 7–74.
-
Falchikov, N., & Goldfinch, J. (2000). Student peer assessment in higher education: A meta-analysis comparing peer and teacher marks. Review of Educational Research, 70(3), 287–322.
-
Nicol, D.J., & Macfarlane-Dick, D. (2006). Formative assessment and self-regulated learning: A model and seven principles of good feedback practice. Studies in Higher Education, 31(2), 199–218.