Definição
A avaliação por pares é uma prática educacional estruturada em que os alunos avaliam o trabalho, o desempenho ou a compreensão dos colegas usando critérios predefinidos. O aluno avaliador produz comentários escritos, classificações ou ambos, e o aluno avaliado usa esse feedback para revisar ou refletir. Diferente do feedback informal entre colegas — "ficou bom assim" — a avaliação por pares estruturada exige critérios explícitos, um processo definido e, geralmente, alguma forma de responsabilização.
O conceito está inserido no domínio mais amplo da avaliação formativa: avaliação cuja função principal é melhorar a aprendizagem, e não mensurá-la para fins de nota. Keith Topping, cuja meta-análise de 1998 na Universidade de Dundee continua sendo a revisão fundadora do campo, definiu a avaliação por pares como "um arranjo pelo qual os aprendizes consideram e especificam o nível, o valor ou a qualidade de um produto ou desempenho de outros aprendizes em posição social equivalente." A definição destaca dois aspectos essenciais: o julgamento avaliativo envolvido e a igualdade de posição social entre avaliador e avaliado.
A avaliação por pares difere da autoavaliação, em que os alunos avaliam o próprio trabalho, embora as duas práticas sejam frequentemente combinadas. Também é diferente da aprendizagem cooperativa, que estrutura a interdependência do grupo para a criação conjunta de um produto. A avaliação por pares pode ocorrer dentro de estruturas cooperativas, mas funciona como um ato reflexivo dedicado, e não apenas como um recurso do trabalho em grupo.
Contexto Histórico
As raízes intelectuais da avaliação por pares remontam às décadas de 1960 e 1970, quando psicólogos cognitivos começaram a questionar o modelo passivo de aprendizagem que dominava as escolas. O modelo de aprendizagem por domínio de Bloom (1968) estabeleceu que o feedback formativo dentro dos ciclos de aprendizagem era essencial para o progresso dos alunos — premissa que tornava o feedback entre pares uma ferramenta lógica.
A prática ganhou sua primeira base de pesquisa sistemática no ensino superior durante as décadas de 1980 e 1990. Nancy Falchikov, da Universidade Napier, foi uma das primeiras pesquisadoras a estudar sistematicamente a atribuição de notas por pares, relatando em um artigo de 1986 que os alunos conseguiam produzir notas confiáveis, próximas às dos professores, quando treinados com critérios explícitos. A revisão de Keith Topping em 1998, publicada na Review of Educational Research, consolidou evidências de 109 estudos, estabelecendo que a avaliação por pares produzia ganhos confiáveis em desempenho acadêmico, consciência metacognitiva e na qualidade do feedback escrito que os alunos conseguiam gerar.
A revisão seminal de Paul Black e Dylan Wiliam em 1998, "Inside the Black Box" (publicada no Phi Delta Kappan), reformulou toda a discussão. Sua análise de 250 estudos concluiu que as práticas de avaliação formativa, incluindo avaliação por pares e autoavaliação, produziram alguns dos maiores tamanhos de efeito já documentados na pesquisa educacional, especialmente para alunos com desempenho mais baixo. Esse trabalho deslocou a avaliação por pares de uma técnica de nicho no ensino superior para a prática escolar convencional em todo o mundo.
David Nicol e Debra Macfarlane-Dick ampliaram essa base com um modelo teórico de 2006 publicado no Studies in Higher Education, argumentando que o feedback por pares é mais valioso não porque informa o destinatário, mas porque desenvolve a capacidade do avaliador de monitorar e regular sua própria aprendizagem.
Princípios Fundamentais
Os Critérios Devem Ser Explícitos Antes da Avaliação
A avaliação por pares produz feedback confiável e útil somente quando tanto o avaliador quanto o avaliado entendem como é a qualidade antes que a avaliação comece. Critérios apresentados apenas após a entrega do trabalho funcionam como julgamento retroativo. Critérios construídos coletivamente com os alunos antes de uma tarefa funcionam como andaime de aprendizagem durante todo o processo de produção. Uma pesquisa de Andrade e Du (2005) mostrou que alunos que ajudaram a desenvolver rubricas produziram trabalhos significativamente melhores do que aqueles que receberam a mesma rubrica de forma passiva. O ato de articular qualidade é, em si, um ato de aprendizagem.
O Avaliador Aprende Tanto Quanto o Avaliado
Um equívoco persistente trata a avaliação por pares como um mecanismo de entrega de feedback. As evidências mais sólidas apontam para outra direção: o trabalho cognitivo de aplicar critérios ao trabalho de outra pessoa obriga o avaliador a se engajar ativamente com padrões que, de outra forma, poderia passar por cima. A análise de Topping de 1998 documentou esse benefício para o avaliador em múltiplas disciplinas. Alunos convidados a avaliar um argumento precisam primeiro construir um modelo mental de como é um argumento forte — essa construção é a aprendizagem.
Treinamento e Exemplos Modelados São Inegociáveis
Sem preparação, os alunos recorrem a elogios vagos ("ficou bom") ou críticas diretas sem explicação. Nenhum dos dois ajuda quem recebe o feedback. Programas eficazes de avaliação por pares investem tempo instrucional explícito no letramento em feedback: o que torna um feedback específico, o que o torna acionável, como distinguir descrição de avaliação. A prática comum inclui a análise de exemplos fortes e fracos de feedback por pares antes que os alunos escrevam os seus próprios.
O Anonimato É uma Ferramenta, Não um Requisito
A avaliação por pares anônima reduz a pressão social e o viés de amizade em alguns contextos, especialmente quando há notas em jogo. Mas também elimina a responsabilização e pode reduzir o cuidado que os alunos dedicam aos comentários escritos. Muitos profissionais experientes usam o feedback por pares identificado para atividades formativas, em que a relação entre quem dá e quem recebe o feedback pode se tornar uma conversa de aprendizagem, e a revisão anônima quando as pontuações contribuem para as notas.
A Frequência Importa Mais do Que a Ocasião
A avaliação por pares praticada uma vez por semestre tem efeito duradouro mínimo sobre o letramento em feedback ou a autorregulação. Pesquisadores como Nicol e Macfarlane-Dick (2006) argumentam que o objetivo é que os alunos internalizem padrões avaliativos — um processo que exige exposição repetida a diferentes tarefas e disciplinas. Ciclos breves e frequentes de revisão por pares, mesmo trocas estruturadas de 10 minutos, constroem o hábito de forma mais eficaz do que eventos elaborados e esporádicos.
Aplicação em Sala de Aula
Ensino Fundamental I: Listas de Verificação para Escritores Iniciantes
Nos 2º e 3º anos do Ensino Fundamental, a avaliação por pares funciona melhor com critérios concretos e binários que os alunos possam verificar. Após uma atividade breve de escrita, os alunos trocam de folha e percorrem uma lista de verificação: "Começa com letra maiúscula? Termina com ponto final? Você encontra uma palavra que descreve algo?" O avaliador circula ou marca cada critério. O feedback é estruturado o suficiente para ser acionável e específico o suficiente para ser honesto, sem exigir a linguagem avaliativa elaborada que crianças pequenas ainda não desenvolveram.
O papel do professor nesta etapa é modelar o processo repetidamente com exemplos para toda a turma, nomeando o que observa e por que atende ou não ao critério. Essa modelagem não é um andaime opcional — é a instrução real em letramento de feedback.
Ensino Médio: Revisão por Pares Estruturada de Redações Argumentativas
Uma turma do 1º ano do Ensino Médio escrevendo redações analíticas de história se beneficia de uma estrutura de revisão por pares em duas etapas. Na primeira etapa, cada aluno lê a redação do colega e sublinha a tese e cada evidência apresentada. Na segunda etapa, preenche um roteiro de feedback: "Seu argumento é mais forte quando... Um trecho em que a evidência não apoia completamente sua tese é... Uma revisão específica que eu sugiro é..." O roteiro evita feedback vago sem engessar demais a resposta.
Devolver o trabalho com o feedback escrito pelos colegas antes da entrega final dá aos alunos um objetivo concreto de revisão. Estudos que comparam a condição feedback-e-revisão com a condição sem-feedback mostram consistentemente ganhos de qualidade nas versões revisadas.
Turma Completa: Galeria com Anotações por Pares
Uma adaptação de galeria para avaliação por pares coloca os trabalhos dos alunos espalhados pela sala. Cada aluno circula com post-its em duas cores: um para pontos fortes específicos ("uso forte de dados no painel 3"), outro para perguntas ou sugestões específicas ("qual é a fonte da estatística no segundo parágrafo?"). Os alunos retornam ao próprio trabalho com um conjunto de anotações dos colegas que representa múltiplas perspectivas, e não apenas a visão de um único revisor.
Esse formato funciona especialmente bem para trabalhos visuais e baseados em projetos, em que a própria exibição comunica algo sobre organização e decisões de design que o texto escrito isolado talvez não capture.
Evidências de Pesquisa
A meta-análise de Topping de 1998, publicada na Review of Educational Research, sintetizou 109 estudos sobre avaliação por pares em diferentes níveis de ensino e disciplinas. A revisão constatou que a avaliação por pares produzia efeitos positivos consistentes no desempenho acadêmico, com tamanhos de efeito comparáveis a outras intervenções formativas bem estabelecidas. De forma decisiva, Topping identificou que os tamanhos de efeito eram maiores quando os critérios de avaliação eram explícitos, quando os alunos eram treinados no processo e quando a avaliação por pares estava integrada ao currículo, e não inserida como atividade pontual.
Falchikov e Goldfinch (2000), também na Review of Educational Research, conduziram uma meta-análise de 48 estudos comparando notas atribuídas por pares e por professores. Eles descobriram que a concordância entre as notas era significativamente maior quando a avaliação envolvia múltiplos critérios (em vez de uma classificação holística única), quando os critérios eram construídos junto com os alunos e quando o trabalho avaliado era bem estruturado. O achado responde a uma preocupação comum: as notas atribuídas por pares podem ser confiáveis quando as condições são adequadas.
Van Zundert, Sluijsmans e Van Merrienboer (2010), no periódico Learning and Instruction, revisaram pesquisas focadas no processo de avaliação por pares e encontraram evidências sólidas de que a qualidade do feedback melhora quando os avaliadores recebem treinamento, quando as tarefas exigem avaliação específica em vez de global, e quando o feedback está vinculado a oportunidades de revisão. Estudos que ofereceram feedback sem oportunidade de revisão mostraram ganhos de aprendizagem menores ou insignificantes.
Vale reconhecer uma limitação importante: a maior parte das pesquisas sobre avaliação por pares foi conduzida em contextos de ensino superior. A base de evidências para a avaliação estruturada por pares no Ensino Fundamental é mais limitada e apresenta resultados mais heterogêneos. A adequação dos critérios ao nível de desenvolvimento e à dinâmica social exige julgamento cuidadoso do professor, e a transferência direta de achados universitários para salas de aula do Ensino Fundamental não é recomendada.
Equívocos Comuns
A avaliação por pares é um substituto para o feedback do professor que economiza tempo. O feedback por pares não é um feedback do professor mais barato ou mais rápido — é um tipo diferente de atividade de aprendizagem. Quando usada como estratégia de redução de carga de trabalho sem treinamento ou estrutura, produz feedback de baixa qualidade que frustra os alunos e corrói a confiança no processo. Seu valor está no trabalho cognitivo que cria para o avaliador. Professores que implementam bem a avaliação por pares geralmente investem tempo instrucional significativo no treinamento dos alunos; o retorno é o desenvolvimento de longo prazo do julgamento avaliativo, não a redução da carga de correção.
Os alunos não estão qualificados para avaliar o trabalho uns dos outros. Essa preocupação é compreensível, mas parte de uma leitura equivocada do que a avaliação por pares pede aos alunos. Os avaliadores entre pares não estão sendo solicitados a fazer julgamentos sumativos sobre a capacidade de um colega — eles estão sendo solicitados a aplicar critérios explícitos a um trabalho específico. Quando os critérios são claros e os alunos estão treinados, essa é uma tarefa ao alcance deles. A meta-análise de Falchikov e Goldfinch de 2000 demonstrou correlações entre notas de pares e de professores acima de 0,80 em estudos bem estruturados.
Relações de amizade vão inflar as notas e relações negativas vão derrubá-las. Os efeitos de amizade são reais, mas são contextuais e gerenciáveis. As pesquisas revisadas por Topping (1998) mostraram que os efeitos de amizade eram mais fortes em tarefas de avaliação não estruturadas e holísticas, e mais fracos quando múltiplos critérios específicos exigiam justificativa individual. A submissão anônima reduz a pressão social em contextos de alta relevância. Mais importante ainda, investir em uma cultura de feedback, construindo normas de turma em torno do feedback honesto e útil como forma de respeito, muda o significado social da avaliação por pares ao longo do tempo.
Conexão com a Aprendizagem Ativa
A avaliação por pares é, por natureza, um ato de aprendizagem ativa. Aplicar critérios, gerar justificativas escritas e fazer julgamentos avaliativos exigem elaboração, análise e síntese — os níveis superiores da Taxonomia de Bloom — em vez da recepção passiva de comentários do professor.
A tutoria entre pares e a avaliação por pares compartilham o mesmo mecanismo subjacente: ambas exigem que os alunos se engajem com o conteúdo ou os critérios em uma profundidade que a simples recepção não pode produzir. Na tutoria entre pares, explicar um conceito obriga quem explica a identificar e resolver lacunas em seu próprio entendimento. Na avaliação por pares, avaliar um trabalho obriga o avaliador a construir um modelo interno de qualidade. Professores que combinam tutoria entre pares com revisão por pares estruturada criam um ciclo de reforço em que os alunos ensinam conteúdo e avaliam a qualidade da aplicação uns dos outros.
As galerias oferecem um contexto natural para a avaliação por pares de trabalhos visuais ou em formato de exposição. Protocolos de anotação estruturados, que exigem comentários específicos referenciados a critérios em vez de reações gerais, transformam a galeria de uma exposição em um ciclo de feedback.
O brainstorming em carrossel pode ser adaptado para a avaliação por pares de rascunhos escritos ou argumentos estruturados. Os grupos passam pelo trabalho uns dos outros, acrescentando comentários específicos em cada estação. O formato de múltiplos avaliadores significa que qualquer trabalho individual recebe feedback diversificado, reduzindo o peso de qualquer julgamento isolado de um par.
A conexão com o feedback na educação é direta: a avaliação por pares é um dos contextos de maior impacto para o desenvolvimento do letramento em feedback, porque os alunos precisam gerar feedback ativamente, e não apenas recebê-lo de forma passiva. Pesquisas sobre feedback mostram consistentemente que o ato de dar feedback detalhado melhora o trabalho subsequente de quem o dá — um achado que fortalece o argumento para incorporar a avaliação por pares em ciclos instrucionais regulares, em vez de tratá-la como uma atividade de enriquecimento ocasional.
Fontes
-
Topping, K.J. (1998). Peer assessment between students in colleges and universities. Review of Educational Research, 68(3), 249–276.
-
Black, P., & Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education: Principles, Policy & Practice, 5(1), 7–74.
-
Falchikov, N., & Goldfinch, J. (2000). Student peer assessment in higher education: A meta-analysis comparing peer and teacher marks. Review of Educational Research, 70(3), 287–322.
-
Nicol, D.J., & Macfarlane-Dick, D. (2006). Formative assessment and self-regulated learning: A model and seven principles of good feedback practice. Studies in Higher Education, 31(2), 199–218.