Definição
A avaliação formativa é qualquer actividade de avaliação realizada durante o processo de aprendizagem com o propósito explícito de informar o ensino e melhorar a aprendizagem dos alunos antes de esta terminar. Não é um teste nem uma classificação — é uma conversa contínua entre professor e aluno sobre onde a aprendizagem se encontra e para onde precisa de ir.
A definição canónica provém da síntese de Paul Black e Dylan Wiliam de 1998: a avaliação é formativa quando as evidências da aprendizagem dos alunos são recolhidas, interpretadas e utilizadas para tomar decisões sobre os próximos passos do ensino. Três actores participam nesse ciclo de feedback — o professor, os pares e o próprio aluno — e qualquer um deles pode iniciá-lo. Um professor que analisa bilhetes de saída à porta, dois alunos que comparam o seu raciocínio durante um think-pair-share, e um aluno que verifica o seu rascunho com uma lista de critérios de sucesso estão todos a realizar avaliação formativa.
A palavra "formativa" capta a lógica temporal: esta avaliação forma o aluno enquanto a formação ainda é possível. Por contraste, a avaliação sumativa mede o que o aluno alcançou após o término do ensino. Ambas servem propósitos essenciais, mas confundi-las — classificar o trabalho formativo ou tratar notas sumativas como feedback accionável — enfraquece as duas.
Contexto Histórico
O fundamento intelectual da avaliação formativa percorre várias décadas de investigação cognitiva e educacional, com início muito antes de o próprio termo se ter tornado comum.
O trabalho de Benjamin Bloom em 1969 sobre a aprendizagem para a mestria introduziu a ideia central: se os alunos recebem feedback correctivo em pontos de verificação regulares durante o ensino, o aproveitamento melhora substancialmente. Bloom observou que a tutoria individual produzia resultados dois desvios-padrão acima do ensino convencional em sala de aula. Atribuiu esta diferença sobretudo à monitorização constante e ao ajuste em tempo real por parte do tutor. A avaliação formativa, no enquadramento de Bloom, era uma aproximação em sala de aula ao ciclo de feedback do tutor.
Michael Scriven cunhou o termo "avaliação formativa" em 1967, originalmente aplicado ao desenvolvimento curricular e não à avaliação dos alunos. Lee Cronbach alargou pouco depois o conceito à aprendizagem dos alunos. Mas foi o trabalho de 1998 de Paul Black e Dylan Wiliam no King's College de Londres que elevou a avaliação formativa a uma prioridade de investigação na prática em sala de aula. O seu artigo de revisão "Inside the Black Box", publicado no Phi Delta Kappan, sintetizou 250 estudos e encontrou tamanhos de efeito entre 0,4 e 0,7 — suficientes para mover um aluno médio do percentil 50 para aproximadamente o percentil 70. A dimensão e a acessibilidade da revisão tornaram-na um dos artigos mais citados na investigação educacional.
Wiliam continuou a desenvolver o enquadramento através do Assessment Reform Group no Reino Unido, e o seu livro de 2011 Embedded Formative Assessment traduziu a investigação em rotinas estruturadas de sala de aula que os professores podiam adoptar sem revisão curricular total. O trabalho paralelo de John Hattie, cuja meta-análise de 2009 Visible Learning agregou resultados de 800 meta-análises, confirmou de forma independente a primazia do feedback — classificou-o entre as influências de maior efeito sobre o aproveitamento na sua síntese.
Princípios Fundamentais
O Ciclo de Feedback Fecha-se
A avaliação formativa só funciona quando as evidências de aprendizagem efectivamente alteram o que acontece a seguir. Recolher dados e arquivá-los é monitorização, não avaliação formativa. A característica definidora é que a informação retorna ao ensino: o professor volta a ensinar um conceito confuso, acelera para além de conteúdos que os alunos já dominaram, ou reformula uma tarefa que não gerou o pensamento pretendido. Se o ciclo de feedback não se fechar, a avaliação não foi formativa — independentemente da ferramenta utilizada.
O Feedback Aponta para a Diferença
O feedback formativo eficaz identifica a diferença entre a compreensão actual do aluno e o objectivo de aprendizagem, fornecendo informação que ajuda a colmatar essa diferença. Este é o enquadramento articulado por Sadler (1989) e posteriormente sistematizado pelo modelo de feedback de Hattie e Timperley de 2007. O feedback que apenas assinala uma resposta errada dá ao aluno um veredicto sem uma direcção. O feedback que nomeia o que o aluno fez, o que o objectivo exige e qual o próximo passo concreto dá-lhe tracção.
Os Objectivos de Aprendizagem Devem Ser Transparentes
Os alunos não conseguem auto-avaliar-se, responder ao feedback nem aprender com os pares a menos que saibam o que estão a almejar. A avaliação formativa depende de objectivos de aprendizagem claros, específicos e acessíveis aos alunos. Quando os professores partilham não só a tarefa mas também os critérios de sucesso — e ajudam os alunos a interiorizar o que "cumprir o padrão" significa através de exemplos trabalhados ou trabalhos de referência — o feedback formativo torna-se accionável em vez de confuso.
A Avaliação por Pares e a Auto-Avaliação Alargam o Feedback
Nenhum professor consegue gerar feedback significativo e individualizado para cada aluno em cada tarefa. A avaliação por pares e a auto-avaliação escalam o sistema de feedback sem escalar a carga de trabalho do professor, e trazem os seus próprios benefícios de aprendizagem. Quando os alunos avaliam o trabalho de um par com base em critérios partilhados, praticam o pensamento analítico que o objectivo de aprendizagem exige. Quando os alunos avaliam o seu próprio trabalho com honestidade, desenvolvem a consciência metacognitiva que prevê o sucesso académico a longo prazo (Zimmerman, 2002).
O Baixo Risco Protege Evidências Honestas
Se os alunos acreditam que as suas respostas formativas serão classificadas, desempenham um papel em vez de revelar a sua compreensão. As notas atribuídas ao trabalho formativo suprimem os erros honestos que são mais úteis a um professor que ajusta o ensino. A investigação mostra consistentemente que eliminar as classificações das actividades formativas — e ser explícito com os alunos de que os erros são esperados e úteis — melhora tanto a qualidade das evidências recolhidas como a disposição dos alunos para correr riscos intelectuais (Butler, 1988).
Aplicação em Sala de Aula
Ensino Básico: A Verificação por Semáforo
Uma professora de matemática do 3.º ano introduz uma nova estratégia de multiplicação. Numa pausa natural da aula, pede aos alunos que levantem um cartão vermelho, amarelo ou verde (ou mostrem os dedos): verde significa "percebi", amarelo significa "não tenho a certeza", vermelho significa "estou perdido". Ela percorre a sala com o olhar em segundos. Chama os alunos de cartão vermelho para um pequeno grupo para modelação adicional, enquanto os alunos de cartão verde trabalham numa extensão desafiante. Os alunos de cartão amarelo formam pares para comparar as suas abordagens. A professora diferenciou o ensino em menos de um minuto, usando evidências da sala em vez de intuição.
Ensino Secundário: A Galeria de Whiteboards para Mapeamento de Argumentos
Uma professora de Inglês do 9.º ano pede aos alunos que escrevam as suas teses em mini-whiteboards e as levantem simultaneamente. Ao percorrer a fila, verifica imediatamente que cerca de um terço da turma escreveu frases temáticas em vez de afirmações argumentáveis. Em vez de corrigir todos os trabalhos, selecciona três exemplos anónimos — um forte, um parcial, um subdesenvolvido — e conduz uma breve análise colectiva. Os alunos revêem os seus whiteboards. A professora recolheu evidências de todos os alunos e reorientou o ensino sem qualquer classificação.
Ensino Superior e Formação Profissional: O Papel de Um Minuto
Um formador de professores faz uma pausa na sessão quinze minutos antes do fim e coloca duas questões: "Qual é a coisa mais importante que aprendeu hoje?" e "Que dúvida ainda tem?" Os participantes escrevem durante dois minutos e entregam os papéis. O formador lê-os nessa tarde e abre a sessão seguinte respondendo às três dúvidas mais comuns. Os participantes percebem que a sua confusão é antecipada e valorizada; o formador sabe por onde começar na próxima vez.
Os bilhetes de saída são uma das implementações mais práticas deste princípio em todos os níveis de ensino — um estímulo estruturado no final da aula que gera evidências accionáveis em menos de cinco minutos.
Evidências de Investigação
A revisão de Black e Wiliam de 1998 estabeleceu a base de evidências fundamental. Ao sintetizar aproximadamente 250 estudos, verificaram que uma avaliação formativa bem implementada produzia tamanhos de efeito entre 0,4 e 0,7, com os efeitos mais expressivos observados nos alunos com menor aproveitamento. Este ponto é relevante: a avaliação formativa não é uma estratégia que beneficia principalmente os alunos já com elevado desempenho. Os mecanismos identificados incluíam objectivos de aprendizagem mais claros, feedback mais rico e maior responsabilização dos alunos pela sua aprendizagem.
O artigo de Hattie e Timperley de 2007, "The Power of Feedback", publicado na Review of Educational Research, meta-analisou 196 estudos envolvendo 6.972 tamanhos de efeito e encontrou um tamanho de efeito médio de 0,79 para o feedback — uma das influências de ensino mais fortes em toda a síntese. De forma crítica, verificaram que o feedback dirigido ao próprio ("és um bom aluno") era largamente ineficaz. O feedback dirigido à tarefa, ao processo e às estratégias de auto-regulação do aluno produzia os ganhos mais expressivos.
Kingsley e Grabner-Hagen (2015) examinaram ferramentas digitais de avaliação formativa em salas de aula do ensino básico e secundário e verificaram que o feedback imediato — disponível através de sistemas de resposta em sala de aula — produzia resultados de aprendizagem mais expressivos do que o feedback escrito diferido, quando os alunos tinham orientação suficiente para agir com base no que recebiam. A rapidez do feedback importa, mas apenas quando associada à clareza.
A meta-análise de Kingston e Nash de 2011, publicada em Educational Measurement: Issues and Practice, merece destaque pela sua honestidade intelectual: encontrou tamanhos de efeito menores (aproximadamente 0,20) do que a síntese de Black e Wiliam. Kingston e Nash atribuíram a diferença à qualidade dos estudos e à fidelidade de implementação. A avaliação formativa com implementação fraca produz resultados fracos. A investigação suporta a prática, mas não de forma acrítica — a execução importa.
Equívocos Comuns
A avaliação formativa significa testes frequentes. Os testes de baixo risco podem servir propósitos formativos, mas a avaliação formativa é definida pelo que acontece com as evidências, não pelo formato da ferramenta. Um professor que aplica um teste de cinco perguntas e depois prossegue para a lição seguinte independentemente dos resultados realizou um teste, não uma avaliação formativa. Inversamente, uma discussão rica em sala de aula na qual o professor escuta com atenção e ajusta a direcção do dia com base no que os alunos dizem é altamente formativa — sem qualquer teste.
A avaliação formativa é apenas responsabilidade do professor. Este equívoco reduz a avaliação formativa a uma tarefa de monitorização realizada sobre os alunos, em vez de um processo colaborativo que os envolve. Quando os alunos aprendem a avaliar a sua própria compreensão, a definir objectivos de aprendizagem e a dar feedback útil aos pares, tornam-se participantes activos no seu próprio progresso de aprendizagem. A avaliação por pares, em particular, gera feedback num volume e frequência que nenhum professor individualmente consegue igualar, e o acto de avaliar o trabalho de outro aprofunda a compreensão do próprio avaliador.
Os resultados da avaliação formativa devem constar no livro de classificações. Classificar o trabalho formativo confunde o seu propósito diagnóstico com o propósito avaliativo da avaliação sumativa. Quando os alunos sabem que cada resposta será pontuada, protegem a sua média em vez de revelarem o seu pensamento. As evidências formativas mais úteis provêm frequentemente de compreensões incompletas, percursos errados e ideias em formação — exactamente o que as classificações penalizam. Manter registos formativos e sumativos separados protege a segurança psicológica que as evidências formativas honestas exigem.
Ligação à Aprendizagem Activa
A avaliação formativa e a aprendizagem activa são mutuamente reforçadoras: a aprendizagem activa gera evidências observáveis de pensamento, e a avaliação formativa dá a professores e alunos um mecanismo para usar essas evidências. Sem feedback formativo, a aprendizagem activa pode ser envolvente mas sem direcção; sem estruturas de aprendizagem activa, a avaliação formativa carece das evidências ricas de que precisa para ser útil.
O think-pair-share é um dos veículos de avaliação formativa mais poderosos de uso comum. Quando os alunos formam pares para discutir uma questão antes de partilharem com a turma, o professor circula e escuta — recolhendo evidências em tempo real do que os alunos compreendem, do que confundem e do que consideram genuinamente difícil. A fase de partilha revela quais as ideias que são generalizadas e quais as que são idiossincráticas. O professor pode ajustar o ensino no momento com base no que os pares trouxeram à superfície.
A galeria de trabalhos transforma as evidências formativas num artefacto físico que a turma pode examinar colectivamente. Quando os grupos afixam os seus trabalhos nas paredes e circulam por eles, tanto o professor como os alunos podem ver o leque de respostas de toda a turma. O professor obtém dados de avaliação rápidos sobre o grupo; os alunos calibram a sua própria compreensão em relação à dos pares. As anotações que os alunos acrescentam durante a galeria são em si mesmas evidências formativas.
O chalk talk — o protocolo de escrita colaborativa silenciosa — gera um registo visível do pensamento dos alunos sem as pressões sociais da discussão verbal. Os alunos escrevem perguntas e respostas directamente em papel partilhado ou num quadro branco. O professor pode fotografar a conversa e revê-la como dados formativos, enquanto os alunos vêem onde o pensamento dos pares converge e diverge do seu.
O conceito de avaliação para a aprendizagem fornece o enquadramento filosófico mais amplo que une estas práticas. Onde a avaliação formativa nomeia a prática técnica, a avaliação para a aprendizagem nomeia a orientação: avaliação usada não para classificar ou certificar, mas para apoiar o aluno na sua progressão.
Fontes
- Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. Phi Delta Kappan, 80(2), 139–148.
- Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81–112.
- Wiliam, D. (2011). Embedded Formative Assessment. Solution Tree Press.
- Sadler, D. R. (1989). Formative assessment and the design of instructional systems. Instructional Science, 18(2), 119–144.