O que é a avaliação autêntica na educação?

A avaliação autêntica avalia os alunos através de tarefas significativas do mundo real , como conceber um produto, conduzir uma investigação ou defender uma posição , em vez de testes descontextualizados. Mede se os alunos conseguem aplicar conhecimentos e competências em contextos que se assemelham ao modo como essas competências são usadas fora da escola.

Em que difere a avaliação autêntica dos testes tradicionais?

Os testes tradicionais apresentam tipicamente questões isoladas baseadas na memorização, com uma única resposta correcta. As avaliações autênticas exigem que os alunos construam uma resposta, produto ou desempenho utilizando julgamento, criatividade e pensamento específico da disciplina. Privilegiam a transferência em detrimento da memorização.

Quais são exemplos comuns de avaliação autêntica?

Exemplos comuns incluem argumentos escritos publicados para um público real, investigações científicas com incógnitas genuínas, exposições ao estilo de museu sobre um período histórico, julgamentos simulados, colecções de portefólio, projectos de resolução de problemas comunitários e apresentações de propostas de negócio. O traço unificador é que a tarefa tem significado para além de obter uma classificação.

Como é que as rubricas apoiam a avaliação autêntica?

As rubricas tornam os critérios de sucesso explícitos e partilháveis. Na avaliação autêntica, uma rubrica bem concebida comunica padrões profissionais aos alunos antes de a tarefa começar, funcionando simultaneamente como guia de aprendizagem e instrumento de avaliação. A co-construção de rubricas com os alunos aprofunda a sua compreensão da qualidade.

Pode a avaliação autêntica ser utilizada para classificação?

Sim. As avaliações autênticas podem ser classificadas através de rubricas alinhadas com os padrões de aprendizagem. O essencial é que a classificação reflicta a competência demonstrada numa tarefa significativa, e não o desempenho numa medida substituta. Muitas escolas utilizam-nas como avaliações sumativas, provas finais ou âncoras de portefólio.

Avaliação Autêntica - Wiki Pedagógica

Definição

A avaliação autêntica é uma abordagem de avaliação em que os alunos demonstram conhecimentos e competências ao realizarem tarefas que replicam as exigências de contextos do mundo real. Em vez de responder a questões de escolha múltipla sobre fotossíntese, o aluno concebe uma experiência e apresenta os resultados. Em vez de resumir um acontecimento histórico numa ficha de trabalho, o aluno defende uma posição perante uma comissão simulada. A própria tarefa tem significado para além da sala de aula.

O termo foi formalizado pelo investigador educacional Grant Wiggins no final da década de 1980. A sua tese central era directa: se queremos saber se os alunos são capazes de realizar, temos de lhes pedir que realizem. Uma pontuação num teste diz-nos como o aluno se sai em testes. Uma tarefa autêntica diz-nos como o aluno se sai em contextos que importam.

A avaliação autêntica sobrepõe-se à avaliação de desempenho, mas não é sinónimo dela. A avaliação de desempenho é a categoria mais ampla , qualquer avaliação que exija ao aluno a produção de algo. A avaliação autêntica especifica que a tarefa de produção deve espelhar o trabalho do mundo real de forma significativa. Todas as avaliações autênticas são avaliações de desempenho; nem todas as avaliações de desempenho são autênticas.

Contexto Histórico

O fundamento intelectual da avaliação autêntica atravessa várias décadas de insatisfação com os testes estandardizados. Na década de 1970, o psicólogo David McClelland publicou "Testing for Competence Rather Than for Intelligence" (1973) na American Psychologist, argumentando que o desempenho profissional e o sucesso na vida se correlacionam mal com os testes tradicionais de inteligência e aptidão. Defendia a avaliação directa da competência através de tarefas que simulam exigências do mundo real.

Grant Wiggins trouxe esta crítica directamente para o ensino básico e secundário. O seu artigo de 1989 "A True Test: Toward More Authentic and Equitable Assessment" na Phi Delta Kappan, e o seu livro posterior Educative Assessment (1998), estabeleceram o enquadramento teórico que os professores ainda utilizam. Wiggins definiu as tarefas autênticas segundo seis critérios: são realistas, exigem julgamento, são bem estruturadas em vez de trivialmente simples, exigem que os alunos utilizem o conhecimento de forma eficaz, permitem acesso a recursos e são avaliadas em múltiplas dimensões.

Ao mesmo tempo, Lauren Resnick, da Universidade de Pittsburgh, documentava o fosso entre a cognição escolar e a cognição fora da escola. O seu discurso presidencial de 1987 na American Educational Research Association, publicado como "Learning In School and Out", demonstrou que o pensamento fora da escola é contextualizado, dependente de ferramentas e colaborativo , quase o oposto das condições dos testes escolares tradicionais.

O movimento dos portefólios na década de 1990, promovido pela equipa do Harvard Project Zero, incluindo Howard Gardner e David Perkins, alargou a avaliação autêntica à documentação longitudinal do crescimento do aluno. O projecto Arts PROPEL , uma colaboração entre o Harvard Project Zero, o Educational Testing Service e as Escolas Públicas de Pittsburgh , demonstrou que a avaliação baseada em portefólio pode ser simultaneamente rigorosa e autenticamente ligada à prática artística.

Princípios Fundamentais

Relevância para o Mundo Real

A tarefa deve ligar-se a trabalho que existe fora da escola. Isto não implica que cada tarefa resolva um problema comunitário real, mas exige que a estrutura da tarefa se assemelhe à prática profissional ou cívica. Um aluno que escreve uma carta persuasiva para uma câmara municipal, mesmo que fictícia, pratica as mesmas competências de pensamento e comunicação que um adulto que escreve para uma câmara real. O contexto cria responsabilidade cognitiva e motivacional que um enunciado descontextualizado não consegue oferecer.

Problemas Mal Estruturados

As tarefas autênticas resistem a soluções algorítmicas. Os problemas do mundo real raramente têm uma única resposta correcta recuperável da memória; exigem que os alunos reúnam informação, ponderem considerações concorrentes e defendam uma posição fundamentada. É o que Wiggins chamou de "bem estruturado" no sentido de ser profissionalmente realista, não no sentido de ser claramente delimitado. A ambiguidade é pedagogicamente intencional.

Construção em vez de Selecção

Os alunos produzem uma resposta, artefacto ou desempenho em vez de seleccionarem entre opções. Isto desloca a avaliação do reconhecimento para a aplicação. O processo de construção revela pensamento que os formatos de escolha múltipla não conseguem aceder: como o aluno organiza um argumento, onde procura evidências, como lida com contra-argumentos.

Critérios Transparentes

A avaliação autêntica depende de padrões explícitos comunicados aos alunos antes de a tarefa começar. Uma rubrica que descreve como é o trabalho de nível especializado funciona simultaneamente como instrumento de ensino e de avaliação. Os alunos que compreendem os critérios de qualidade estão melhor posicionados para se auto-avaliarem e reverem , competências que são, elas próprias, autênticas.

Múltiplas Formas de Evidência

Uma única tarefa autêntica raramente capta todo o espectro de competência de um aluno. Os programas de avaliação autêntica mais robustos utilizam múltiplas tarefas ao longo do tempo, frequentemente compiladas num portefólio. Isto espelha a forma como os profissionais demonstram a sua especialização através de um conjunto de trabalhos, e não de um único desempenho.

Aplicação em Sala de Aula

Básico

Resolução de Problemas Comunitários

Uma turma do 3.º ano a estudar ecossistemas locais identifica uma preocupação ambiental genuína próxima da escola , por exemplo, erosão no recreio ou lixo junto a uma área de escoamento. Os alunos investigam o problema, entrevistam um responsável pela manutenção ou um naturalista local, e elaboram uma proposta com suporte visual e uma breve apresentação oral para o director. A tarefa integra ciências, literacia e participação cívica. O público é real o suficiente para criar responsabilidade significativa, e o formato de proposta espelha a forma como os adultos comunicam recomendações a decisores.

Preparatório

Julgamento Simulado

Um professor de história do 9.º ano estrutura um julgamento simulado em torno de uma decisão histórica contestada , o internamento de japoneses-americanos durante a Segunda Guerra Mundial, ou o julgamento de Sócrates. Os alunos recebem papéis atribuídos (advogados de defesa, promotores, testemunhas, membros do júri) e devem investigar fontes primárias para construir os seus argumentos. O formato replica a estrutura de raciocínio adversarial da prática jurídica, exigindo que os alunos analisem evidências, antecipem contra-argumentos e comuniquem sob pressão. A avaliação utiliza uma rubrica que avalia a exactidão histórica, a estrutura argumentativa e o uso de evidências.

Secundário

Exposição de Museu

Numa disciplina de Ciências Ambientais, equipas de alunos concebem uma exposição ao estilo de museu sobre um problema ambiental local para um museu de história natural hipotético. Cada exposição deve incluir um painel interpretativo escrito, uma visualização de dados, um artefacto físico ou digital e um breve guião de monitor. Os alunos apresentam as suas exposições a colegas e membros convidados da comunidade num formato de galeria. Isto espelha o trabalho de comunicadores científicos e designers de exposições, exigindo que os alunos sintetizem investigação, considerem o público e tomem decisões de design com consequências estéticas e pedagógicas reais.

Evidência de Investigação

O enquadramento Understanding by Design de Wiggins e McTighe, que centra as tarefas de desempenho autêntico no núcleo da planificação curricular, foi implementado em centenas de distritos escolares. Um estudo de grande escala do University of Chicago Consortium on School Research (Newmann, Bryk e Nagaoka, 2001) acompanhou mais de 4.000 alunos do ensino básico de Chicago e verificou que aqueles em salas de aula com elevado "trabalho intelectual autêntico" , caracterizado pela construção de conhecimento, investigação disciplinada e valor para além da escola , registaram ganhos significativamente maiores no Iowa Tests of Basic Skills do que os alunos de comparação. O efeito manteve-se independentemente de raça e nível de rendimento.

Uma meta-análise de Jon Mueller (2005), publicada no Journal of Educational Research, analisou estudos sobre avaliação baseada no desempenho e encontrou efeitos positivos consistentes na motivação e envolvimento dos alunos, particularmente nos que tinham historicamente tido desempenho inferior em testes tradicionais. Mueller observou que as tarefas autênticas tendem a reduzir o fosso de desempenho entre alunos de estatuto socioeconómico elevado e baixo mais do que as medidas estandardizadas.

A investigação de Linda Darling-Hammond e colegas do Stanford's Center for Opportunity Policy in Education (2014) examinou sistemas de ensino de elevado desempenho na Finlândia, Singapura e Canadá , todos com forte dependência de avaliação autêntica e baseada no desempenho, em vez de testes estandardizados de alto risco. A análise concluiu que estes sistemas produzem melhores resultados internacionais a par de resultados mais equitativos, embora os investigadores alertassem para a não atribuição causal simples, dadas as muitas diferenças entre sistemas educativos.

A evidência não é uniformemente entusiasta. A fiabilidade é um desafio genuíno: a avaliação consistente de avaliações autênticas entre avaliadores exige investimento no desenvolvimento de rubricas e na formação de avaliadores. Sem essa infra-estrutura, a fiabilidade inter-avaliadores diminui e as avaliações tornam-se difíceis de utilizar para fins de prestação de contas. O próprio Wiggins reconheceu esta limitação e argumentou que a solução era um melhor design de rubricas e uma pontuação moderada, não o abandono das tarefas autênticas.

Equívocos Comuns

Ligação à Aprendizagem Activa

A avaliação autêntica e a aprendizagem activa são complementos naturais porque ambas partem da mesma premissa: a recepção passiva de informação é insuficiente para uma competência genuína. As metodologias de aprendizagem activa produzem o tipo de prática que as avaliações autênticas depois medem.

A aprendizagem baseada em projectos é a integração mais directa. Na ABP, o projecto é em si a avaliação. Os alunos investigam uma questão orientadora, produzem um produto público e apresentam o seu trabalho a um público autêntico , os critérios de Wiggins incorporados na arquitectura instrucional. A documentação do projecto, o produto final e a apresentação constituem em conjunto uma avaliação autêntica multidimensional.

Os formatos de exposição de museu estendem isto ao exigir que os alunos comuniquem a sua aprendizagem a um público externo num formato com precedente profissional. O processo de produção da exposição envolve rascunho, feedback dos pares, revisão e tomada de decisões de design , todas formas de processamento activo que conduzem a uma compreensão duradoura.

As simulações de julgamento simulado desenvolvem competências de argumentação, análise de evidências e tomada de perspectiva através de jogo de papéis estruturado. A avaliação está incorporada no próprio desempenho: a qualidade com que o aluno argumenta, contra-interroga e responde ao advogado da parte contrária é directamente visível para o professor e os pares.

Para que a avaliação autêntica funcione bem nestes contextos, devem ser desenvolvidas rubricas claras antes de a tarefa começar. A rubrica liga a experiência de aprendizagem activa a padrões avaliáveis, tornando os critérios visíveis para os alunos durante o trabalho e não apenas após a entrega.

Fontes

Wiggins, G. (1989). A true test: Toward more authentic and equitable assessment. Phi Delta Kappan, 70(9), 703–713.
Wiggins, G. (1998). Educative assessment: Designing assessments to inform and improve student performance. Jossey-Bass.
Newmann, F. M., Bryk, A. S., & Nagaoka, J. K. (2001). Authentic intellectual work and standardized tests: Conflict or coexistence? Consortium on Chicago School Research.
Darling-Hammond, L., Wilhoit, G., & Pittenger, L. (2014). Accountability for college and career readiness: Developing a new paradigm. Education Policy Analysis Archives, 22(86).

Avaliação Autêntica

Definição

Contexto Histórico

Princípios Fundamentais

Relevância para o Mundo Real

Problemas Mal Estruturados

Construção em vez de Selecção

Critérios Transparentes

Múltiplas Formas de Evidência

Aplicação em Sala de Aula

Resolução de Problemas Comunitários

Julgamento Simulado

Exposição de Museu

Evidência de Investigação

Equívocos Comuns

Ligação à Aprendizagem Activa

Fontes

Perguntas Frequentes

Conceitos Relacionados

Artigos Relacionados

A diferenciação pedagógica é a chave para o sucesso escolar no DL 54/2018

14 Instrumentos de avaliação formativa para transformar a sua sala de aula

Como implementar as Aprendizagens Essenciais na sala de aula em 7 passos

Metodologias Relacionadas

Aprendizagem Baseada em Projetos

Exposição de Museu

Simulação de Julgamento