O que é a avaliação por referenciais de aprendizagem?

A avaliação por referenciais de aprendizagem (SBG, do inglês standards-based grading) avalia o desempenho dos alunos em função de referenciais de aprendizagem claramente definidos, em vez de calcular médias de pontuações de tarefas e comportamentos. Cada classificação reflecte o que o aluno sabe e é capaz de fazer relativamente a uma competência ou conceito específico, e não quantos pontos acumulou ao longo do período de avaliação.

Em que difere a avaliação por referenciais da avaliação tradicional?

A avaliação tradicional agrega num único nível (como uma letra) o desempenho, o esforço, a realização de trabalhos de casa, a assiduidade e o crédito extra, tornando impossível saber exactamente o que o aluno compreende. A avaliação por referenciais separa a mestria académica dos factores comportamentais e relata a proficiência em cada referencial individualmente, fornecendo a professores, alunos e encarregados de educação informação precisa sobre pontos fortes e lacunas.

A avaliação por referenciais prejudica os alunos candidatos ao ensino superior?

A maioria dos estabelecimentos que adoptam este sistema converte as pontuações de proficiência em classificações tradicionais ou equivalentes de média ponderada para as pautas, pelo que o acesso ao ensino superior não é afectado. Algumas universidades já acolhem explicitamente pautas com avaliação por referenciais. A transição exige uma comunicação clara com as famílias e os orientadores, mas não tem impedido os alunos de aceder a instituições selectivas quando gerida adequadamente.

Os alunos podem repetir avaliações num sistema de avaliação por referenciais?

A repetição de avaliações é uma característica central da maioria das implementações deste sistema, não um elemento opcional. Como o objectivo é medir a mestria actual e não o desempenho num único momento, os alunos são habitualmente autorizados e encorajados a reavaliarem-se após estudo ou prática adicionais. A demonstração de mestria mais recente ou mais elevada substitui as pontuações anteriores, reflectindo que a aprendizagem é o verdadeiro objectivo.

Que escala utilizam os professores na avaliação por referenciais?

A escala mais comum é uma escala de proficiência de 4 pontos: 4 (supera o referencial), 3 (cumpre o referencial), 2 (aproxima-se do referencial), 1 (abaixo do referencial). Alguns estabelecimentos utilizam uma escala de 3 pontos ou etiquetas descritivas como Avançado, Proficiente, Em Desenvolvimento e Inicial. O essencial é que cada nível tenha uma descrição precisa e publicamente declarada, associada a evidências do trabalho do aluno.

Avaliação por Referenciais de Aprendizagem - Wiki Pedagógica

Definição

A avaliação por referenciais de aprendizagem (SBG, do inglês standards-based grading) é um sistema de avaliação e relato em que as classificações dos alunos reflectem a proficiência demonstrada em referenciais de aprendizagem específicos, em vez de um agregado de pontuações, esforço, participação e comportamento acumulados ao longo do período de avaliação. Cada pontuação reportada responde a uma única questão: em que grau este aluno domina esta competência ou conceito particular?

Num sistema de avaliação tradicional, uma classificação elevada pode significar que um aluno se destacou nos testes mas não entregou trabalhos de casa, ou que teve dificuldades com matéria nova mas ganhou crédito extra em projectos, ou ainda que esteve sempre presente e beneficiou do benefício da dúvida. A classificação por letra não consegue distinguir estes cenários. A avaliação por referenciais elimina essa ambiguidade ao separar a mestria académica das expectativas comportamentais e ao reportar cada referencial de forma independente. Um aluno pode obter 4 em 4 em "análise de fontes primárias" e 2 em 4 em "construção de argumentos fundamentados em evidências" , duas informações distintas que apontam directamente para os próximos passos pedagógicos.

O sistema assenta numa escala de proficiência com descritores precisamente definidos em cada nível. A maioria das implementações utiliza uma escala de 4 pontos, embora escalas de 3 pontos e sistemas baseados em etiquetas (Avançado, Proficiente, Em Desenvolvimento, Inicial) também sejam comuns. O que importa é que cada nível esteja ancorado em evidências observáveis do desempenho do aluno, e não numa percentagem ou na intuição do professor sobre onde o aluno se situa.

Contexto Histórico

Os fundamentos intelectuais da avaliação por referenciais remontam à investigação de Benjamin Bloom sobre aprendizagem por mestria nas décadas de 1960 e 1970. O artigo seminal de Bloom de 1968, "Learning for Mastery", argumentava que praticamente todos os alunos podem atingir níveis elevados de aprendizagem quando lhes são concedidos tempo adequado e instrução apropriada, e que as escolas deveriam estruturar a avaliação em torno da demonstração de mestria, e não da classificação dos alunos segundo uma curva de sino. A sua investigação, conduzida na Universidade de Chicago, documentou que os alunos sujeitos a instrução orientada para a mestria superavam os pares ensinados de forma tradicional em cerca de dois desvios-padrão , uma conclusão que Robert Marzano viria a descrever como um dos mais significativos efeitos dimensionais na investigação educacional.

O movimento de referenciais da década de 1990 conferiu às ideias de Bloom um novo enquadramento institucional. A publicação de referenciais de conteúdo nacionais e estaduais criou objectivos explícitos e públicos para a aprendizagem dos alunos, tornando possível reportar as classificações em função desses objectivos e não das médias da turma. Ken O'Connor, cujo livro de 2002 How to Grade for Learning se tornou um texto fundacional para os profissionais de ensino, argumentou sistematicamente que as práticas de avaliação tradicionais estavam repletas de contradições que minavam a validade das classificações como medidas de aprendizagem.

Robert Marzano e os seus colegas do Marzano Research Laboratory desenvolveram e aperfeiçoaram a escala de proficiência de 4 pontos ao longo das décadas de 2000 e 2010, articulando um quadro coerente para traduzir referenciais em objectivos avaliáveis. O livro de Marzano de 2010, Formative Assessment and Standards-Based Grading, forneceu tanto os fundamentos teóricos como as ferramentas práticas que muitos estabelecimentos adoptaram integralmente. Rick Wormeli, cujo livro de 2006 Fair Isn't Always Equal popularizou o argumento a favor da repetição de avaliações e do relato alinhado com referenciais, levou o debate a um público mais alargado de professores de sala de aula.

No início da década de 2010, o sistema SBG tinha passado da literatura de investigação para a política de estabelecimentos em estados como Oregon, New Hampshire e Maine, que se tornaram pioneiros na adopção de requisitos de graduação baseados em proficiência. O movimento continua a crescer, particularmente no ensino básico, onde os reformadores argumentam que os alunos mais novos são especialmente prejudicados por classificações que obscurecem, em vez de iluminar, a sua aprendizagem efectiva.

Princípios Fundamentais

As Classificações Reflectem Mestria, Não Médias

O compromisso definidor da avaliação por referenciais é que uma pontuação reportada representa o nível actual de mestria de um aluno num referencial específico. Este princípio exclui práticas comuns na avaliação tradicional: calcular médias de tentativas iniciais falhadas com sucessos posteriores, penalizar trabalhos entregues fora de prazo através da redução da pontuação académica, ou incluir a realização de trabalhos de casa numa pontuação destinada a medir a compreensão da leitura.

Quando um aluno tem dificuldades em Setembro e demonstra mestria em Novembro, a classificação reporta a mestria de Novembro. Os dados de Setembro são úteis para o planeamento pedagógico, mas não penalizam o registo académico final do aluno. Isto não é inflação de classificações; é uma medição precisa do que o aluno sabe e é capaz de fazer actualmente.

Os Referenciais São Desagregados

Em vez de uma única classificação por unidade ou semestre, o sistema SBG produz múltiplas pontuações , uma por referencial ou objectivo de aprendizagem avaliado. Uma única unidade de ciências do sétimo ano pode gerar pontuações separadas para "identificar variáveis numa experiência", "construir uma hipótese testável" e "analisar dados para tirar conclusões". Cada pontuação é independentemente útil. Os encarregados de educação e os alunos podem ver exactamente onde a aprendizagem é sólida e onde necessita de apoio, em vez de tentarem decifrar um único valor numérico.

Esta desagregação exige um design de avaliação mais deliberado. Os professores devem mapear cada tarefa de avaliação para referenciais específicos, e o feedback deve ser específico por referencial e não global. As rubricas são o principal instrumento para tornar esta ligação explícita, com cada critério directamente associado a um referencial e cada nível de desempenho descrito em termos de evidências e não de adjectivos qualitativos.

A Reavaliação É Parte Integrante do Sistema

Se as classificações medem a mestria e a aprendizagem exige quantidades variáveis de tempo, então a reavaliação é uma necessidade lógica, não um favor. Os sistemas SBG permitem habitualmente que os alunos se reavaliem em qualquer referencial após estudo ou prática adicionais, substituindo a pontuação mais recente ou mais elevada pelas anteriores. Este design transmite uma mensagem clara: o objectivo é a aprendizagem, e o tempo é uma variável, não um mecanismo de selecção.

Os críticos por vezes receiam que a reavaliação comprometa o rigor académico ou que os alunos não estudem na primeira tentativa sabendo que podem repetir. A investigação não apoia esta preocupação. Um estudo de 2019 de Townsley e Varga no Journal of Educational Research and Practice concluiu que as políticas de reavaliação em escolas com SBG estavam associadas a maior motivação e persistência dos alunos, e não a menores padrões académicos.

As Classificações Comportamentais e Académicas São Separadas

O esforço, a participação, a assiduidade e a realização de trabalhos de casa são informações valiosas sobre um aluno, mas não são medidas de mestria académica. Os sistemas SBG reportam estas dimensões separadamente, frequentemente como pontuações de "hábitos de aprendizagem" ou "hábitos de trabalho", em vez de as integrar nas classificações académicas. Um aluno que se esforça mas ainda não dominou o referencial recebe uma pontuação académica baixa e uma pontuação de esforço elevada , duas informações honestas em vez de uma classificação média que distorce ambas.

Esta separação é um dos aspectos mais desafiantes da adopção do SBG para professores experientes, muitos dos quais acreditam que recompensar o esforço nas classificações ensina aos alunos o valor da persistência. O contra-argumento é que o feedback honesto e específico ensina a persistência de forma mais eficaz do que as classificações inflacionadas, porque os alunos conseguem ver exactamente o que precisam de melhorar, em vez de simplesmente receberem um número que os faz sentir bem.

Aplicação em Sala de Aula

Ensino Básico: Relato da Proficiência em Leitura

Um professor do terceiro ano que utilize SBG pode acompanhar seis referenciais de leitura ao longo de uma unidade: fonética, fluência, aquisição de vocabulário, identificação da ideia principal, formulação de inferências e estrutura do texto. Em cada período de relato, os encarregados de educação recebem uma pontuação de proficiência em cada referencial em vez de uma única classificação de leitura. Um aluno que obtém 4 em fonética e fluência mas 2 em inferência recebe apoio dirigido nas competências de leitura de ordem superior, ao mesmo tempo que é desafiado de forma adequada no trabalho com palavras. As decisões pedagógicas do professor são orientadas pelos dados desagregados, e não por uma média que obscureceria tanto os pontos fortes como as lacunas.

Secundário

Design de Avaliação em Ciências

Um professor de ciências do sétimo ano concebe uma unidade sobre ecossistemas com quatro objectivos de aprendizagem retirados directamente dos referenciais nacionais. Cada tarefa de avaliação é mapeada para um ou mais objectivos, e a rubrica utiliza a escala de 4 pontos com descritores específicos por referencial. Quando um aluno entrega um relatório de laboratório que demonstra uma recolha de dados sólida (pontuação: 4) mas uma análise fraca (pontuação: 2), o professor fornece feedback escrito específico por referencial e agenda uma reavaliação do objectivo de análise após uma sessão de reensino em pequeno grupo. A pontuação da reavaliação substitui a anterior, e a classificação do aluno melhora para reflectir a aprendizagem efectiva.

Secundário

Conversão para Pauta com Média Ponderada

Um departamento de Português do ensino secundário que adopte o SBG deve abordar directamente a questão da pauta. A maioria dos departamentos cria uma tabela de conversão: 4,0 = Muito Bom/Excelente, 3,5 = Bom+, 3,0 = Bom, 2,5 = Suficiente+, 2,0 = Suficiente. A conversão é aplicada ao nível do semestre para gerar a classificação compatível com a média ponderada que consta na pauta, enquanto o relato de proficiência referencial a referencial é partilhado com os alunos e as famílias ao longo do período lectivo. Este duplo relato satisfaz os requisitos de acesso ao ensino superior, preservando os benefícios pedagógicos do feedback por referenciais durante o processo de aprendizagem.

Evidência Científica

A base de evidências para a avaliação por referenciais assenta tanto na investigação fundacional sobre aprendizagem por mestria como em estudos de implementação mais recentes.

A investigação original de Bloom sobre aprendizagem por mestria (1968, 1984) forneceu o fundamento conceptual, demonstrando que quando os alunos recebiam feedback com critérios de referência e tempo para atingir a mestria, as distribuições de desempenho se deslocavam significativamente para cima. Uma meta-análise de 1990 de Guskey e Pigott na Review of Educational Research, cobrindo 46 estudos sobre programas de aprendizagem por mestria, encontrou uma dimensão de efeito mediana de 0,54 para o desempenho dos alunos, com efeitos mais fortes nos alunos com menor rendimento. Esta é a linha de investigação que os profissionais de SBG invocam quando argumentam que a avaliação orientada para a mestria e alinhada com referenciais reduz as desigualdades de desempenho.

Estudos mais recentes analisam especificamente a implementação do SBG. Um estudo de 2016 de Schiffman no Journal of Educational Research examinou a implementação do SBG ao longo de três anos num agrupamento de escolas e encontrou melhorias significativas na auto-eficácia e no envolvimento dos alunos, acompanhadas de uma redução na proporção de alunos com classificações negativas. O estudo observou que os efeitos foram mais fortes quando a implementação foi acompanhada de desenvolvimento profissional em práticas de avaliação formativa.

A revisão de literatura de Townsley de 2018 no NASSP Bulletin, que examinou 12 estudos revistos por pares sobre SBG, encontrou evidências consistentes de que o SBG aumenta a motivação dos alunos e reduz a ansiedade face às classificações, mas observou que a maioria dos estudos se baseia em auto-relatos de professores e alunos em vez de medidas de resultado controladas. Townsley concluiu que as evidências são promissoras, mas que a investigação experimental rigorosa sobre os resultados académicos a longo prazo ainda é escassa. Esta é uma limitação honesta que os profissionais devem conhecer: as evidências teóricas e qualitativas a favor do SBG são sólidas; as evidências experimentais causais sobre ganhos académicos a longo prazo ainda estão a desenvolver-se.

Os dados de implementação em larga escala de Marzano e colegas, provenientes de mais de 300 escolas e reportados em Formative Assessment and Standards-Based Grading (2010), mostraram correlações consistentes entre práticas de avaliação alinhadas com referenciais e o desempenho dos alunos em avaliações estandardizadas, embora este trabalho apresente as limitações metodológicas típicas da investigação de profissionais.

Concepções Erradas Comuns

O SBG Significa que os Alunos Têm Sempre Direito a Repetições Sem Consequências

A concepção errada mais persistente é que o SBG elimina a responsabilização ao permitir repetições ilimitadas sem condições. Os sistemas SBG bem implementados permitem a reavaliação, mas exigem que os alunos demonstrem aprendizagem adicional antes de se reavaliar, e não que simplesmente repitam o mesmo teste. Um aluno que queira reavaliar um referencial de escrita pode ser obrigado a entregar uma revisão com uma auto-avaliação, completar tarefas de prática adicionais ou reunir com o professor para discutir a lacuna. A repetição é conquistada, não automática. As consequências do comportamento académico, como não realizar os trabalhos, são acompanhadas separadamente como pontuações de hábitos de aprendizagem.

Um 4 É o Mesmo que um Excelente

Um 4 numa escala de proficiência de 4 pontos não é equivalente a 100% numa escala tradicional. Um 4 significa "supera o referencial" , o aluno demonstra mestria do referencial central e aplica esse conhecimento de formas mais complexas, alargadas ou transferíveis. Um 3 significa que o aluno cumpre integralmente o referencial e é o objectivo para todos os alunos. Quando os encarregados de educação ouvem que um 3 é a meta e que a maioria dos alunos não atingirá 4s de forma rotineira, por vezes interpretam isso como uma redução das expectativas. O oposto é verdadeiro: um 3 exige uma mestria genuína do referencial tal como está formulado, e não 70% dos pontos possíveis.

O SBG Funciona Sem Alterações à Instrução

Algumas escolas adoptam o SBG como uma mudança de política de avaliação sem repensar a forma como a instrução é estruturada. Isto produz o pior dos dois mundos: os professores continuam a ensinar unidades numa sequência linear com pontos finais fixos, mas agora têm de converter pontuações para uma escala de proficiência no final. O SBG eficaz exige mudanças alinhadas na forma como os professores estruturam o tempo, sequenciam a instrução e utilizam os dados da avaliação formativa para informar os próximos passos. Sem essas alterações pedagógicas, a escala de proficiência é cosmética. O sistema de avaliação e o sistema pedagógico devem ser concebidos em conjunto.

Ligação à Aprendizagem Activa

A avaliação por referenciais e as metodologias de aprendizagem activa partilham um compromisso comum com a aprendizagem como objectivo da escolarização, e não com o desempenho em tarefas isoladas. Quando os alunos conhecem os referenciais específicos para os quais estão a trabalhar, podem fazer auto-avaliação, definir objectivos de aprendizagem e dirigir a sua própria prática , o trabalho cognitivo e metacognitivo que as metodologias de aprendizagem activa visam cultivar.

A avaliação formativa é o parceiro operacional diário do SBG. Os bilhetes de saída, o feedback entre pares, o debate após o pensar-em-par-e-partilhar e as verificações rápidas da compreensão geram todas as evidências específicas por referencial de que os professores necessitam para ajustar a instrução antes da avaliação sumativa. O SBG confere à avaliação formativa o seu propósito: os professores recolhem-na para ajustar a instrução, os alunos utilizam-na para identificar os próximos passos, e nenhum dos grupos precisa de esperar pela pontuação de um teste para saber onde se encontra a aprendizagem.

As rubricas são o elo estrutural entre o SBG e a aprendizagem activa. Quando as rubricas descrevem os níveis de desempenho em termos de critérios observáveis associados a referenciais específicos, os alunos podem utilizá-las durante o processo de aprendizagem, e não apenas no final. A avaliação entre pares com recurso a rubricas alinhadas com referenciais, comum na aprendizagem baseada em projectos e em unidades de investigação, desenvolve precisamente a consciência metacognitiva que a transferência da aprendizagem exige. Os alunos que analisam regularmente o seu próprio trabalho em função de uma escala de proficiência desenvolvem o hábito de auto-monitorização que os aprendentes experientes utilizam de forma automática.

A progressão por mestria , em que os alunos avançam quando demonstram mestria e não quando o calendário diz que a unidade terminou , adapta-se naturalmente à estrutura de reavaliação do SBG. Numa sala de aula invertida, em que a instrução directa é transferida para fora do tempo de aula e o tempo em sala é utilizado para a prática e a aplicação, os dados do SBG informam a forma como esse tempo em sala é distribuído: os alunos no nível 2 de um referencial recebem instrução dirigida em pequeno grupo, os alunos no nível 4 abordam problemas de extensão, e o professor actua como orientador que responde a evidências em tempo real, em vez de percorrer uma sequência pré-definida independentemente do ponto em que os alunos se encontram.

Fontes

Bloom, B. S. (1968). Learning for mastery. Evaluation Comment, 1(2), 1–12. UCLA Center for the Study of Evaluation.
Guskey, T. R., & Pigott, T. D. (1990). Research on group-based mastery learning programs: A meta-analysis. Journal of Educational Research, 81(4), 197–216.
Marzano, R. J. (2010). Formative Assessment and Standards-Based Grading. Marzano Research Laboratory.
O'Connor, K. (2002). How to Grade for Learning: Linking Grades to Standards. Corwin Press.

Avaliação por Referenciais de Aprendizagem