A
A
Alunos do ensino básico na sala de aula a fazer testes. Crédito:Shutterstock

Sem testes e sem avaliação, somos cegos perante a realidade

Na semana em que um milhão de alunos começa a regressar às aulas, a Fundação publica um excerto do novo livro «Aprender», escrito pelo professor e ex-ministro da Educação Nuno Crato. Neste artigo, defende-se a importância da avaliação válida e rigorosa dos alunos, e como ela é fundamental para avaliar a sua aprendizagem, mas também o estado da educação no país.
5 min
Autoria
À venda na livraria

Porque se fazem testes? Porque se fazem exames? Serão maldades cometidas contra os jovens, como disse uma vez um deputado na Assembleia da República?

A resposta simples é esta: fazem‑se testes para conhecer o estado da educação, ou seja, os progressos alcançados pelos jovens. Esse conhecimento pode ser agregado, dando informa­ção sobre todos os estudantes, desagregado, dando informações individuais, ou ainda ter graus de granularidade intermédios.

As provas podem assumir várias formas. O importante é que revelem aquilo que se pretende medir. E o que se pretende medir nunca pode ser tudo, mas deve ser uma parte indicativa do todo, algo que forneça informação sobre o que se quer saber.

Em termos técnicos, diz‑se que os testes devem ser válidos, ou seja, devem quantificar aquilo que se quer medir (American Educational Research Association [AERA], 2014: 225) A vali­dade de um teste é uma propriedade relativa ao que se quer avaliar e a quem se quer avaliar (Wilson, 2005: parte 3). Um teste de resolução de certo tipo de problemas de aritmética pode medir bem a capacidade dos estudantes para resolver questões aritméticas, mas pode não ser válido para a medição de conhecimentos de geometria, mesmo que existam questões relacionadas com geometria.

Da mesma forma, um teste de pro­blemas de matemática destinado a alunos do 4.º ano de esco­laridade não será um teste válido se tiver problemas escritos com uma linguagem que esses alunos não entendem. Estará a testar os conhecimentos de matemática ou o domínio da lín­gua portuguesa?

Os testes devem ser também fiáveis (reliable), ou seja, devem medir com alguma consistência o seu objeto (AERA, 2014: 222‑223).

Um estudante que um dia tenha 100% num teste, porque estava especialmente desperto e bem‑disposto, no dia seguinte, de boa saúde, mas menos animado, não deve obter 5% no mesmo teste. Assim como alunos com conhecimentos e capacidades semelhantes, avaliados no mesmo contexto, não devem obter classificações muito diferentes.

Fazendo um paralelo, uma balança não deve indicar 2,2 kg quando pesa um objeto de 2 kg, pois essa não será uma medi­ção válida. Mas pode ser fiável no sentido de consistentemente mostrar um peso 10% mais elevado do que o real. Assim como pode ser uma balança válida, por apontar em média para 2 kg quando o peso é 2 kg, mas pode não ser fiável por um dia mostrar 1,9 kg e no dia seguinte mostrar 2,1 kg. Em média, esta balança pode estar certa, mas varia tanto que não é fiável.  (…)

Nenhum teste é perfeito. Nenhum teste mede tudo. Mas o facto é que os testes bem feitos, válidos e fiáveis são uma medida muito razoável do grau de conhecimentos e destrezas dos alunos.

Nenhum teste é perfeito. Nem em matemática, nem em filosofia, nem em inglês — nenhum teste mede tudo. Mas o facto é que os testes bem feitos, válidos e fiáveis são uma medida muito razoável do grau de conhecimentos e destrezas que os alunos desenvolveram.

Qualquer professor experiente sabe, também, que vários testes e várias formas de avaliação aplicadas a uma turma ou a um aluno são bastante consistentes e permitem prever com razoável fiabilidade o comportamento da turma e do aluno numa outra avaliação que se faça algum tempo depois.

Em terceiro lugar, não podemos esquecer que a avaliação não consiste num só teste ou num só momento. Os alunos são avaliados internamente, pelo professor, através de testes escri­tos, de perguntas orais, de trabalhos individuais, de trabalhos de grupo, e tudo isso fornece muitos elementos informativos que se compensam. Uma má sorte num teste e falhas graves num trabalho podem ser compensadas com uma prova oral ou com outro teste.

Em Portugal, as provas finais de ciclo, quando existiam e eram valoradas, e os exames, os poucos que ainda existem, foram sempre ponderados por notas internas. Há, pois, um grande exagero quando se diz que tudo é decidido num único teste. Isso pode acontecer para alguns alunos, poucos, quando estão já num limbo em que falharam uma série de elementos de avaliação e é por umas décimas que se decide o seu resultado final. Mas isso é o que se passa em tudo na vida. Há quem não possa votar porque ainda falta um dia para completar 18 anos e quem perca um comboio porque chegou um minuto atrasado.

Voltemos atrás. Dissemos que um país fica cego se não avaliar sistematicamente o nível alcançado pelos seus alunos. Percebemos que essa avaliação deve ser válida e fiável. Ou seja, o seu objetivo geral é sempre conhecer com a maior validade e fiabilidade possíveis o nível de conhecimentos e capacidades que os alunos alcançam. E percebemos que há vários tipos de avaliação: nomeadamente avaliação local, feita numa turma ou dirigida a um grupo de alunos e organizada pelos professores, ou nacional, que é o caso das provas de aferição, provas finais de ciclo ou exames.

Estes dois tipos de avaliação entreajudam‑se. Na ausência de uma avaliação nacional, não só se desconhece o estado da educação de um país, como os professores nas escolas perdem uma referência normativa nacional que é dada pelas provas e exames nacionais.

Autoria
Portuguese, Portugal