
Sem testes e sem avaliação, somos cegos perante a realidade
Porque se fazem testes? Porque se fazem exames? Serão maldades cometidas contra os jovens, como disse uma vez um deputado na Assembleia da República?
A resposta simples é esta: fazem‑se testes para conhecer o estado da educação, ou seja, os progressos alcançados pelos jovens. Esse conhecimento pode ser agregado, dando informação sobre todos os estudantes, desagregado, dando informações individuais, ou ainda ter graus de granularidade intermédios.
As provas podem assumir várias formas. O importante é que revelem aquilo que se pretende medir. E o que se pretende medir nunca pode ser tudo, mas deve ser uma parte indicativa do todo, algo que forneça informação sobre o que se quer saber.
Em termos técnicos, diz‑se que os testes devem ser válidos, ou seja, devem quantificar aquilo que se quer medir (American Educational Research Association [AERA], 2014: 225) A validade de um teste é uma propriedade relativa ao que se quer avaliar e a quem se quer avaliar (Wilson, 2005: parte 3). Um teste de resolução de certo tipo de problemas de aritmética pode medir bem a capacidade dos estudantes para resolver questões aritméticas, mas pode não ser válido para a medição de conhecimentos de geometria, mesmo que existam questões relacionadas com geometria.
Da mesma forma, um teste de problemas de matemática destinado a alunos do 4.º ano de escolaridade não será um teste válido se tiver problemas escritos com uma linguagem que esses alunos não entendem. Estará a testar os conhecimentos de matemática ou o domínio da língua portuguesa?
Os testes devem ser também fiáveis (reliable), ou seja, devem medir com alguma consistência o seu objeto (AERA, 2014: 222‑223).
Um estudante que um dia tenha 100% num teste, porque estava especialmente desperto e bem‑disposto, no dia seguinte, de boa saúde, mas menos animado, não deve obter 5% no mesmo teste. Assim como alunos com conhecimentos e capacidades semelhantes, avaliados no mesmo contexto, não devem obter classificações muito diferentes.
Fazendo um paralelo, uma balança não deve indicar 2,2 kg quando pesa um objeto de 2 kg, pois essa não será uma medição válida. Mas pode ser fiável no sentido de consistentemente mostrar um peso 10% mais elevado do que o real. Assim como pode ser uma balança válida, por apontar em média para 2 kg quando o peso é 2 kg, mas pode não ser fiável por um dia mostrar 1,9 kg e no dia seguinte mostrar 2,1 kg. Em média, esta balança pode estar certa, mas varia tanto que não é fiável. (…)
Nenhum teste é perfeito. Nem em matemática, nem em filosofia, nem em inglês — nenhum teste mede tudo. Mas o facto é que os testes bem feitos, válidos e fiáveis são uma medida muito razoável do grau de conhecimentos e destrezas que os alunos desenvolveram.
Qualquer professor experiente sabe, também, que vários testes e várias formas de avaliação aplicadas a uma turma ou a um aluno são bastante consistentes e permitem prever com razoável fiabilidade o comportamento da turma e do aluno numa outra avaliação que se faça algum tempo depois.
Em terceiro lugar, não podemos esquecer que a avaliação não consiste num só teste ou num só momento. Os alunos são avaliados internamente, pelo professor, através de testes escritos, de perguntas orais, de trabalhos individuais, de trabalhos de grupo, e tudo isso fornece muitos elementos informativos que se compensam. Uma má sorte num teste e falhas graves num trabalho podem ser compensadas com uma prova oral ou com outro teste.
Em Portugal, as provas finais de ciclo, quando existiam e eram valoradas, e os exames, os poucos que ainda existem, foram sempre ponderados por notas internas. Há, pois, um grande exagero quando se diz que tudo é decidido num único teste. Isso pode acontecer para alguns alunos, poucos, quando estão já num limbo em que falharam uma série de elementos de avaliação e é por umas décimas que se decide o seu resultado final. Mas isso é o que se passa em tudo na vida. Há quem não possa votar porque ainda falta um dia para completar 18 anos e quem perca um comboio porque chegou um minuto atrasado.
Voltemos atrás. Dissemos que um país fica cego se não avaliar sistematicamente o nível alcançado pelos seus alunos. Percebemos que essa avaliação deve ser válida e fiável. Ou seja, o seu objetivo geral é sempre conhecer com a maior validade e fiabilidade possíveis o nível de conhecimentos e capacidades que os alunos alcançam. E percebemos que há vários tipos de avaliação: nomeadamente avaliação local, feita numa turma ou dirigida a um grupo de alunos e organizada pelos professores, ou nacional, que é o caso das provas de aferição, provas finais de ciclo ou exames.
Estes dois tipos de avaliação entreajudam‑se. Na ausência de uma avaliação nacional, não só se desconhece o estado da educação de um país, como os professores nas escolas perdem uma referência normativa nacional que é dada pelas provas e exames nacionais.