Professional Documents
Culture Documents
Avaliação
Avaliação
Adriana BauerI
Ocimar Munhoz AlavarseI
Romualdo Portela de OliveiraI
Resumo
Palavras-chave
Educ. Pesqui., São Paulo, v. 41, n. especial, p. 1367-1382, dez., 2015. http://dx.doi.org/10.1590/S1517-9702201508144607 1367
Large-scale assessment: debate systematization
Adriana BauerI
Ocimar Munhoz AlavarseI
Romualdo Portela de OliveiraI
Abstract
Keywords
1368 http://dx.doi.org/10.1590/S1517-9702201508144607 Educ. Pesqui., São Paulo, v. 41, n. especial, p. 1367-1382, dez., 2015.
Introdução Com algumas exceções que tiveram maior
repercussão, como os livros de Diane Ravitch
As reformas educativas implantadas nas (2010) e o de Almerindo Afonso (2000), a
últimas décadas caracterizam-se por um conjunto contribuição internacional ao debate a respeito
de medidas que articulam os seguintes aspectos: de avaliações em larga escala é praticamente
a) centralização dos sistemas de avaliação, ausente no debate brasileiro acerca do tema,
que passam a ser utilizados como instrumentos de com predominância da difusão de posições
gestão e alimentam políticas de responsabilização críticas a estas.
aliadas a desenhos censitários de avaliação externa; Por outro lado, há trabalhos de autores
b) descentralização dos processos de gestão que não negam a contribuição das avaliações
e financiamento, que fortalecem o discurso da em larga escala e das medidas educacionais
autonomia e da gestão democrática da escola, como norteadoras de políticas e programas
numa perspectiva de melhoria dos resultados, o que educacionais, mas que se contrapõem ao modo
inclui a autonomia financeira para buscar novas como estas têm se difundido no território
fontes de recursos, que não as fontes públicas nacional, bem como ao uso que vem sendo
tradicionais, e novas formas de gerenciamento feito de seus resultados, como encontramos,
da educação pública, o que inclui autonomia de entre outros autores, em Freitas (2013); Sousa,
gestão financeira e autonomia de gestão (school Oliveira (2010).
based management); Os autores deste trabalho reconhecem
c) ampliação das possibilidades de escolha a utilidade dessas avaliações, ainda que
(choice), estimulando mecanismos de competição questionem alguns de seus usos para a gestão,
entre as escolas, o que induziria à melhoria de por exemplo, como critério para alocação de
sua qualidade; e recursos nas escolas com melhores resultados,
d) valorização dos resultados e busca de a definição de bônus para professores, o
maior efetividade do serviço ofertado (school estabelecimento de rankings estimulando a
effectiveness) (Cf. BONAMINO, 2013; LEVIN, 2001; competição entre escolas e redes de ensino entre
OLIVEIRA, 1999, 2000). outros, e seu entendimento como indicador
Ainda que estas características tenham único e principal de qualidade de ensino (Cf.
se difundido de modo peculiar em cada país, OLIVEIRA, 2013; BAUER, 2010; 2012; 2013;
e que nem sempre apareçam ao mesmo tempo MACHADO; ALAVARSE, 2014).
em todas as reformas implantadas, no caso Assim sendo, o objetivo deste artigo é
brasileiro é bastante evidente a difusão e discutir as principais críticas às avaliações em
ampliação de avaliações que têm como traço larga escala presentes na literatura nacional
comum a utilização de provas padronizadas, e internacional e sistematizar o debate em
aplicadas em larga escala, configurando torno dos possíveis usos de seus resultados.
nitidamente um processo de avaliações Para tanto, organizamos o texto a partir de
externas, com crescente importância no dois aspectos recorrentes na literatura: 1. O
desenho das políticas educacionais de todos papel e a validade das avaliações em larga
os entes federados. escala nas reformas educacionais, em que
A aceitação de tais avaliações, entre discutiremos, também, a fundamentação e
nós, longe está de ser consensual. Ao contrário, conceituação dos testes em larga escala; e 2.
ainda encontramos parcelas significativas O uso dos resultados das avaliações em larga
da comunidade acadêmica e educacional escala, para a gestão do sistema escolar e das
que, de maneira geral, desconsideram as escolas em particular, abrangendo o que os
eventuais contribuições que podem se originar sistemas de ensino e as escolas realizam com
das medidas educacionais em larga escala. os resultados de suas avaliações.
Educ. Pesqui., São Paulo, v. 41, n. especial, p. 1367-1382, dez., 2015. 1369
O papel das avaliações em dos níveis de aprendizagem dos alunos (Cf.
larga escala nas reformas CASASSUS, 2013; CASTRO, 2009; FERRER;
educacionais ARREGUI, 2003; MONS, 2009). Tal controle tem
sido exercido por meio dos resultados obtidos
O papel de destaque da avaliação pelos estudantes em provas padronizadas e
padronizada nas políticas públicas educacionais, comparáveis ao longo do tempo, considerados
geralmente, aparece justificado pela necessidade evidência empírica dessa qualidade (Cf.
de mudança nas concepções de gestão na CASASSUS, 2013). Dessa forma, as avaliações
educação pari passu à mudança nas organizações propiciariam informação, diagnóstico,
em geral. Ao se passar do controle burocrático regulação, monitoramento e controle (tanto
e hierárquico do modo de execução para o do indivíduo quanto do sistema educacional)
controle do produto, as testagens revelaram-se e legitimação das políticas (Cf. AFONSO,
instrumentos bastante adequados na educação. 2000; BONAMINO, 2001; BROADFOOT, 1996;
Além de possibilitar uma redução do pessoal CASTRO, 2009a; HOUSE, 1998; KELLAGHAN;
total envolvido com o controle dos processos GREANEY, 1992).
educativos, essa mudança permitiu o que Lícinio Outros argumentos favoráveis à adoção
Lima (2011) chamou de “administração por de avaliações padronizadas em larga escala
controlo remoto” dos sistemas de ensino. De nas políticas educacionais realçam, ainda que
fato, quem controla a avaliação, à medida que potencialmente, que essas avaliações:
essa ganha importância na definição da alocação 1. Responsabilizam professores e
de recursos, dos salários etc., torna-se mais escolas pelos resultados obtidos, sendo
poderoso. Assim sendo, por meio das avaliações, essa responsabilização considerada um dos
busca-se o poder de induzir o(s) outro(s) a fazer maiores benefícios das políticas avaliativas. A
o que se deseja. Ademais, possibilita um discurso prestação de contas do trabalho realizado nas
progressista, agora reconceituado, de possibilitar unidades escolares e a responsabilização de
a autonomia da escola, a descentralização da gestores e professores pelos resultados, fariam
gestão, a participação etc. Não é coincidência que com que esses ficassem mais comprometidos
algumas reformas ancoradas no fortalecimento em melhorar sua prática e garantir o
dos mecanismos de testagens em larga escala aprendizado dos alunos, de acordo com os
defendam medidas democratizadoras da gestão, padrões estabelecidos, ao mesmo tempo em
como a eleição de diretores etc. que poderiam relativizar a responsabilidade
Configura-se assim um novo discurso dos governantes (Cf. EVERS; WALBERG,
acerca da gestão da escola pública, posto que as 2002; MADAUS; RUSSELL; HIGGINS, 2009;
testagens propiciam melhor gerenciamento dos MONS, 2009);
recursos disponíveis (a partir da possibilidade de 2. Instauram uma cultura de avaliação
auxiliar no direcionamento dos investimentos dos serviços públicos e de transparência sobre
na escola pública), bem como pela demanda por seus processos e resultados;
dados educacionais e sobre as aprendizagens 3. Com a publicização dos resultados
a serem utilizados para a melhoria do ensino obtidos pelos estudantes nessas avaliações,
público (Cf. AFONSO, 1998; BARRERA, 2000; permite-se que os pais acompanhem como
CASTRO, 2009a; KLEIN; FONTANIVE, 1995; os alunos de uma determinada escola estão
VIANNA, 2003). se desenvolvendo, possibilitando que façam
Assim, após a virtual universalização escolhas sobre os estabelecimentos de ensino de
do acesso ao ensino fundamental, as testagens preferência para que os filhos estudem, ao mesmo
seriam a chave para se verificar a qualidade tempo em que este processo pressionaria as
do ensino, entendida apenas como elevação escolas a melhorar;
1370 Adriana BAUER; Ocimar Munhoz ALAVARSE; Romualdo Portela de OLIVEIRA. Avaliações em larga escala: uma...
4. Produzem diversas comparações entre 7. Podem responsabilizar os próprios
alunos de uma mesma escola e entre alunos estudantes por sua aprendizagem, desafiando-
de diferentes escolas da região ou, até mesmo, os constantemente a melhorar seus resultados
do país, que não seriam possíveis se elas não e possibilitando que se criem incentivos
existissem. Da mesma forma, em nível de rede de para melhorar as aprendizagens (Cf. EVERS;
ensino, um determinado gestor poderá comparar WALBERG, 2002);
o desempenho das escolas de sua rede com as 8. Impulsionam mudanças em currículos
de outros municípios, estados e com as médias inadequados (Cf. MADAUS; RUSSELL; HIGGINS,
nacionais. Tais comparações são importantes em 2009); e
contextos em que há uma matriz de referência 9. Subsidiam programas de melhoria
ou um currículo básico comum; referentes à idade de ingresso no ensino
5. São, por natureza, mais neutras e superior, com vistas a obter-se maior equidade
objetivas e, normalmente, corrigidas com nos resultados (Cf. EVERS; WALBERG, 2002).
a utilização de programas computacionais, Entretanto, há os que se posicionam
possibilitando manter o anonimato dos estudantes criticamente a respeito do papel político das
e minimizando a subjetividade inerente às avaliações externas. Para alguns, como Arelaro
correções realizadas pelos professores em sala (2003) e Esteban (2012), tais avaliações vêm
de aula. Além disso, o processo de elaboração responder a pressões para mudanças nos
de itens e instrumentos, usualmente, envolve modos de administração e controle das redes de
especialistas para a eliminação de imperfeições ensino, estando aliadas a um novo modelo de
e vieses de resposta e para garantir sua validade gestão educacional (nova gestão pública). Tais
– medir o que se deseja medir. Nesse sentido, a pressões, oriundas de organismos multilaterais,
busca pelo aprimoramento da dimensão técnica seriam no sentido de impor uma agenda
das avaliações, principalmente da validade dos educacional transnacional.
testes e das técnicas de análise dos resultados, Há também os que criticam as avaliações
conferir-lhes-ia, segundo alguns autores, como, estandardizadas devido ao papel que têm
por exemplo, Fernandes; Gremaud (2008), assumido no direcionamento de políticas
maior precisão e credibilidade dos resultados. de responsabilização e prestação de contas
Essa discussão técnica foi bastante enfatizada (accountability), principalmente quando passam
na literatura dedicada ao tema no início da a compor políticas de alto impacto (high stakes
expansão e consolidação de diversas avaliações; tests), como, por exemplo, a atribuição de
6. Garantem a constituição de bases de bônus e/ou premiação a professores e escolas1
dados objetivos e de um sistema de informações (Cf. FERRER, 1996; FREITAS, 2013).
que possibilitam acompanhar a evolução da Assim, como as avaliações padronizadas
educação e favorecem a tomada de decisões em larga escala possuem um papel político
no âmbito educacional das políticas públicas que não pode ser desconsiderado, ganha
com maior consistência. Além disso, o posterior importância a análise tanto de suas finalidades
estudo e análise desses dados, em relação a e propósitos quanto dos efeitos que essas
fatores diversos, tanto referentes a características podem ter nos sistemas educativos em que
dos sujeitos (etnia, nível socioeconômico, sexo, são aplicadas (Cf. BROADFOOT, 1996; COSTA,
background cultural etc.), quanto com relação 1998; OZGA, 2000). Como ilustra Patrícia
às características das escolas, do professorado, Broadfoot (1996, p. 12-13):
das redes de ensino, podem subsidiar o 1- Popham (1987) utilizou o termo high stakes para referir-se a testes
desenvolvimento de programas educacionais cujos resultados tinham consequências severas sobre os alunos.
Complementarmente, o termo low stakes é utilizado para caracterizar testes
específicos, com vistas à melhoria dos resultados padronizados que não têm consequências sobre a população avaliada,
obtidos (Cf. CASTRO, 2009b); direta (alunos) ou indiretamente (professores, gestores etc.).
Educ. Pesqui., São Paulo, v. 41, n. especial, p. 1367-1382, dez., 2015. 1371
A maior parte da literatura sobre avaliação que aplicam os testes, associadas, aliás, à venda
de desempenho se preocupa com as técnicas de materiais didáticos.
de avaliação. Enquanto muitos estudos Hagopian (2014) salienta que, acopladas
se preocupam com o desenvolvimento aos programas No child left behind, da
e refinamento de diferentes abordagens administração Bush, e Race to the top, no
de medida educacional, muitos outros governo Obama, as avaliações em larga escala
oferecem poderosas críticas às técnicas constituíram-se em um instrumento para impor
de avaliação de desempenho e falhas um modelo de reforma educacional que, em
dessas mesmas técnicas quando aplicadas. seus resultados, aprofundam as desigualdades
[...] Então, poderosos e intensos debates educacionais entre os alunos com desvantagens
sobre técnicas concorrentes, os quais têm e entre aqueles provenientes de comunidades
tradicionalmente caracterizado a pesquisa pauperizadas, como é o caso de alunos negros.
sobre avaliação educacional auxiliaram Para o autor, não bastando essas consequências,
a excluir da discussão à questão mais que desmascaram as propaladas intenções dos
fundamental relacionada aos propósitos e reformadores de aumentar a equidade, os testes
efeitos dessa atividade. trouxeram pressões sobre professores e gestores
de escolas, atualizando o que se convencionou
A preocupação com os propósitos e efeitos denominar de accountability.
das avaliações, ou com o debate educacional Hagopian (2014), ao recuperar o fio
mais amplo, tem sido alvo de diversos estudos condutor da obra, sublinha a resistência aos testes
e reflexões, mesmo porque os propósitos de alto impacto que começa a ganhar corpo não só
condicionam as opções de técnica a ser utilizada e, entre professores, mas, especialmente, envolvendo
consequentemente, condicionam a interpretação alunos, pais e gestores de escolas e de redes. Esse
e o uso que será feito de seus resultados. movimento, sem negar a importância da avaliação
Para avançarmos nessas análises e dado para o trabalho pedagógico, tem, entre outros
o lugar privilegiado que as avaliações em larga aspectos, procurado evidenciar as limitações que
escala têm nos Estados Unidos da América tais testes possuem intrinsecamente, pelo modo
(EUA), incluindo seu poder indutor em todo como são construídos e validados, e, sobretudo,
o mundo, pode-se destacar o livro More than pelo tipo de orientação e legitimação de política
a score: the new uprising against high-stakes educacional que ignora as principais variáveis do
testing, editado por Jesse Hagopian (2014), processo educacional e que se voltam contra os
sintomaticamente, apresentado por Diane professores, considerados nessas políticas como
Ravitch, introduzido por Alfie Kohn e posfaciado os únicos responsáveis pelos resultados escolares.
por Wayne Au, autores estadunidenses que têm Embora produzindo mais de uma década
se notabilizado por apresentarem um conjunto antes, ainda que sem um posicionamento
de objeções aos testes de alto impacto, quadro cabalmente contrário aos testes de alto impacto,
que seria agravado pelo alcance dos mesmos Stecher (2002), ao estudar a experiência dos EUA
pelo fato de serem avaliações externas. No livro, e estabelecer um tipo de estado da arte dos efeitos
que reúne um conjunto de aportes que retratam dos testes, considera que os mesmos podem ter
o movimento de resistência aos testes de alto efeitos positivos, negativos e até mesmo nulos
impacto nos EUA, Hagopian (2014, p. 7-27), em ou ambíguos. O autor diferencia os impactos em
seu prefácio, destaca que a disseminação dos quatro níveis – alunos, professores, gestores de
testes se fez em nome de reformas da educação escolas e gestores de redes –, demarcando que
pública, tendo à sua frente grandes interesses esses últimos são os que, em última instância,
econômicos, quer do ponto de vista da direção têm a possibilidade de adotar – ou não – os testes
da nação, quer do ponto de vista das empresas como um elemento de suas políticas educacionais.
1372 Adriana BAUER; Ocimar Munhoz ALAVARSE; Romualdo Portela de OLIVEIRA. Avaliações em larga escala: uma...
Stecher (2002, p. 99-100), contudo, indica seja a avaliação mais importante da escola
a necessidade de aprofundamentos investigativos para o autor.
a respeito da disseminação desses testes, pois: Para Nevo (1995), no entanto, as políticas
educacionais precisariam favorecer e criar
O efeito líquido de testes de alto impacto condições para esse diálogo. Deveriam começar
sobre a política e a prática é incerto. Os pelo reconhecimento de que se as avaliações
pesquisadores não têm documentado externas podem contar com pessoal mais
as consequências desejáveis – de mais especializado tecnicamente e trazer resultados
instrução, trabalho com mais afinco e decorrentes de um olhar menos condicionado
trabalho mais eficaz –, tão claramente pelas rotinas da escola e, portanto, de maior
como as indesejáveis – alinhamento amplitude, podendo envolver comparações
curricular negativo, alocação negativa com um conjunto de escolas, essas avaliações
do tempo de aula para enfatizar tópicos não gozam, via de regra, de reconhecimento
abordados por um teste, treinamento acentuado no processo de trabalho de cada
excessivo, e “trapaça”. Mais importante, os uma das escolas, algo que só uma avaliação
pesquisadores não têm, em geral, medido interna dispõe, ainda que à custa de menor
a extensão ou magnitude das mudanças precisão sobre alguns objetos de avaliação.
na prática que eles identificam como um Nesses termos, até mesmo para que a ideia de
resultado de testes de alto impacto. avaliação formativa possa ser posta em prática,
No geral, as evidências sugerem que os o autor defende que ambas as avaliações se
testes em larga escala de alto impacto têm complementam, superando suas limitações e
sido uma política relativamente potente adicionando suas potencialidades.
em termos de trazer mudanças dentro das Deve-se considerar, ainda, que no debate
escolas e salas de aula. [...] Vai demorar e na literatura há questionamentos em torno
mais tempo e mais pesquisa para determinar da validade, da adequação dos instrumentos
que os impactos positivos no ensino e no utilizados e da confiabilidade dos resultados
aprendizado do aluno superam os negativos. relativos às avaliações padronizadas. Tais
questionamentos colocam em dúvida o que
David Nevo (1995), mesmo são capazes de medir e da própria medição, em
reconhecendo que muitas das avaliações termos de aprendizagem dos alunos, o cerne
externas estão inseridas em políticas daquilo para o que foram projetadas e com
educacionais que ignoram em suas formulações a precisão anunciada de seus resultados (Cf.
as necessidades das escolas, trabalha com a BROADFOOT, 1996; CASASSUS, 2013).
necessidade e a possibilidade de diálogo entre Se tais dúvidas apontam para a
as avaliações externas e as avaliações internas necessidade de discussão de aspectos técnicos,
– estas conduzidas pelos professores ou consideramos que esta deveria ser realizada em
pelos profissionais da educação –, pois cada conjunto com a discussão sobre os objetivos
uma das avaliações possuem potencialidades das avaliações, sua disseminação e usos dos
e limitações, ressaltando, entretanto, que resultados. O debate técnico, inclusive para que
esse diálogo deve ser baseado na escola. As se garanta a meta-avaliação dessas avaliações,
avaliações internas poderiam ser identificadas exigência decorrente da necessidade de
como avaliações institucionais, conduzidas controle social sobre as mesmas, como destacou
com vistas ao conjunto de elementos que Alavarse (2013, p. 148), forçosamente deve ser
caracterizam o trabalho escolar, não se aliado ao debate pedagógico, a fim de que
restringindo, necessariamente, à avaliação da ajustes pudessem ser realizados em prol da
aprendizagem de seus alunos, ainda que essa consolidação de avaliações mais significativas,
Educ. Pesqui., São Paulo, v. 41, n. especial, p. 1367-1382, dez., 2015. 1373
ou seja, cujos resultados pudessem alimentar Tentando entender essa aparente
debates e impulsionar o desenvolvimento do contradição, alguns autores têm alertado para o
sistema educacional. fato de que urge recuperar o sentido de avaliar
Outra questão que tem sido discutida os sistemas educacionais e analisar os modelos
é a da seleção dos conteúdos e habilidades que têm sido utilizados para essas avaliações.
que embasam essas avaliações, bem como a Há quem argumente que os resultados das
definição de níveis ou padrões de rendimento, provas não têm tido o impacto esperado na
tanto em seu caráter técnico – o que medir, como melhoria da qualidade do sistema educacional,
medir e como avaliar os resultados –, quanto porque as avaliações configuram-se em
pedagógico – as interpretações em relação ao modelos cuja prioridade é medir o rendimento
conteúdo de ensino e suas condições. Nesse dos alunos e não avaliar2 o sistema como um
sentido, tem-se questionado as orientações todo. A inexistência de clareza a respeito dos
na elaboração das matrizes e na definição de objetivos da avaliação e a dificuldade de definir
parâmetros de avaliação, como são os pontos de e produzir consenso em torno de padrões de
corte em relação às escalas de medida, elementos qualidade claros, que permitam comparar
que não, necessariamente, seriam condizentes longitudinalmente os resultados obtidos e que
com as necessidades sociais e possibilidades de possam ser utilizados para analisar as possíveis
desenvolvimento dos alunos (Cf. BROADFOOT, mudanças que se operam a partir das políticas
1996; CASASSUS, 2013; IAIES, 2003). e programas implementados, faz com que
Ademais, tem se alertado para o fato a preocupação recaia sobre os resultados
de que a definição de padrões (standards) de das provas e sua dimensão técnica, não se
proficiência gera um empobrecimento curricular, enfatizando as análises contextuais que
impulsionando redes de ensino a direcionarem permitiriam um melhor entendimento da
esforços para garantir o ensino do que é situação educacional e uma intervenção mais
cobrado nas avaliações, deixando de lado outros efetiva, como destacou Iaies (2003, p. 18),
conteúdos fundamentais para a educação básica para quem
das crianças e adolescentes em idade escolar (Cf.
HYPÓLITO, 2013; SANTOS, 2013). Os sistemas educativos deixaram de
É possível encontrar, também, na trabalhar para melhorar a qualidade e a
literatura de referência, questionamentos acerca equidade educativa e passaram a trabalhar
do potencial de as avaliações em larga escala para o melhoramento dos resultados
melhorarem a qualidade do ensino, visto que, das avaliações. [...] Os dispositivos e
apesar dos esforços realizados, especialmente seus produtos têm tido maior impacto
pelos países latino-americanos, os dados obtidos na construção do imaginário educativo
por meio dessas avaliações mostram que pouco da sociedade, que na transformação das
tem se alterado no quadro educacional da estratégias educativas.
maioria dos países que as empregam enquanto
instrumento de gestão (Cf. TEDESCO, 2003). A Nesse sentido, há críticas que apontam
isso se soma a própria definição do que seria que as decisões tomadas a partir dos resultados
a qualidade da educação e as possibilidades obtidos, muito relacionadas à redefinição
e termos de sua mensurabilidade, produzindo de conteúdos curriculares, na formulação
polêmicas adicionais que, no caso brasileiro, de indicadores de uma boa educação, da
envolvem o Índice de Desenvolvimento da 2- A diferenciação entre avaliação e medida tem sido alvo de atenção de
Educação Básica (IDEB), como se encontra, inúmeros pesquisadores da área e pode ser encontrada em Vianna (2000).
A avaliação consiste em um processo mais amplo que pode tomar a medida
entre outras fontes, em Machado; Alavarse como uma de suas dimensões, mas se associa à elaboração de juízos de
(2014) e Oliveira (2011, 2013). valor sobre a medida e a proposição de ações a partir dela.
1374 Adriana BAUER; Ocimar Munhoz ALAVARSE; Romualdo Portela de OLIVEIRA. Avaliações em larga escala: uma...
definição de competências e habilidades a serem e professores ou, até mesmo, o fechamento de
desenvolvidas nos alunos, parecem não ecoar na escolas ou sua maior supervisão pelo Estado,
escola, não tendo sentido para aqueles que, em entendida como perda de autonomia;
última instância, fazem as reformas acontecerem, 2. As avaliações em larga escala
ou seja, os professores e técnicos escolares. Essas interferem na autonomia dos docentes,
avaliações, em geral, não atentam para outras influenciando até mesmo a forma como os
demandas que as escolas enfrentam, como as conteúdos são ensinados;
necessidades sociais do público que tem acessado 3. Provas padronizadas e rankings
a escolarização formal e que, anteriormente, incentivam a competição entre escolas e alunos,
estava excluído dela (Cf. OLIVEIRA, 2007, 2011), substituindo o aprendizado pela melhoria nos
as características de formação dos profissionais resultados em provas, gerando processos de
que se dedicam à educação, a garantia de ensinar para os testes, o que, no limite, substitui
condições de educabilidade mínimas, para que os o aprendizado pela difusão de macetes que
estudantes possam produzir suas aprendizagens potencializam os resultados (SANTOS, 2013);
(Cf. IAIES, 2003). 4. As avaliações externas padronizadas,
Dessa forma, haveria uma distância usualmente realizadas em um ou dois dias, não
entre as considerações técnicas que embasam consideram fatores externos que podem afetar
a avaliação e o debate político-educacional que o desempenho dos alunos. Há estudos que
precisa ser enfrentado tanto na escola como nos mostram que muitos alunos não apresentam
níveis centrais, pelos gestores do sistema. Como bom desempenho em testes com itens de
provoca Iaies (2003, p. 20-21), múltipla escolha, bem como que os resultados
dos alunos são influenciados por fatores como
Construíram-se indicadores que se definiram ansiedade, por exemplo;
tecnicamente, e que consideram quase com 5. As avaliações podem gerar o
exclusividade as habilidades acadêmicas. fenômeno do afunilamento curricular, levando
Nossos índices não consideram o aumento os professores a ensinar somente os conteúdos
das taxas de escolarização, a capacidade cobrados nas provas, sem se preocupar em
do sistema para homogeneizar atores de desenvolver outros conteúdos e habilidades
uma sociedade cada dia mais segmentada, importantes à formação dos alunos (Cf.
dar conta dos novos públicos que a escola MADAUS; RUSSEL; HIGGINS, 2009);
tem sido capaz de abrigar, da capacidade 6. As avaliações são parciais,
de conter outras realidades sociais, etc. E normalmente realizadas para poucas disciplinas
essas definições implicam uma tomada de curriculares, e não conseguem captar o
postura ideológica, utilizar umas variáveis crescimento geral no decorrer do ano letivo,
e abandonar outras; o certo é que a induzindo, se muitos valorizados os resultados,
experiência dos '90 faz pensar mais em uma ao afunilamento curricular (Cf. BAUER, 2013;
“não tomada” de posição política, no sentido MADAUS; RUSSELL; HIGGINS, 2009);
de que os tomadores de decisões não se 7. Produzem injustiças relativas à
posicionaram nesse ponto. bonificação de professores e premiação das
melhores escolas (Cf. BAUER, 2012; BROOKE,
Outros argumentos contrários às 2013; FREITAS, 2013; SOUSA, 2008);
avaliações padronizadas que aparecem na 8. A pressão para melhoria de resultados
literatura, consideram que: pode levar os dirigentes escolares a tomar
1. A responsabilização de professores decisões sobre o gerenciamento dos tempos e
e escolas pode levar a medidas punitivas conteúdos a serem ensinados que podem ter
injustas, como a perda do emprego de gestores influência negativa sobre professores e alunos
Educ. Pesqui., São Paulo, v. 41, n. especial, p. 1367-1382, dez., 2015. 1375
(Cf. MADAUS; RUSSELL; HIGGINS, 2009). política e ideológica em torno do assunto,
Dentre as ações que as escolas podem realizar o que sublinha o caráter político dessas
para melhorar os resultados estão a recusa de avaliações. Considere-se, assim, primeiramente,
matrícula a alunos de baixo rendimento ou a dimensão que relaciona os usos dos resultados
que necessitem de atendimento educacional à sua divulgação e disseminação, consideradas
especializado ou utilização de mecanismos de bastante marcadas política e ideologicamente.
transferência de alunos de baixo rendimento Ainda que divulgar e disseminar
(Cf. BROADFOOT, 1996; OLIVEIRA et al., 2013); os resultados obtidos seja de fundamental
9. Os estudantes e professores, ao importância para fomentar a discussão a
se sentirem pressionados pela situação de respeito de uma dimensão da qualidade da
avaliação, podem sofrer problemas de saúde educação e, até mesmo, propiciar que escolas
(aumento dos níveis de stress) e, ainda, sentirem- e gestores obtenham dados e informações
se desmotivados ou criar um sentimento para subsidiar a tomada de decisões, ao nível
negativo em relação à escola (Cf. FARBER, local ou regional, observa-se que as práticas
2010; MADAUS; RUSSELL; HIGGINS, 2009); e de publicização e disseminação das avaliações
10. Na busca por melhores resultados, padronizadas são amplamente discutidas.
podem induzir o aumento na desigualdade, Por um lado, encontram-se os defensores
posto que investir mais nos melhores alunos da publicização dos resultados e, até mesmo,
parece mais promissor do que enfrentar as dos ranqueamentos, que consideram que tais
dificuldades de aprendizado dos alunos com práticas dão transparência para o público,
piores resultados (Cf. OLIVEIRA et al., 2013). evidenciando a forma como as instituições
Estes argumentos indicam que se os atuam e utilizam os recursos públicos, como em
resultados das avaliações em larga escala Castro (2007).
forem sobrevalorizados, suas eventuais Cabe destacar que, considerando
contribuições podem ser sobrepujadas por os aspectos técnicos das avaliações, as
indução de resultados indesejáveis ou mesmo generalizações são muitas vezes indevidas
deletérios para escolas, redes de ensino, alunos e a divulgação dos resultados brutos, sem os
e profissionais da educação. necessários detalhamentos, não se sustentam,
Entretanto, o papel que essas avaliações pois impedem que auxiliem na gestão dos
efetivamente assumirão no conjunto da política sistemas educacionais como um todo (Cf.
educacional é determinado pelos usos dos seus BRITZ, 2003; KLEIN; FONTANIVE, 1995). Britz
resultados, algo que ou não é definido a priori (2003, p. 94) alerta para possíveis problemas na
de modo mais completo ou sequer é cogitado na divulgação dos resultados na forma como vem
adoção de avaliações em larga escala. Assim, sendo realizada e aponta, como consequência,
dada sua relevância, é pertinente a análise de a limitação do uso da informação, bem
como a literatura trata os usos dos resultados como a tendência de recuo na divulgação de
das avaliações em larga escala. informações para os meios de comunicação em
massa, dado que:
O caráter político das avaliações
em larga escala A massificação dos indicadores impedirá
de circunscrever seu uso ao âmbito para
Dentre as muitas dimensões deste debate, o qual foram desenhados: cada vez mais
encontra-se a influência da divulgação dos será usado como um ranking para tomar
resultados sobre os seus usos, a relação entre decisões imediatas pela família, cada vez
os objetivos das avaliações e as informações terá mais sentido transformá-lo em base de
por elas produzidas, bem como a discussão um debate político. Esta desnaturalização
1376 Adriana BAUER; Ocimar Munhoz ALAVARSE; Romualdo Portela de OLIVEIRA. Avaliações em larga escala: uma...
dos alcances dos indicadores finalmente escolas, podendo apoiar a tomada de decisões
pode levar ao imobilismo: estariam em seu interior (Cf. EVERS; WALBERG, 2002;
dispostas as autoridades a seguir dando MADAUS; RUSSELL; HIGGINS, 2009);
transparência a sua gestão sem que os 3. Produzem, para comunidades,
instrumentos se voltem contra si? Estariam informações sobre a qualidade do ensino
dispostos os instrumentos de comunicação nas escolas, em relação aos componentes
a não disporem destes dados? curriculares avaliados, auxiliando os pais a
tomar decisões bem fundamentadas sobre onde
Complementarmente, Brunner (2003, p. desejam que seus filhos estudem (Cf. EVERS;
81-82), ao analisar a divulgação dos resultados WALTBERG, 2002);
das avaliações, especialmente nos jornais e 4. Fariam com que professores e
periódicos, salienta que estes não atentam para alunos buscassem melhorar seu desempenho,
a complexidade dos resultados e o contexto vinculadas com políticas de premiação a elas
onde são produzidos. Para o autor, os periódicos associadas, como motivação extrínseca (Cf.
MADAUS; RUSSELL; HIGGINS, 2009); e
[…] se limitam a ressaltar unidimensional- 5. Teriam potencial para manter
mente os produtos finais destes processos – a professores e escolas responsáveis pelo
saber, os resultados enquanto pontuação – e aprendizado de todos os alunos, à medida que
a organizá-los em um esquemático ranking os informam acerca dos alunos que não estão
de países ou tipos de estabelecimento, aprendendo conforme o esperado (Cf. EVERS;
suprimindo toda referência ao contexto WALTBERG, 2002).
onde se obtêm estes resultados. Com isso,
se banaliza a informação que aportam Há ainda autores que discutem que algumas
os estudos nacionais e internacionais de implicações das avaliações sobre as redes e escolas
medida do rendimento escolar e, o que é não são, em essência, boas ou ruins, mas que podem
mais grave, se distorce a opinião pública e ter influências diferenciadas, a depender de cada
se limitam seus efeitos. contexto escolar. Segundo Madaus; Russell, Higgins
(2009, p. 3), por exemplo, nem sempre os testes têm
No que se referem às contribuições uma influência sobre escolas, professores e alunos,
dos resultados das avaliações em larga escala pois “alguns alunos e professores simplesmente
para as escolas e sistemas educativos, alguns ignoram os testes e continuam a fazer o que
aspectos positivos têm sido destacados na sempre fizeram”, corroborando apontamentos
literatura. Nessa perspectiva, as avaliações de Stecher (2002). Para Mons (2009), problemas
padronizadas: podem começar a surgir quando se utiliza o
1. Definem padrões e expectativas para resultado de avaliações locais (regionais, estaduais
o aprendizado dos alunos, podendo servir para ou municipais) para serem tanto ferramenta de
orientar o trabalho das escolas (Cf. BOMENY, gerenciamento quanto medida de efetividade dos
1997). Servem, assim, de guia ao planejamento resultados, visto que o uso gerencial pode gerar
dos professores, dando-lhes pistas sobre o consequências que deturpam o próprio dado obtido
que e quando ensinar aos alunos, apoiando nas avaliações locais.
o gerenciamento de sala de aula e evitando, No entanto, as críticas aos efeitos das
assim, perda de tempo didático (Cf. EVERS; avaliações externas nas escolas e nas redes de
WALBERG, 2002); ensino superam os argumentos favoráveis, pela
2. Mediante o emprego de testes e seus observação de que se concentram no uso dos
resultados, geram informações que ficam resultados associado a políticas de alto impacto.
disponibilizadas para os professores e as Diversos são os autores que se detêm na análise
Educ. Pesqui., São Paulo, v. 41, n. especial, p. 1367-1382, dez., 2015. 1377
de consequências negativas dos testes como, produzir informações que permitam superar
por exemplo, a tomada de decisões sobre a os usos políticos e ideológicos que vêm sendo
continuidade de estudos dos alunos, os recursos feitos dos resultados. Este debate contribuiria
financeiros a serem disponibilizados para as efetivamente para iluminar a problemática
escolas, a bonificação de professores, bem como educacional, possibilitando a realização de
outros usos relativos ao gerenciamento das redes ações que sejam direcionadas para a melhoria
escolares, contratação e demissão de gestores da educação, o que exige uma análise que
escolares, envio de recursos extras para escolas ultrapasse a comparação de resultados
de bom desempenho etc. (Cf. CASASSUS, 2013; quantitativos sobre níveis de aprendizagem, mas
MADAUS; RUSSELL; HIGGINS, 2009; MONS, que considere também aspectos curriculares, de
2009; RAVITCH, 2010). Ainda que se considere infraestrutura e de formação docente, dentre
que muitos desses resultados negativos não outros (Cf. ESQUINSANI, 2010; IAIES, 2003).
sejam intencionais, é importante salientar que É importante observar que apesar de
não se pode deixar de considerá-los no debate. muitos pesquisadores se dedicarem ao estudo
Além das críticas realizadas ao uso dos das avaliações de sistema e aos problemas delas
resultados das avaliações em políticas de alto decorrentes, estas reflexões parecem ter pouco
impacto, a leitura dos textos de referência impacto entre os gestores das políticas, visto que a
para este artigo permite afirmar que, em incorporação da crítica e uso dos conhecimentos
geral, as críticas referem-se a influências elaborados para a reorientação das avaliações
das avaliações sobre o currículo, o trabalho parece estar fora do rol de intenções dos
realizado pela escola e, inclusive, sobre as técnicos responsáveis pelo gerenciamento
abordagens metodológicas adotadas pelos das avaliações. Broadfoot (1996) ilumina essa
professores em sala de aula. Uma consequência questão identificando uma desarticulação, um
seria, por exemplo, que conteúdos e disciplinas distanciamento, entre os acadêmicos da área
não avaliados receberiam menor atenção de avaliação e os responsáveis pela definição
nas escolas, inclusive com a diminuição do das políticas, que se mantêm isolados em seus
tempo dedicado à sua aprendizagem, fenômeno respectivos campos de atuação.
conhecido como afunilamento curricular, em De fato, a maioria das avaliações
que há um direcionamento das práticas de sala externas em larga escala pretende medir o
de aula para preparar os alunos para obter bons nível de aprendizagem dos alunos brasileiros
resultados (Cf. BROOKE, 2013; CASASSUS, em determinadas disciplinas – normalmente,
2013; MADAUS; RUSSELL; HIGGINS, 2009). português e matemática – e correlacioná-
A valorização dos resultados educacionais, em lo a determinadas condições extra e
detrimento dos processos escolares pode, também, intraescolares que poderiam favorecer ou
incentivar professores e escolas a procurar não a aprendizagem nessas disciplinas. Mas,
estratégias para aumentar os resultados obtidos mensurar níveis de aprendizagem, a partir de
sem, necessariamente, melhorar o aprendizado determinados critérios, é o mesmo que medir
dos alunos (Cf. BROADFOOT, 1996). qualidade de ensino?
Apesar disso, é possível localizar
limites dos usos dos resultados das avaliações Conclusão: um convite à reflexão
relacionados às dimensões técnica, política e
ideológica, conforme apontado anteriormente. Apresentados os argumentos favoráveis
Fica claro que o debate a respeito das e contrários, é necessária uma breve reflexão
avaliações em larga escala deve ser encarado para julgar as avaliações em larga escala.
em sua complexidade, a fim de que os sistemas Certamente, as críticas não são desprezíveis.
já consolidados possam se desenvolver e Levantam problemas reais. Entretanto,
1378 Adriana BAUER; Ocimar Munhoz ALAVARSE; Romualdo Portela de OLIVEIRA. Avaliações em larga escala: uma...
majoritariamente, elas incidem sobre questões e professores a estímulos por melhoria a partir
relativas ao uso inadequado de seus resultados. de indicadores ancorados nessas avaliações pode
A preocupação com o conjunto do ter um sentido diverso do pretendido. Podem
sistema educacional coloca-nos questões estimular comportamentos perversos, dos quais
substantivas, certamente não respondidas pelo os mais conhecidos são a exclusão das populações
discurso da “autonomia da escola”. Se aceitarmos que se supõe terão os piores resultados, já
esse argumento estamos fazendo vistas grossas nos processos de matrícula, sua ocultação nos
às desigualdades já existentes. Ou seja, as dias de aplicação das provas, convidando-os
experiências escolares pregressas da população a não comparecerem, ou simplesmente uma
são diferenciadas, de modo que aquelas que amplificação das desigualdades no interior
tiveram menos ou nenhuma experiência anterior da escola, investindo-se mais nos alunos que
com a escola (em geral a parcela mais pobre e apresentem potencialmente perspectivas de
discriminada da sociedade) têm menos condições melhores resultados.
de formular uma crítica que induza a escola a Assim, diante do se poderia denominar de
melhorar. Ao contrário, as evidências indicam visão ingênua das virtudes das avaliações em larga
que essas populações tendem a ver a escola mais escala, inclusive porque constatamos características
positivamente, afinal, qualquer escola é melhor que deveriam ser suprimidas, consideramos que
que nenhuma. Assim sendo, cabe ao centro do essas avaliações têm potencialidades para produzir
sistema, seus administradores, se preocupar com avanços no conhecimento do universo educacional.
a redução da desigualdade e a garantia do direito Entendemos que podem, garantidas determinadas
ao aprendizado a todos. condições e adequada utilização, estabelecer
Da mesma forma, alimentar ilusões a pontos de apoio para políticas de melhoria dos
respeito do poder indutor das avaliações em larga sistemas educacionais no sentido da garantia do
escala é desconhecer que a resposta das escolas direito à educação a todos.
Referências
AFONSO, Almerindo. Avaliação educacional: regulação e emancipação: para uma sociologia das políticas educativas
contemporâneas. São Paulo: Cortez, 2000.
AFONSO, Almerindo. Políticas educativas e avaliação educacional. Braga: Universidade do Minho, 1998.
ALAVARSE, Ocimar Munhoz. Desafios da avaliação educacional: ensino e aprendizagem como objetos de avaliação para a
igualdade de resultados. Cadernos Cenpec, São Paulo, v. 3, n. 1, p. 135-153, jun. 2013.
ARELARO, Lisete Regina Gomes. Direitos sociais e política educacional: alguns ainda são mais iguais que outros. In: SILVA, Shirley;
VIZIM, Marli (Org.). Políticas públicas: educação, tecnologias e pessoas com deficiências. Campinas: Mercado de Letras, 2003.
p. 13-36. (Leituras no Brasil).
BARRERA, Susana. Políticas educacionais, qualidade da educação na América Latina e aporte da avaliação como ferramenta de
gerenciamento social. In: CONFERÊNCIA INTEGRAÇÃO E CONVERGÊNCIA ENTRE O MERCOSUR E A COMUNIDADE ANDINA DE
NAÇÕES, 2000, La Paz. Anais... La Paz: Instituto Internacional de Integração (I.I.I.), 2000.
BAUER, Adriana. É possível relacionar avaliação discente e formação de professores? Educação em Revista, Belo Horizonte, v.
28, n. 2, p. 61-82, jun. 2012.
BAUER, Adriana. Limites, desafios e possibilidades das avaliações de sistemas educacionais: contribuições do ciclo de debates
para as políticas de avaliação. In: BAUER, Adriana; GATTI, Bernadete A.; TAVARES, Marialva R. (Org.). Vinte e cinco anos de
avaliação de sistemas educacionais no Brasil: implicações nas redes de ensino, no currículo e na formação de professores.
Florianópolis: Insular, 2013. p. 281-294.
Educ. Pesqui., São Paulo, v. 41, n. especial, p. 1367-1382, dez., 2015. 1379
BAUER, Adriana. Usos dos resultados das avaliações de sistemas educacionais: iniciativas em curso em alguns países da América.
Revista Brasileira de Estudos Pedagógicos, Brasília, v. 91, n. 228, p. 315-344, maio/ago. 2010.
BOMENY, Helena (Org.) Avaliação e determinação de padrões na educação latinoamericana: realidades e desafios. São
Paulo: FGV, 1997.
BONAMINO, Alicia C. Avaliação educacional no Brasil 25 anos depois: onde estamos? In: BAUER, Adriana; GATTI, Bernardete A.
(Orgs.). Vinte e cinco de avaliação de sistemas educacionais no Brasil: origens e pressupostos. Florianópolis: Insular, 2013.
p 43-60.
BONAMINO, Alicia C. Tempos de avaliação educacional: o SAEB, seus agentes, referências e tendências. Rio de Janeiro: Quartet, 2001.
BRITZ, Pablo H. Indicadores y sus usos en educación: una tensión no resuelta. In: Unesco. Evaluar las evaluaciones: una mirada
política acerca de las evaluaciones de la calidad educativa. Buenos Aires: IIPE: Unesco, 2003. p. 85-95.
BROADFOOT, Patrícia. Education, assessment and society: a sociological analysis. Buckingham: Open University Press, 1996.
BROOKE, Nigel. Políticas estaduais de bonificação: buscando o diálogo. In: BAUER, Adriana; GATTI, Bernardete A. (Org.). Vinte e
cinco anos de avaliação de sistemas educacionais no Brasil: origens e pressupostos. Florianópolis: Insular, 2013. p. 119-146.
BRUNNER, José Joaquín. Límites de la lectura periodística de resultados educacionales. In: Evaluar las evaluaciones: una mirada
política acerca de las evaluaciones de la calidad educativa. Buenos Aires: IIPE: Unesco, 2003. p. 67-84.
CASASSUS, Juan. Política y metáforas: un análisis de la evaluación estandarizada en el contexto de la política educativa. In: BAUER,
Adriana; GATTI, Bernardete A.; TAVARES, Marialva R. (Org.). Vinte e cinco de avaliação de sistemas educacionais no Brasil:
origens e pressupostos. Florianópolis: Insular, 2013. p 21-46.
CASTRO, Maria H. G. A consolidação da política de avaliação da educação básica no Brasil. Meta: avaliação, Rio de Janeiro, v. 1,
n. 3, p. 271-296, set./dez. 2009a.
CASTRO, Maria H. G. O desafio da qualidade. In: ITUASSU, Arthur; ALMEIDA, Rodrigo de (Org.). O Brasil tem jeito?: educação,
saúde, justiça e segurança. v. 2. Rio de Janeiro: Jorge Zahar, 2007. p. 35-72.
CASTRO, Maria H. G. Sistemas de avaliação da educação no Brasil: avanços e novos desafios. São Paulo em Perspectiva, São
Paulo, v. 23, n. 1, p. 5-18, jan./jun. 2009b.
COSTA, Marta E. A avaliação de desempenho na área de língua na Argentina: a utilização de provas objetivas. In: CONHOLATO,
Maria Conceição; FERREIRA, Maria José do Amaral (Coord.). Sistemas de avaliação educacional. São Paulo: FDE, 1998. p.
39-88. (Ideias, n. 30).
ESQUINSANI, Rosemar Siqueira S. Performatividade e educação: a política das avaliações em larga escala e a apropriação da
mídia. Práxis Educativa, Ponta Grossa, v. 5, n. 2, p. 131-137, jul./dez. 2010.
ESTEBAN, Maria Teresa. Considerações sobre a política de avaliação da alfabetização: pensando a partir do cotidiano escolar.
Revista Brasileira de Educação, Rio de Janeiro, v. 17, n. 51, p. 573-592, set./dez. 2012.
EVERS, Williamson M.; WALBERG, Herbert J. School accountability. Stanford: Hoover Institution Press, 2002.
FARBER, Katy. Why great teachers quit: and how we might stop the exodus. Thousand Oaks: Corwin, 2010.
FERNANDES, Reynaldo; GREMAUD, Amaury Patrick. Qualidade da educação: avaliação, indicadores e metas. In: VELOSO, Fernando
et al. (Orgs.). Educação básica no Brasil: construindo o país do futuro. Rio de Janeiro: Elsevier, 2009. p. 213-238.
FERRER, Alejandro Tiana. Avaliação e mudança de sistemas educacionais: a interação que falta. In: SEMINÁRIO INTERNACIONAL
DE AVALIAÇÃO DA EDUCAÇÃO, 1996, Brasília, Anais... Brasília: MEC, 1996. p. 33-54.
FERRER, J. G.; ARREGUI, Patrícia. Provas internacionais de aprendizado aplicadas na América Latina e seu impacto na
qualidade da educação: critérios para futuras aplicações. Rio de Janeiro: Preal, 2003.
1380 Adriana BAUER; Ocimar Munhoz ALAVARSE; Romualdo Portela de OLIVEIRA. Avaliações em larga escala: uma...
FREITAS, Luiz C. Caminhos da avaliação de sistemas educacionais no Brasil: o embate entre a cultura da auditoria e a cultura da
avaliação. In: BAUER, Adriana; GATTI, Bernardete A.; TAVARES, Marialva R. (Org.). Vinte e cinco anos de avaliação de sistemas
educacionais no Brasil: origens e pressupostos. Florianópolis: Insular, 2013. p 147-176.
HAGOPIAN, Jesse (Ed.). More than a score: the new uprising against high-stakes testing. Chicago: Haymarket Books, 2014.
HOUSE, Ernest. Arranjos institucionais para avaliação. In: SEMINÁRIO INTERNACIONAL DE AVALIAÇÃO EDUCACIONAL, 1998,
Brasília. Anais... Brasília: MEC; Inep; Unesco, 1998.
HYPOLITO, Álvaro M. A necessária meta-avaliação das políticas de avaliação. In: BAUER, Adriana; GATTI, Bernardete A. (Org.). Vinte
e cinco anos de avaliação de sistemas educacionais no Brasil: origens e pressupostos. Florianópolis: Insular, 2013. P. 211-227.
IAIES, Gustavo. Evaluar las evaluaciones. In: Unesco. Evaluar las evaluaciones: una mirada política acerca de las evaluaciones de
la calidad educativa. Buenos Aires: IIPE; Unesco, 2003. p. 15-36.
KELLAGHAN, Thomas; GREANEY, Vicent. Using examinations to improve education: a study in fourteen African countries.
Washington, DC: World Bank, 1992.
KLEIN, Ruben; FONTANIVE, Nilma S. Avaliação em larga escala: uma proposta inovadora. Em Aberto, Brasília, v. 15, n. 66, p. 29-
34, abr./jun. 1995.
LEVIN, Benjamin. Reforming education: from origins to outcomes. New York: Routledge; Falmer, 2001. (Educational Change and
Development).
LIMA, Licínio C. Avaliação, competitividade e hiperburocracia. In: ALVES, Palmira; DE KETELE, Jean-Marie (Org.). Do currículo à
avaliação, da avaliação ao currículo. Porto: Porto, 2011. p. 71-82.
MACHADO, Cristiane; ALAVARSE, Ocimar Munhoz. Qualidade das escolas: tensões e potencialidades das avaliações externas.
Educação & Realidade, Porto Alegre, v. 39, n. 2, p. 413-436, abr./jun. 2014.
MADAUS, George; RUSSELL, Michael; HIGGINS, Jennifer. The paradoxes of high stakes testing: how they affect students, their
parents, teachers, principals, schools, and society. Charlotte: Information Age, 2009.
MONS, Nathalie. Theoretical and real effects of standardised assessment. [S.l.]: EACEA; Eurydice, 2009.
NEVO, David. School-based evaluation: a dialogue for school improvement. Oxford: Pergamon, 1995.
OLIVEIRA, Romualdo P. A utilização de indicadores de qualidade na unidade escolar ou porque o IDEB é insuficiente.
In: BAUER, Adriana; GATTI, Bernadete A.; TAVARES, Marialva R. (Org.). Vinte e cinco anos de avaliação de sistemas
educacionais no Brasil: implicações nas redes de ensino, no currículo e na formação de professores. Florianópolis: Insular,
2013. p. 87-100.
OLIVEIRA, Romualdo P. Da universalização do ensino fundamental ao desafio da qualidade: uma análise histórica. Educação e
Sociedade, Campinas, v. 28, n. 100, p. 661-690, out. 2007.
OLIVEIRA, Romualdo P. O direito à educação na Constituição de 1988 e seu reestabelecimento pelo sistema de Justiça. Revista
Brasileira de Educação, Rio de Janeiro, v. 11, p. 61-74, , maio/ago, 1999.
OLIVEIRA, Romualdo P. Reformas educativas no Brasil na década de 90. In: CATANI, Afrânio Mendes; OLIVEIRA, Romualdo P. (Org.).
Reformas educacionais em Portugal e no Brasil. Belo Horizonte: Autêntica, 2000. p. 77-94.
OLIVEIRA, Romualdo P. IDEB e trabalho pedagógico da escola: uma articulação possível? Revista Escola Pública, São Paulo, v.
especial, p. 76-92, 2011.
OLIVEIRA, Romualdo P. et al. Análise das desigualdades intraescolares no Brasil. Estudos e Pesquisas Educacionais, v. 4, p. 19, 2013.
OZGA, Jenny. Investigação sobre políticas educacionais: terreno de contestação. Porto: Porto, 2000.
POPHAM, W. James. The merits of measurement-driven instruction. Phi Delta Kappan, v. 68, n. 9, p. 679-682, 1987.
Educ. Pesqui., São Paulo, v. 41, n. especial, p. 1367-1382, dez., 2015. 1381
RAVITCH, Diane. The death and life of the great American school system: how testing and choice are undermining education.
New York: Basic Books, 2010.
SANTOS, Lucíola L. A avaliação em debate. In: BAUER, Adriana; GATTI, Bernardete A. (Org.). Vinte e cinco anos de avaliação de
sistemas educacionais no Brasil: origens e pressupostos. Florianópolis: Insular, 2013. p. 229-245.
SOUSA, Sandra Z. Ensino fundamental: avaliando as políticas de avaliação educacional. Brasília: MEC/INEP, 2003. Texto
apresentado no Seminário Avaliar para quê? Avaliando as políticas de avaliação educacional. Brasília, 08 abr. 2003.
SOUSA, Sandra Z. Avaliação e carreira do magistério: premiar o mérito? Revista Retratos de Escola, Brasília, v. 2, n. 2/3, p. 81-
93, jan./dez. 2008.
SOUSA, Sandra Z.; OLIVEIRA, Romualdo P. Sistemas estaduais de avaliação: uso dos resultados, implicações e tendências.
Cadernos de Pesquisa, São Paulo, v. 40, p. 793-822, 2010.
STECHER, Brian M. Consequences of large-scale, high-stakes testing on school and classroom practice. In: HAMILTON, Laura;
STECHER, Brian M.; KLEIN, Stephen P. (Ed.). Making sense of test-based accountability in education. Santa Monica: Rand,
2002. p. 79-100.
TEDESCO, Juan C. Prólogo. In: UNESCO. Evaluar las evaluaciones: una mirada política acerca de las evaluaciones de la calidad
educativa. Buenos Aires: IIPE/Unesco, 2003. p. 11-14.
VIANNA, Heraldo Marelim. Avaliação: considerações teóricas e posicionamentos. In: VIANNA, Heraldo Marelim. Avaliação
educacional: teoria, planejamento, modelos. São Paulo: Ibrasa, 2000. p. 21-46.
VIANNA, Heraldo Marelim. Avaliações nacionais em larga escala: análises e propostas. São Paulo: Fundação Carlos Chagas /
DPE, 2003. 41 p. (Textos FCC, 23).
Ocimar Munhoz Alavarse é professor no Departamento de Administração Escolar e Economia da Educação, da Faculdade de
Educação da Universidade de São Paulo, onde coordena o Grupo de Estudos e Pesquisas em Avaliação Educacional (Gepave).
Romualdo Portela de Oliveira é professor Titular no Departamento de Administração Escolar e Economia da Educação,
da Faculdade de Educação da Universidade de São Paulo, pesquisador 1D do CNPq, membro da coordenação de Ciências
Humanas 3 (Educação e Psicologia) da FAPESP e Coordenador de Educação da Capes.
1382 Adriana BAUER; Ocimar Munhoz ALAVARSE; Romualdo Portela de OLIVEIRA. Avaliações em larga escala: uma...
Gênero, raça e avaliação escolar
RESUMO
ABSTRACT
GENDER, RACE AND SCHOOL EVALUATION: A STUDY WITH LITERACY TEACHERS. This
study aimed to verify if both the definition of plain educational goals and the adoption of clearly
defined evaluation criteria could minimize inequalities at school, especially those related to
socioeconomic, sex and race disparities noticed within a group of students referred to additional
support activities by nine literacy teachers at different public schools in the city of São Paulo. The
teachers were interviewed and the students answered a socioeconomic survey. Furthermore,
observations within the schools were taken. The study concludes that the disproportionate
number of children from low income families in that group is due to the particular role teachers
attribute to those activities, which are considered not as a punishment, but as an opportunity to
learn. Also, the incidence of black, mixed and native students is slightly reduced when evaluation
Cadernosde
Cadernos dePesquisa,
Pesquisa,v.v.39,
39, n.138,
n. 138,p.837-866, set./dez. 2009
set./dez. 2009 837
Marília Pinto de Carvalho
criteria are precise. Finally, it is easily noticed that girls and boys are equally referred when only
the learning process is evaluated, and not behavior problems. Some indications to initial and
continuing education of teachers are also made.
LEARNING EVALUATION – GENDER – RACE – PRIMARY EDUCATION
1. A pesquisa foi realizada antes da ampliação por lei federal do ensino fundamental para nove
anos, com a incorporação – a ser efetivada até 2010 – das turmas de pré-escola.
2. Utilizo, com base em Soares (2004), o conceito de alfabetização em seu sentido específico, como
“processo de aquisição do sistema convencional de uma escrita alfabética e ortográfica” (p.11),
diferente de letramento, definido pela autora como “práticas sociais de leitura e escrita” (p.6).
AS ALFABETIZADORAS
reforço escolar. Em todos os casos, pelo menos uma outra professora alfabe-
tizadora da mesma escola foi incluída entre os sujeitos da pesquisa, para que
pudessem ser feitas comparações.
Ao final de dois anos, foram entrevistadas nove professoras de quatro
diferentes escolas públicas da capital: Clara e Milene 4 trabalhavam numa escola
estadual em bairro de setores médios da Zona Oeste, com famílias de nível so-
cioeconômico bastante diversificado (a única escola onde havia estudantes com
renda familiar mensal acima de 20 salários mínimos) e que dispõe de prédios
e equipamentos pedagógicos de boa qualidade, além de uma dinâmica intensa
de trabalho coletivo entre seus professores. Marisa e Talma lecionavam em um
bairro de setores médios e altos da Zona Sul, atendendo também um público
relativamente diversificado, numa escola estadual bem equipada, porém com
pouco trabalho coletivo. Na Zona Noroeste, em uma escola da rede munici-
pal com boa infraestrutura, mas frágil trabalho coletivo, trabalhavam Jussara e
Rebeca, com alunos que provinham tanto de uma favela próxima quanto de
setores médios de baixa renda. Por fim, num bairro muito afastado do centro,
na Zona Leste da Capital, encontramos Leila, Priscila e Meire, lecionando para
crianças com rendas familiares bastante homogêneas, quase todas abaixo de
cinco salários mínimos mensais, numa escola que dispunha de poucos recur-
sos pedagógicos, funcionava em três turnos diários além de um noturno, e
tinha classes com 40 alunos. Por meio de suas entrevistas, estas três últimas
professoras nos permitiram perceber a importância do trabalho coletivo e da
atuação da coordenação pedagógica naquela escola. Ao todo, foram envolvidas
310 crianças de 1ª série, consideradas as nove turmas estudadas.
Além da diversidade de suas condições de trabalho e das condições
socioeconômicas das famílias de seus alunos, o grupo de entrevistadas tinha
poucos pontos em comum em termos de idade, tempo de experiência no
magistério e formação. Marisa, Talma e Jussara contavam com mais de vinte
anos de trabalho como professoras de ensino fundamental; Meire, Priscila, Leila
e Clara tinham menos de cinco anos de experiência; Milene e Rebeca conta-
vam com dezessete e quatorze anos respectivamente. A maioria fizera Curso
de Magistério e curso de nível superior, sete delas em Pedagogia. Clara tinha
também curso de mestrado em Educação e Talma concluíra no ano anterior à
sem valor e só oito alunos com hipótese silábica com valor... eles não foram
alfabetizados na pré-escola” (Priscila).
Nesse grupo de professoras poderíamos incluir Talma, Milene, Priscila,
Leila e Meire. É importante destacar que essas professoras, além de conhece-
rem individualmente os processos de alfabetização vividos por cada um de seus
alunos e alunas, estavam também atentas aos aspectos comportamentais, que
elas conheciam, descreviam e sobre os quais procuravam atuar para construir
uma postura que consideravam adequada.
Priscila e Meire chegaram a elaborar uma ficha de avaliação apresentada
aos pais em reuniões bimestrais, composta por dois quadros. No primeiro
quadro, podia-se acompanhar mês a mês a hipótese de escrita em que estava
a criança. No segundo, são respondidas com “sim” ou “não”, questões como:
“Tem um bom nível de atenção? É cooperativo com os colegas e professora?
Respeita os combinados de boa convivência em sala de aula?”, entre outras.
Elas relataram explicar aos pais, em todas as reuniões, o significado de termos
como “pré-silábico” e “silábico com valor” e que não estavam atribuindo notas
ou conceitos aos alunos.
Aspectos do relacionamento entre as crianças foram enfatizados em
diferentes momentos das entrevistas de todas essas professoras: “Eles são afe-
tivos. É uma classe... eles são muito participativos... muito bagunçeiros [risos].
Mas é uma classe unida, é bonito ver a união dessas crianças. Não existe rixa
com as crianças, ninguém menospreza ninguém dentro da sala. É um ambiente
muito legal” (Talma).
E elas falaram da dificuldade de obter concentração e construir rotinas
de trabalho, em especial devido ao tamanho das turmas, ao tipo de trabalho
que desenvolviam e à ausência de auxiliares:
V. está silábico-alfabético também, está quase lá, mas a mãe dele ficou grávida
agora. Ele tem 7 anos e agora que a mãe dele ficou grávida, então ele teve
uma recaída, mas eu acho que até o final do ano ele volta ao normal”. (Leila).
No caso dessas professoras, as condições, quase sempre difíceis ou pre-
cárias, não eram invocadas para justificar impossibilidades nem como barreiras
para a atuação pedagógica, ainda que se possa reconhecer nas falas precon-
ceitos sobre “famílias desestruturadas”, sempre que a unidade familiar não
correspondia ao modelo nuclear completo. Essas situações eram consideradas
apenas como pano de fundo para entender as dificuldades dos alunos e, muitas
vezes, como afirmação de que essas eram as crianças que mais precisavam
delas, tanto para aprender quanto para construir uma postura adequada de
aluno, como diz Talma:
Eu acho que cada criança tem um ritmo, ela tem uma história de vida, assim,
diferente, né? Às vezes ela conta exclusivamente com a escola, com o professor,
com os colegas de classe. A família é pouco presente na vida escolar do aluno: a
mãe trabalha fora, o pai trabalha fora. Às vezes a mãe vê a criança à noite. Então,
eu acho que o importante é você saber de tudo isso, [...] saber a hipótese que
essa criança está trabalhando, compreender isso, pra você poder auxiliar. (Talma)
Por que, senão, a gente teria muitas outras coisas para medir nessa hora. Ficaria
mais difícil. Então a gente teria que prestar atenção assim: “Ah, este aluno está
alfabético, mas ele bagunça, não tem um bom relacionamento”. Não, no nosso
critério, a gente está usando a hipótese de escrita, porque é nisso que a gente
coloca nossas forças. (Priscila)
Quando você fala “quem você considera bom aluno”, “o que é um bom aluno
pra você?” Eu acho que é uma pergunta... Você direciona a pessoa a fazer um
conceito disso daí, né? [...] [Você ficou incomodada com essas perguntas?] Sim,
incomodada com essa pergunta, com esse “bom”, entendeu? Eu acho, assim,
que na verdade, vocês me induziram a colocar um conceito. [...] Porque não
vai existir o mau aluno. Não existe isso, do mau aluno. Tirar “d”, tirar “e”: não
tem. O aluno quando traz a lição pra você ver, ele produziu o melhor que ele
pôde. É aquilo que ele acha que é. Cabe a você fazer essa criança progredir,
aprender, cabe ao professor. (Talma)
Priscila: Bons alunos? Eu vou apontar os que gostam de estudar. [risos] O que é
um bom aluno? Ai, meu Deus! É que a gente tem aquela coisa, a gente acredita,
a gente quer acreditar em todos, né? Mas quando você faz uma pergunta dessas.
Ai, meu Deus do céu!
Meire: Agora, este bom aluno que você está perguntando, é o bom aluno no
ambiente escolar? [É o que vocês entendem por bom aluno.] Bom aluno? A S.
é silábica sem valor e eu acho a S. ótima. Ela é uma menina que sabe respeitar
um ambiente público, ela é muito delicada comigo, delicada com os colegas, ela
é minha aluna mais... [faz gestos de carinho com as mãos]. Ai, é muito difícil!
[...] Pode ficar sem responder a pergunta?
Priscila: Muitos são bons alunos... é muito difícil. Eu sei daqueles que precisam
de mais ajuda. Porque eu não dou conta em uma sala de 40, de estar com
eles individualmente, ficam 39 precisando de mim, gritando pela sala. Então,
eu sei destes, que eu gostaria que tivessem um reforço para poder ter uma
atenção mais individualizada, porque eu acho que eles merecem, mesmo pelo
aproveitamento deles, pelo que eles avançaram. Eu diria que é uma sala boa.
São alunos bons [risos].
Ela é estimulada aqui na escola, na classe, você está estimulando aquilo. Mas
ela chega em casa, não tem ninguém que se interesse pela vida escolar dessa
criança. Ela não tem ninguém para mostrar aquilo que ela produziu. Há esse
desinteresse total. [...] Agora, quem tem de fornecer esse recurso, se ela não
tem? É a escola, é o professor. Não digo todos, porque você não vai ficar com
essa criança o tempo todo. Mas durante o período que ela está aqui na escola,
você tem que pelo menos tentar suprir isso daí. (Talma)
Não participam de reunião, não querem nem saber, não se envolvem, não estão
envolvidos com o dia a dia do filho, sabe? Tudo bem que eu sei que às vezes
eles têm que correr atrás do pão de cada dia deles, eles têm que garantir uma
forma de melhoria dentro da casa deles, mas fica difícil também pra gente essa
ausência da família. A ausência da família é muito negativa diante do quadro que
você vê, diante do rendimento deles. (Marisa)
E eu tenho muito problema social lá dentro da minha sala, demais. Isso não
é o ponto principal, mas é um ponto que influencia no rendimento da classe
toda. [Quais são esses problemas?] Eu tenho uma aluna adotada, a mãe teve
essa menina quando ela estava presa. Eu tenho um aluno que não mora com
a mãe de segunda a sexta, e só vê a mãe de sábado e domingo. [...] Eu tenho
crianças que ficam na rua o dia inteiro, o caso de uma mãe que está envolvida
com drogas. Estes casos são os que eu descobri. (Rebeca)
6. Deve-se observar, contudo, que o índice de não resposta na classe de Marisa foi de 28%, o
que corresponde a 9 alunos, sendo que 4 deles foram indicados para o reforço.
O C., ele é uma criança que também os pais dão muita..., têm muito acesso a
essa questão de cultura, de cinema, de teatro, de viagem. Ele conta coisas do
Pantanal porque há uns dois anos atrás ele viajou para o Pantanal. São vivências
que eles acabam trazendo e que fazem diferença. (Clara)
FIGURA 1
GRUPO 1– CLASSES E REFORÇO EM NÚMEROS
ABSOLUTOS DE ACORDO COM A RAÇA ATRIBUÍDA
Classe Reforço
Brancos 119 Brancos 31
Negros 62 Negros 13
Indígenas
Indigenas 0 Indígenas
Indigenas 0
Total 181 Total 44
Brancos
BRANCOS
Negros
NEGROS
Indígenas
INDÍGENAS
FIGURA 2
GRUPO 2 – CLASSE E REFORÇO, SEGUNDO A RAÇA ATRIBUÍDA AO ALUNO
Classe Reforço
Classe
Brancos 72 Brancos
Brancos 13 72
Negros 42 NegrosNegros 15 42
Indígenas
Indigenas 8 Indígenas
Indigenas
Indigenas 2 8
Total 122 Total Total 30122
Classe xx Raça
Classe Raçaatribuída
atribuída Reforço
Classe
ReforçoxX
Raça atribuída
x Raça
Raça atribuída
atribuída
Brancos
BRANCOS BRANC
Negros
NEGROS NEGRO
Indígenas
INDÍGENAS INDÍGEN
Eu fui pela cor da pele [rindo], que eu os identifico pela cor da pele. E eu não
tenho em mãos a certidão de nascimento, que seria, acho, o mais correto, não
é? E eu fui, então, pelo que eu conheço, lembrando dos pais também, que eu
já conheço, então eu fui classificando por aí. (Marisa)
Eu enxergo eles assim. Engraçado que não bate em nada com os que os pais
dizem. A gente fez um questionário deste na escola. Justamente os que a gente
acha que são pardos, os pais falam que são negros. Os que a gente acha que são
negros os pais colocam brancos. A maioria dos pardos os pais colocaram brancos.
Eles enxergam que o filho é branco. (Priscila, comparando com o questionário
do Censo Escolar 2005)
FIGURA 3
CLASSE E INDISCIPLINA NOS GRUPOS I E II,
SEGUNDO A RAÇA ATRIBUÍDA AO ALUNO
FIGURA 4
GRUPO I - CLASSE E REFORÇO, SEGUNDO O SEXO DO ALUNO
x Sexo
Classes X Sexo Reforço
Reforçox X
Sexo
sexo
Meninos
Meninas
FIGURA 5
JUSSARA – CLASSE E REFORÇO, SEGUNDO O SEXO DO ALUNO
ClassexXSexo
sexo Reforço
Reforço xXSexo
sexo
Classe
Meninos
Meninas
FIGURA 6
REBECA – CONCEITOS FINAIS, SEGUNDO O SEXO DO ALUNO
ClasseXx sexo
Classe Sexo Conceitos NSXx sexo
Conceitos NS Sexo
Meninos
Meninas
FIGURA 7
MARISA – CLASSE E REFORÇO, SEGUNDO O SEXO DO ALUNO
Classe x sexo
Classe X Sexo Reforço X
Reforço x sexo
Sexo
Meninos
Meninas
FIGURA 8
CLARA – CLASSE E REFORÇO, SEGUNDO O SEXO DO ALUNO
Classe x Sexo
Classe X sexo Reforço
Reforço xXSexo
sexo
Meninos
Meninas
Umas crianças vêm de creche, mais aberta, aquela coisa menos sistematizada,
algumas crianças demoram um pouquinho para perceber essa estrutura de
escola, que a gente tem horário, que aqui não é só brincadeira, que brinca
muito menos do que se brincava antes, que aqui a gente tem mais coisa para
aprender. (Clara)
mundo. [E não atrapalha o desempenho dela?] Não. Ela é super rapidinha. Ela
faz o que tem que fazer” (Clara).
Cabe reafirmar: com raras exceções, como nesse exemplo da classe de
Clara, apenas meninos foram apontados como problemas sérios, classificados
como “agressivos” ou “nervosos” e acusados de bater nos colegas. Já a indisci-
plina das meninas seria mais branda, ligada à dispersão, conversa e brincadeira:
“Não é um problema de disciplina, é um problema porque elas conversam e
isso atrapalha o rendimento delas. [...] Não seria aquele problema de disciplina,
mas são meninas irrequietas, não um problema de disciplina” (Rebeca).
Enfim, mesmo entre as professoras que reuni no Grupo 1, à clareza
de critérios de avaliação de aprendizagem nem sempre correspondia uma
clareza do que seria um comportamento adequado a ser construído pela
escola, uma disciplina escolar, embaralhando os grupos de professoras antes
estabelecidos. Apenas uma pesquisa de maior fôlego sobre o cotidiano das
classes poderia explicitar os critérios efetivamente em uso e esclarecer até
que ponto eles se relacionavam às concepções de gênero, aos preconceitos
em relação às famílias pobres e à percepção racial das professoras sobre as
crianças. As informações obtidas só me permitem afirmar que os meninos
eram a fonte maior de dificuldades de disciplina, ainda que a própria definição
dessas dificuldades fosse variável.
Como discuti (Carvalho, 2004a), com base no que já foi também explora-
do na literatura internacional (Connell, 1998, 2000; Kimell, 2000; MacAnGhail,
1995), diferentes formas de masculinidade e feminilidade são forjadas por meio
das atitudes de contraposição às regras e à autoridade escolar. Se parece ser
necessário, antes de mais nada, delimitar entre as professoras essas regras e
exigências, um segundo passo seria uma compreensão mais profunda desses
processos de contraposição à autoridade e seus significados para as próprias
crianças. Tal aprofundamento poderia evitar a naturalização de comportamen-
tos masculinos expressa em frases do tipo “os meninos são assim mesmo”. E
decerto ajudaria as professoras a construírem com seus alunos uma relação
mais positiva com a escola, suas exigências e, consequentemente, também
com o conhecimento escolar.
Finalmente, numa perspectiva de justiça social, a escola deve contribuir,
para além de tudo isso, na construção de relações mais igualitárias e na acei-
tação de uma multiplicidade de formas de ser homem e ser mulher, menino e
menina, branco, branca, negro, negra ou indígena. Isso só será possível com
uma ampla discussão desses temas como parte da formação inicial e continuada
das professoras, de forma que elas possam cumprir um papel transformador
em relação às crianças e às famílias, por meio não apenas de questões relativas
ao desempenho cognitivo, mas também de valores e práticas.
Pois mesmo as professoras que se mostraram atentas à necessidade de
romper com modelos rígidos de gênero junto a suas classes, encontravam
dificuldades, como contou Meire:
[A ideia de] que menina não pode jogar futebol, por exemplo. Então, a gente
conversa muito com as crianças, dá bastante bronca. Por que não pode? Eu
tenho três meninas na minha sala que adoram futebol. No começo, eles tiveram
muita resistência, mas agora eles já brincam. Elas estão umas gracinhas. (Meire)
REFERÊNCIAS BIBLIOGRÁFICAS
________. Mau aluno, boa aluna? Como as professoras avaliam meninos e meninas. Estudos
Feministas, v. 9, n. 2, p.554-574, dez. 2001.
________. Quem são os meninos que fracassam na escola? Cadernos de Pesquisa, São Paulo,
v. 34, n. 121, p.11-40, jan./abr. 2004a.
HEY, V. et al. Boy’s underachievement, special needs practices and questions of equity. In:
EPSTEIN, D. et al. (eds.) Failing boys? Issues in gender and achievement, Buckingham: Open
University Press, 1998. p.132-145.
JACKSON, D. Breaking out of the binary trap: boys’ underachievement, schooling and gen-
der relations In: EPSTEIN, D. et al. (eds.) Failing boys? Issues in gender and achievement.
Buckingham: Open University Press, 1998. p.77-95.
KIMMEL, M. “What about the boys?” What the current debates tell us and don’t tell us about
boys in school: special report. (6th. Annual Gender Equity Conference. Wellesley: Center for
Research on Women’s, jan.2000.)
LAHIRE, B. Sucesso escolar nos meios populares: as razões do improvável. São Paulo: Ática,
2003.
LINGARD, B.; DOUGLAS, P. Men engaging feminisms: pro-feminism, backlashes and school-
ing, Buckingham: Open University Press, 1999.
Após uma conferência, recebi pela internet algumas perguntas e alguns comentários, cujas
respostas partilho com todos os interessados, expressando minha gratidão ao emissor da
mensagem, que provocou as considerações que se seguem sobre questões metodológicas da
avaliação, bastante específicas.
Pergunta: Durante a graduação sempre achei que fui "avaliado" de forma injusta, pois muitas
vezes os professores davam notas como 5,1 ou 4,9 e me questinava: "o que significa 0,1 (um
décimo) do meu conhecimento?" Então surgiu a minha primeira questão sobre a avaliação:
"Como inferir sobre o conhecimento de outra pessoa?" [procuro pensar nessa questão usando
o termo "outra pessoa" de modo filosófico, psicanalítico] .
De fato, é impossível medir uma variação da inteligência de alguém em termos de décimos. Isso
só pode ser feito em função de se admitir uma política classificatória em termos de valores
numéricos utilizados como recursos de expressão dos pontos obtidos através de acertos e erros
num determinado teste. Os procedimentos classificatórios têm mais a ver com concurso do que
com avaliação da aprendizagem. O modelo classificatório foi importado de fora da escola para
dentro da escola. Quando os exames escolares foram sistematizados no século XVI, o modelo
proveio de sistemas classificatórios de fora da escola. Por exemplo, três mil anos antes da era
cristã, os chineses se serviam de provas para selecionar novos membros para o exército. Sendo
seletivo, o processo tinha por base a classificação. A escola importou esse modelo, sem um crivo
crítico e, desse modo, até hoje, usamos no nosso cotidiano escolar o modelo classificatório.
Porém, o ato de avaliar não exige um modelo classificatório; ele, por si, é estranho à avaliação.
Daí a inadequação ou “injustiça” como você denomina.
Uma observação; Outra coisa que percebi, principalmente após ler um pouco de Pierre
Bourdieu - especialmente sobre o conceito de "capital cultural" - é que a avaliação pode ser
um forte instrumento de discriminação. Tento minimizar, pois para mim, não importa a "nota
per si" mas o caminho percorrido pelo aluno para conseguir aquela determinada nota, pois sei
que para muitos alunos conseguir tirar 4 ou 5 já é um esforço monumental pois muitos deles
estudam somente na escola, não tendo nenhum apoio dos pais, seja por ausencia ou por falta
de escolaridade. Enquanto outros dispoem de largos recursos em casa….
São duas coisas diferentes: uma é a questão do uso inadequado da avaliação como recurso de
discriminação e outro é a questão da efetiva aprendizagem, ou não, dos educandos.
Na história da educação, existem vários estudos, como os de Pierre Bourdieu, de Michel Foucault,
de Philippe Perrenoud, que abordam, dentro de suas respectivas perspectivas, a questão de como
os atos examinativos (que eles denominam, inadequadamente, de “atos avaliativos”) são
discriminadores, do ponto de vista sociológico. Concordo com essa tese, na medida em que em
nossa história social, efetivamente, os atoss examinativos prestaram-se a esse papel e ainda
prestam. Pierre Bourdieu fala da violência simbólica, Michel Foucault do micropoder que a tudo
controla e Perrenoud fala das duas lógicas, uma aparente (avaliar) e outra oculta (discriminar).
Todavia, esses, efetivamente não foram atos avaliativos, mas sim examinativos (classificatórios).
A avaliação, para ser avaliação não necessita da classificação. O ato de avaliar é um ato de
investigar a qualidade do resultado da ação. O que importa saber é se ele tem a qualidade que
deveria ter. Somente isso. Não necessita de ser comparado a outro resultado. A qualificação da
realidade, no ato de avaliar, tem sua base na comparação da realidade descrita com um critério,
mas não com outro resultado. Desse modo, a avaliação, por si, somente detecta a qualidade do
resultado, e, por isso, não discrimina ninguém. Ela diagnostica uma situação, porém nem julga
nem discrimina. O julgamento e a discriminação decorrem de elementos externos à avaliação,
propriamente dita. Para avaliar dez estudantes, não há nenhuma necessidade de compará-los entre
si. Cada um necessita de ser comparado ao seu próprio desempenho, ou seja, cada um aprendeu
ou não de modo satisfatório o que tinha que aprender. E isso basta, pois que só a partir daí ele
poderá ser reorientado.
O termo “normalização” tem sua origem em Gauss, que descobriu que tudo na vida pode ser
distribuído, segundo uma curva estatística denominada “normal”, ou seja, sempre haverá um
segmento inferior, um médio e um superior um determinado grupo, organizado dentro de uma
escala que vai do menor para o maior.
Com essa abordagem nunca conseguiríamos uma curva assimétrica em “j”, ou seja, todos
classificados no segmento superior da curva. Quando você toma a maior nota e a assume como o
maior valor de referência ( “dez”) e, a seguir, distribui todos os outros estudantes
proporcionalmente a este, adota a “distribuição normal”, de Gauss, como o parâmetro. Usando
esse procedimento você mantém sempre a discriminação. Os estatísticos, que, efetivamente,
trabalham com avaliação e não com o rankeamento dos participantes de uma turma de estudantes,
não usam a curva de Gauss como recurso para atribuição de qualidade ao desempenho dos
estudantes, mas sim o critério, ou seja, o padrão de resposta desejado. Em avaliação, o que
podemos dizer é que um estudante aprendeu ou não o que lhe fora ensinado. Somente isso. E, a
partir disso, se necessário, proceder a reorientação para que aprenda o que necessita de aprender.
O rankeamento (classificação) é uma decisão externa à avaliação. Ela, sim, é uma escolha
totalmente política, porque desnecessária. Então, na sua prática, se deseja que, efetivamente, seus
estudantes aprendam o que necessitam de aprender, não deverá tomar a maior nossa e assumi-la
como “dez” e, a seguir, rankear os outros estudantes, mas, sim, ensinar cada um, para que atinja o
mínimo necessário e, então, todos estarão, minimamente, no mesmo nível de aprendizagem — o
necessário, nem mais nem menos que isso.
Por último: Em tempo: Como dar conta dos conteúdos mínimos e ainda conseguir com que
todos os alunos tenham uma ótima curva de aproveitamento, mesmo quando muitos deles não
demostram nenhum tipo de respeito pela escola, pelo professor?
A meu ver, a solução viável é o estímulo do educador, mostrando como a aprendizagem (aquisição
de habilidades) permite solucionar problemas do dia a dia, o conhecimento necessita de ter uma
significação no cotidiano e tem, importa compreender como cada coisa que ensinamos tem seu
significado na vida e nos ajuda a resolver questões. O que ensinamos e aprendemos é para tornar a
vida melhor. É o nosso entusiasmo de educadores é o recurso fundamental para comprometer
nossos estudantes. Somos os líderes na relação pedagógica. Por último, quando propus fazer uma
curva do aproveitamento dos nossos educandos numa determinada turma não foi e, a meu ver, não
deve ser, para estabelecer um ranking de notas das maiores para as menores, mas sim foi para
sugerir um olhar sobre a efetividade de nossa ação. A curva dos resultados pode nos mostrar como
nossa atividade está sendo efetiva para todos os estudantes, ou não. Se não está, o que faremos
para que venha a ser eficiente para todos? Usar a “curva de Gauss” para justificar uma “justiça”
com todos os estudantes não ajuda em nada. O que ajuda é dar suporte para que cada um aprenda
o mínimo necessário. Marx definiu que justiça é dar a cada um o que ele necessita. Pessoalmente,
acredito que essa é mais significativa forma de justiça. Ela não decorre da comparação, do
ranking, mas da necessidade. Uns necessitarão de mais cuidados e outros menos.
Cumprir isso na sala de aulas, com as carências que temos em termos de condições materiais e
sociais do ensino, é difícil, bem o sei. Todavia, o caminho é esse. Poderemos executá-lo mais, ou
menos, plenamente, mas, parece não haver como fugir dele. Fazer o melhor que podemos, com as
parcas condições que temos. Essa é a possibilidade. Lamentar o escuro não resolve o escuro,
todavia, ascender um palito de fósforo já faz alguma luz.
========================================================================
Postado por Cipriano Luckesi às 17:45
Enviar por e-mailPostar no blog!Compartilhar no TwitterCompartilhar no FacebookCompartilhar com o Pinterest
4 comentários:
1.
Anderson Candido9 de junho de 2020 às 20:34
ResponderExcluir
Respostas
Responder
2.
Unknown29 de outubro de 2020 às 18:13
Acredito que o educador tem o compromisso de transpor barreiras, para atingir objetivos, como ele termina
o texto definindo que somos os lideres na relação pedagógica, e estamos tendo a oportunidade de promover
alguma mudança. Vai valer a pena!
ResponderExcluir
Respostas
Responder
3.
Anônimo3 de maio de 2023 às 14:05
Sabemos o quanto atualmente está difícil exercer a profissão de professor, porém não podemos desistir do
nosso sonho de uma educação melhor para todos.
ResponderExcluir
Respostas
Responder
4.
Anônimo4 de maio de 2023 às 15:36
as avaliações, são feitas a todo tempo mesmo entre colegas educados, infelizmente as mesmas
injustiças,muito exclarecedor everdedeiro.
ResponderExcluir
Respostas
Responder
Adicionar comentário
Carregar mais...
291,177
Quem sou eu
Cipriano Luckesi
Professor universitário aposentado da
Universidade Federal da Bahia - UFBA, tendo
atuado nas áreas de Filosofia e de Educação.
02 - Aprendizagem da avaliação
26 - Sobre prova
69 - Avaliação dialógica
▼ 2014 (82)
▼ setembro (33)
01 - INÍCIO DESTE BLOG
02 - Aprendizagem da Avaliação
03 - Avaliação e aprendizagem bem
sucedida
04 - Critérios para a avaliação da
aprendizagem
05 - Ainda sobre critérios de
avaliação da aprendi...
06 - Avaliação da aprendizagem na
escola hoje
07 - Resistências ao ato de avaliar
08 - Avaliar domínios cognitivo,
afetivo e psicomotor
09 - Completando tema cognitivo,
afetivo, psicomotor
10 - Ainda afetividade, cognição e
psicomotricidade
11 - Avaliação: instrumentos de
coleta de dados I
12 - Avaliação: instrumentos de
coleta de dados II
13 - Avaliação: instrumentos de
coleta de dados III
14 - Avaliação: Instrumentos de
coleta de dados IV
15 - Avaliação: instrumentos de
coleta de dados V
16 - Resultados positivos e
investimento nos resul...
17 - Frequência como crtiério de
avaliação
18 - Expansão da cultura da
avaliação
19 - Expansão da cultura da
avaliação, mais uma vez
20 - Novamente, expansão da
cultura da avaliação
21 - Planejamento, execução e
avaliação
22 - Investigação em geral e
avaliação como ato de...
23 - Avaliação da aprendizagem e
avaliação de sistema
24 - Como praticar a avaliação da
aprendizagem
25 - Sobre o texto “Avaliação da
aprendizagem: par...
26 - Sobre Prova
28 - Sobre “medir conhecimento”,
“avaliação como m...
29 - Sobre a simplicidade do ato de
avaliar a apre...
30 - Meu novo livro sobre avaliação
da aprendizagem
31 - Ensinar, aprender e avaliar:
tres atos distintos
32 - Avaliação da aprendizagem,
institucional e de...
33 - ENEM: avaliação, seleção e
orientação para o ...
34 - Premio Jabuti pelo meu último
livro sobre Ava...
► outubro (40)
► novembro (6)
► dezembro (3)
► 2015 (15)
► janeiro (3)
► fevereiro (5)
► abril (1)
► agosto (2)
► novembro (2)
► dezembro (2)
► 2016 (17)
► janeiro (4)
► fevereiro (1)
► março (1)
► maio (3)
► junho (1)
► julho (2)
► agosto (1)
► setembro (2)
► dezembro (2)
► 2017 (16)
► janeiro (2)
► fevereiro (2)
► junho (4)
► novembro (5)
► dezembro (3)
► 2018 (1)
► fevereiro (1)
► 2019 (1)
► maio (1)
► 2020 (9)
► julho (3)
► agosto (6)
► 2022 (2)
► setembro (2)
Translate
Pesquisar este blog
Selecione o idioma
Powered by Pesquisar
Google Tradutor Tradutor
xto original
alie a tradução
feedback vai ser usado para ajudar a melhorar o Google Tradutor
ARTIGOS
Resumo: O presente artigo propõe apresentar resultados de uma pesquisa realizada junto aos professores
da educação básica, considerando como esses professores percebem e compreendem a “avaliação” em
suas práticas pedagógicas. Constitui-se, assim, uma pesquisa de natureza qualitativa, utilizando-se a técnica
de grupos focais realizados durante as coordenações pedagógicas dos professores, no espaço de formação
continuada. A realização de grupos focais representou a forma metodológica menos impactante no tempo
dos professores, já altamente demandados pelas atividades docentes do seu cotidiano. Na sua organização,
professores foram congregados por áreas de atuação, Ciências Naturais e Exatas, Linguagens e seus Códigos
e Ciências Humanas e a cada grupo se apresentou o questionamento “qual o sentido da avaliação na sua
prática pedagógica?”. As discussões foram gravadas e posteriormente transcritas para análises e obten-
ção dos resultados, refletindo os diversos pontos de vista dos envolvidos, ao tempo que se aponta para a
transdisciplinaridade como um caminho mais humano do avaliar. De modo geral, é possível concluir que as
concepções docentes sobre avaliação educacional são múltiplas, mas convergem para o domínio cognitivo
na concepção de Russel & Airasian (2016), ou seja, está centrada nas atividades de cotejo que demandam
aquisições intelectuais.
* Doutor em Educação, mestre em Ensino de Ciências pela UnB, graduado em Ciências Biológicas pela UFBA, professor adjunto da
Faculdade de Educação da Universidade de Brasília (FE/UnB), ensina na graduação e no Programa de Pós-Graduação em Educação
na Modalidade Profissional (FE/PPGE-MP/UnB). Contato: heliomaia@unb.br
** Doutora em Educação, mestre em Arte e Educação, graduada em Artes Cênicas pela UFBA, professora Associada da Faculdade de
Educação da Universidade Federal da Bahia (FACED/UFBA), ensina na graduação e nos Programas de Pós-Graduação Doutorado Mul-
tinstitucional e Muldisciplinar em Difusão do Conhecimento (DMMDC) e em Educação na Modalidade Profissional (FACED/PPGE-MP/
UFBA). Contato: uraniamaia@gmail.com
A avaliação em sala de aula ocorre por três domínios prin- Metodologia da pesquisa
cipais. O domínio cognitivo engloba atividades intelectuais,
como memorizar, interpretar, aplicar conhecimento, solu- A presente pesquisa delimita-se como qualitativa,
cionar problemas e pensar criticamente. O domínio afetivo utilizando-se a técnica do grupo focal e ocorreu entre
envolve sentimentos, atitudes, valores, interesses e emoções. professores de Educação de Jovens e Adultos (EJA) em
O domínio psicomotor inclui atividades físicas e ações em que
horário de coordenação pedagógica em uma escola
os alunos manipulam objetos como uma caneta, um teclado
pública do Distrito Federal. A opção pelo grupo focal
ou um zíper.
nas coordenações dos professores pareceu a mais ade-
Os indicativos de Russel & Airasian (2016) se ligam quada, uma vez que questionários ou entrevistas semi-
com a ideia de Delors (2010) sobre os quatro pilares da -estruturadas individuais ocupavam o tempo do pro-
educação para o século XXI: o aprender a conhecer, fessor já tão demandado por tantas atividades. Assim,
o aprender a fazer, o aprender a conviver e o apren- a realização dos grupos ocorreu durante os momentos
der a ser, que exigem do professor outras dimensões destinados à formação continuada, o que fomentou
avaliativas que extrapolam o aprendizado conceitual. discussões e trocas de ideias. Como a escola congrega
Talvez o “aprender a conhecer” seja, na maior parte vários professores das mais diversas áreas, foram pro-
das vezes, a única competência avaliada pelos exames gramados grupos focais nas áreas assim organizadas:
quantitativos tradicionais, que visam apenas mensurar Ciências Naturais e Matemática; Linguagens e seus
a aquisição de conceitos e nem de longe chegam perto Códigos; e Ciências Humanas. Os mesmos ocorreram
da profundidade dos outros domínios apontados. É de em dias diferentes da semana, sendo realizados três
se supor que o domínio cognitivo da avaliação preva- grupos focais contendo cada um de 4 a 10 profes-
lece sobre os demais, sobretudo em concepções tradi- sores, não havendo interações entre professores de
cionais de educação, o que possivelmente leva o Brasil áreas diferentes.
a uma permanente avaliação negativa nos exames in- Definir grupo focal enseja caminhos polissêmicos
ternacionais como o PISA (Programa Internacional de e, segundo Barbour (2009, p.20), “tem resultado em
Avaliação de Estudantes) da OCDE (Organização para confusão mesmo no que diz respeito à definição do
a Cooperação e Desenvolvimento Econômico). Nesse que constitui um grupo focal, com os termos "entre-
sentido, nas palavras de Waiselfisz (2009, p. 14), vista de grupo", "entrevista de grupo focal" e "dis-
cussões de grupo focal às vezes utilizados de forma
[...] as avaliações do PISA centram-se nas competências de- intercambiável”. Assim, neste trabalho, sobre grupo
monstradas pelos alunos, isto é, nas habilidades e aptidões focal, adota-se as ideias de Kitzinger e Barbour (1999,
para analisar e resolver problemas, para trabalhar com infor- p. 20): "Qualquer discussão de grupo pode ser cha-
mações e para enfrentar situações da vida atual e não só nos mada de um grupo focal, contanto que o pesquisador
conhecimentos adquiridos na escola, o que as diferencia de esteja ativamente atento e encorajando às interações
outras propostas avaliativas. Nesse terreno o PISA considera
do grupo". Nesse sentido, o encorajamento às intera-
que dominar conhecimentos específicos é importante, mas
ções do grupo procurou garantir que os participantes
que sua utilização depende fundamentalmente da aquisição
de conceitos e habilidades mais amplos. Assim, por exem-
interagissem entre si e não somente com o pesquisa-
plo, na área de Ciências, o domínio detalhado dos nomes
dor. De modo geral, apenas uma questão foi proposta
das plantas e animais é menos importante do que a compre- inicialmente para os grupos de professores: “qual o
ensão de temas de maior abrangência, como o consumo de sentido da avaliação na sua prática pedagógica?”.
energia, a biodiversidade ou a saúde dos indivíduos. Essas Como procedimento metodológico, utilizando-se
habilidades refletem também a capacidade dos estudantes apenas um gravador digital, as interlocuções foram
ALARCÃO, Isabel. Formação Reflexiva de Professores: estratégias de supervisão. Porto: Porto Editora, 1996.
ATKINSON, J. Maxwell & HERITAGE, John. Structures of Social Action: Studies in Conversation Analysis. Cambri-
dge: Cambridge University Press, 1984.
BANDURA, Albert; AZZI, Roberta Gurgel; PLOLYDORO, Soely Aparecida. Teoria Social Cognitiva: conceitos bási-
cos. Porto Alegre: Artmed, 2009.
BARBOUR, Rosaline. Grupos focais. Porto Alegre: Artmed, 2009.
BAUER, Martin W.; GASKELL, George (org.). Pesquisa qualitativa com texto: imagem e som, um manual prático.
Petrópolis: Vozes, 2002.
DELORS, Jacques. Um tesouro a descobrir. Relatório para a UNESCO da Comissão Internacional sobre Educação
para o século XXI. Brasília: UNESCO, 2010.
FAGUNDES, Augusta Isabel Junqueira. Avaliação no Cotidiano Escolar: implicações legais. Belo Horizonte: Arro-
ba, 2015.
FREIRE, Paulo. Pedagogia do Oprimido. 63. ed. Rio de Janeiro: Paz e Terra, 2017.
FURLAN, Maria Ignez Carlin. Avaliação da Aprendizagem escolar: convergências, divergências. São Paulo: Anna-
blume, 2007
GARDNER, Howard. Estruturas da mente: a Teoria das Múltiplas Inteligências. Porto Alegre: Artes Médicas, 1994.
HOFFMANN, Jussara. Avaliação mitos e desafios: uma perspectiva construtivista. Porto Alegre: Mediação, 1991.
KITZINGER, Jenny; BARBOUR, Rosaline. Introduction: The challenge and promise of focus groups. In: BARBOUR,
Rosaline; KITZINGER, Jenny (org.). Developing Focus Group Research: Politics, Theory and Practice. London:
Sage, 1999.
LUCKESI, Cipriano Carlos. Avaliação da aprendizagem na escola: reelaborando conceitos e recriando práticas.
São Paulo: Cortez, 2003.
NICOLESCU, Basarab. O manifesto da transdisciplinaridade. Tradução de Lúcia Pereira de Souza. São Paulo:
TRION, 1999.
PERRENOUD, Philippe. Avaliação: da excelência à regulação das aprendizagens: entre duas lógicas. Porto Alegre:
Artes Médicas, 1999.
RUSSELL, Michael K.; AIRASIAN, Peter W. Avaliação em sala de aula: conceitos e aplicações. Porto Alegre: AMGH,
2014.
VILAS BOAS, Benigna Maria de Freitas. Virando a escola do avesso por meio da avaliação. Campinas: Papirus,
2008.
WAISELFISZ, Julio Jacobo. O Ensino das Ciências no Brasil e o PISA. São Paulo: Sangari do Brasil, 2009.
Resumo
Palavras-chave
Correspondência:
Alicia Bonamino
Pontifícia Universidade Católica
do Rio de Janeiro
Departamento de Educação
Rua Marquês de São Vicente, 225, 1050 L
22451-900 – Rio de Janeiro/RJ
alicia@puc-rio.br
Abstract
Keywords
Contact:
Alicia Bonamino
Pontifícia Universidade Católica
do Rio de Janeiro
Departamento de Educação
Rua Marquês de São Vicente,
225, 1050 L
22451-900 – Rio de Janeiro/RJ
alicia@puc-rio.br
376 Alicia BONAMINO; Sandra Zákia SOUSA. Três gerações de avaliação da educação básica no Brasil: interfaces...
dos alunos independentemente do conjunto es- base amostral, Estados e municípios sentiam a
pecífico de itens respondidos; iii) opção de tra- necessidade de implantar avaliações que atin-
balhar com as séries conclusivas de cada ciclo gissem todas as escolas. Tal necessidade fez
escolar (4ª e 8ª série do ensino fundamental e com que vários Estados adotassem seus pró-
inclusão da 3ª série do ensino médio); iv) priori- prios sistemas de avaliação. O Estado de Minas
zação das áreas de conhecimento de língua por- Gerais, por exemplo, criou, em 1991, o Sistema
tuguesa (foco em leitura) e matemática (foco em de Avaliação da Educação Pública (Simave), e
resolução de problemas); v) participação das 27 o Ceará, o Sistema Permanente de Avaliação da
unidades federais; vi) adoção de questionários Educação Básica (Spaece), em 1992. Várias ou-
para os alunos sobre características sociocultu- tras iniciativas estaduais e municipais vêm sen-
rais e hábitos de estudo. A partir da introdução do conduzidas desde então. No caso das uni-
dessas inovações, o Saeb tornou comparáveis dades federadas, 14 das 27 possuíam, em 2007,
os desempenhos dos alunos entre anos e séries. sistemas próprios de avaliação (LOPES, 2007).
Os testes cognitivos do Saeb são ela- A coexistência do Saeb com avaliações
borados com base em matrizes de referência, estaduais e, anos mais tarde, com a Prova Brasil
desenhadas a partir de uma síntese do que é faz com que a ênfase inicial na finalidade diag-
comum a diferentes propostas curriculares es- nóstica no uso dos resultados da avaliação per-
taduais, municipais e nacionais, além da con- ca força em face da tendência de focalizar esse
sulta a professores e especialistas nas áreas de uso como subsídio a políticas de responsabili-
língua portuguesa e matemática e do exame zação, o que leva ao reconhecimento de duas
dos livros didáticos mais utilizados nas redes e novas gerações de avaliação da educação bási-
séries avaliadas. ca no Brasil. Como será visto nas seções seguin-
Ainda que a elaboração dos testes leve à tes, tais avaliações envolvem a publicidade dos
definição do que deve ser considerado funda- resultados dos testes por redes e/ou escolas e,
mental em termos de aprendizagem escolar e, no caso da terceira geração, também o estabe-
portanto, do que todos os alunos deveriam saber lecimento de prêmios atrelados aos resultados
e ser capazes de fazer ao final de determinados dos alunos.
ciclos de escolarização, por ser de base amostral,
o Saeb apresenta baixo nível de interferência na Avaliação em educação e
vida das escolas e no currículo escolar. responsabilização
Seu desenho mostra-se adequado para
diagnosticar e monitorar a evolução da qua- No campo educacional, as avaliações
lidade da educação básica, mas não permite que subsidiam políticas de responsabilização
medir a evolução do desempenho individual de operam crescentemente dentro de um referen-
alunos ou escolas. Seus resultados são divul- cial que associa gestão democrática da educa-
gados de forma bastante agregada e, portanto, ção, avaliação e responsabilização. A definição
não permitem apoiar a introdução de políticas aí subjacente de democracia apoia-se em dois
de responsabilização de professores, diretores e princípios orientadores. Por um lado, há a par-
gestores por melhorias de qualidade nas unida- ticipação que acontece, em grande medida, mas
des escolares. não exclusivamente, por meio do processo elei-
Paralelamente, enquanto o MEC desen- toral e do sistema partidário. Para tanto, todo
volvia uma avaliação da educação básica de cidadão deve desfrutar de direitos políticos fun-
distintos níveis de escolaridade: no caso do Brasil, 4ª e 8ª séries do ensino damentais: direito de expressão, de associação,
fundamental e 3ª do ensino médio. Isso permite comparar as médias de votar e de candidatar-se a cargos públicos.
de proficiência em cada disciplina entre os diversos níveis do sistema
educativo, entre as regiões do país e entre os vários anos, situando todos Por outro lado, há a contestação pública entre
os níveis em uma mesma escala. vários atores políticos, não apenas no sentido
378 Alicia BONAMINO; Sandra Zákia SOUSA. Três gerações de avaliação da educação básica no Brasil: interfaces...
e administrativas, visando à melhoria da qua- Os resultados da Prova Brasil passaram
lidade do ensino. De outra parte, considera-se a ser amplamente divulgados e, atualmente,
que essa avaliação pode funcionar como um o Ideb é o principal indicador adotado pelo
elemento de pressão, para pais e responsáveis, Governo Federal para traçar metas educacio-
por melhoria da qualidade da educação de seus nais a serem alcançadas por escolas e redes es-
filhos, uma vez que, a partir da divulgação dos taduais e municipais. A ideia central do sistema
resultados, eles podem cobrar providências para de metas foi obter um maior comprometimento
que a escola melhore. das redes e escolas com o objetivo de melhorar
A introdução da Prova Brasil em 2005 os indicadores educacionais. Supõe-se que um
e sua repetição, a cada dois anos, permitem a sistema de metas pactuado entre o MEC e as
comparação, ao longo do tempo, entre as esco- secretarias de educação de Estados e municípios
las que oferecem o ensino fundamental. Em sua serviria para aumentar a mobilização da socie-
primeira edição, ela avaliou mais de 3 milhões dade em favor da qualidade da educação. Nessa
de alunos em aproximadamente 45.000 escolas perspectiva, é preciso lembrar que o Brasil pos-
urbanas de 5.398 municípios; foi muito além, sui um sistema educacional descentralizado,
portanto, do Saeb, que avalia, em média, uma com mais de 5.000 redes de ensino com auto-
amostra de 300.000 alunos. nomia para gerir suas escolas (FERNANDES;
A Prova Brasil foi censitária para as es- GREMAUD, 2009).
colas urbanas em 2005 e 2007. Em 2007, al- A divulgação dos resultados da primei-
terou-se o número mínimo de alunos na série ra edição da Prova Brasil ocorreu em julho de
avaliada, que passou de trinta para vinte. Essa 2006 por intermédio dos principais meios de
alteração foi realizada para possibilitar que comunicação e de um boletim disponibilizado
aproximadamente quatrocentos municípios que na Internet e enviado a cada uma das escolas
não participaram da primeira edição pudessem participantes. Esse boletim apresentava, entre
ser incluídos na avaliação. Já na terceira edi- outras informações, os resultados das escolas
ção, em 2009, houve a ampliação do universo em uma escala de desempenho e as médias al-
avaliado, de modo a incluir também todas as cançadas pelas escolas das redes municipal, es-
escolas rurais que tivessem, no mínimo, vinte tadual e federal.
alunos nas séries avaliadas. Enquanto a mídia divulgava rankings
Os resultados da Prova Brasil de 2007 pas- de escolas, com destaque para os melhores e
saram a integrar o Indicador de Desenvolvimento piores resultados, nos sites do Inep e do MEC,
da Educação Básica (Ideb5), referência para a enfatizava-se, como novidade da Prova Brasil,
definição de metas a serem alcançadas, gradual- a devolução dos resultados para as escolas a
mente, pelas redes públicas de ensino até 2021. fim de colaborar com o planejamento das ações
O princípio básico de tal indicador é o de que pedagógicas (OLIVEIRA, 2011).
a qualidade da educação envolve que o aluno Em 2009, meses antes de acontecer a ter-
aprenda e passe de ano. Com o Ideb, o desempe- ceira edição da Prova Brasil, o Inep e o MEC dis-
nho passa a ser medido por meio da Prova Brasil tribuíram duas publicações em todas as escolas
e a aprovação, por meio do Censo Escolar. Os públicas: a Matriz de Referência da Prova Brasil
índices de aprovação permitem levar em conta o e do Saeb – Ensino Fundamental e a Matriz de
número de anos que, em média, os alunos levam Referência do Saeb – Ensino Médio e de Ensino
para completar uma série. Fundamental, ambas com exemplos de itens
de edições anteriores comentados. No caso da
Prova Brasil, no entanto, por razões adminis-
5 - O Ideb foi criado pelo Instituto Nacional de Estudos e de Pesquisas
Educacionais Anísio Teixeira (Inep), órgão vinculado ao MEC. Para informações trativas, os resultados não foram divulgados às
mais detalhadas, consultar <http://www.inep.gov.br> e FERNANDES 2007. escolas, podendo ser encontrados apenas nas
380 Alicia BONAMINO; Sandra Zákia SOUSA. Três gerações de avaliação da educação básica no Brasil: interfaces...
A noção de responsabilização, direcio- • Divulgação dos resultados do SARESP
nada aos professores e demais profissionais da 2007 para todas as escolas, professores,
educação, concretizou-se no ano de 2000, com pais e alunos em março de 2008.
a instituição do Bônus Mérito, cuja distribuição
levou em conta os resultados da avaliação em Meta 9 - Gestão de Resultados e Política
larga escala7. de Incentivos:
Em 2007, quando a então Secretária de
Educação Maria Helena Guimarães Castro e o • Implantação de incentivos à boa gestão
Governador José Serra anunciaram o Plano de escolar valorizando as equipes.
Metas, evidenciou-se a importância que a ava- • O SARESP 2005 e as taxas de aprovação
liação em larga escala assumiria para essa ges- em 2006 serão a base das metas estabele-
tão. A 5ª meta estabelecida no Plano previa um cidas por escola.
aumento de 10% nos índices de desempenho • Também serão considerados indicadores
dos ensinos fundamental e médio nas avalia- como a assiduidade dos professores e a es-
ções nacionais e estaduais. Ao estabelecer essa tabilidade das equipes nas escolas.
meta, a Secretária indica a continuidade do • Cada escola terá metas definidas a partir
SARESP, e, dentre as 10 Metas para uma Escola da sua realidade, e terá que melhorar em
Melhor, duas enfatizavam o papel da avaliação relação a ela mesma.
em larga escala no desenvolvimento da política • As escolas com desempenho insuficiente
educacional paulista. As metas foram divulga- terão apoio pedagógico intensivo e recebe-
das com a seguinte redação: rão incentivos especiais para melhorarem
seu resultado.
Meta 8 - Sistemas de Avaliação: • As equipes escolares que cumprirem as
metas ganharão incentivos na remunera-
• A avaliação externa das escolas esta- ção dos profissionais.8
duais (obrigatória) e municipais (por ade-
são) permitirá a comparação dos resultados Essas metas ilustram a importância atri-
do SARESP com as avaliações nacionais buída aos resultados das avaliações em larga
(SAEB e a Prova Brasil), e servirá como escala nas gestões da Secretária Maria Helena
critério de acompanhamento das metas a Guimarães Castro (2007 a 2009) do Secretário
serem atingidas pelas escolas. Paulo Renato de Souza (abril de 2009 a 2010). As
• Participação de toda a rede na Prova metas 8 e 9 permitem concluir que os objetivos
Brasil (novembro de 2007). indicados para o SARESP em 1996 permanecem
• Capacitação dos professores para o uso até os dias atuais, evidenciando que a avaliação
dos resultados do SARESP no planejamento deve servir tanto para uso dos gestores dos sis-
pedagógico das escolas em fevereiro de 2008. temas, quanto na orientação do planejamento e
do trabalho pedagógico nas escolas.
7 - O Bônus Mérito foi instituído no Governo de Mario Covas (1999- A política iniciada na gestão da
2001), pela Lei Complementar no 891/00, e mantido durante as gestões Secretária Maria Helena e que vem tendo
de Geraldo Alckmin (2001-2002 e 2003-2006). Atualmente, na gestão
de José Serra, a Secretaria de Estado da Educação instituiu novo Bônus
continuidade revela preocupação com a apro-
Mérito, cujo cálculo baseia-se no Índice de Desenvolvimento da Educação priação dos resultados pelos órgãos gestores
do Estado de São Paulo (IDESP), o qual tem como um de seus critérios o do sistema e pelas escolas. Dentre as medidas
desempenho dos alunos nas provas de língua portuguesa e matemática do
SARESP. Essa vinculação fortalece a relação entre o pagamento do bônus tomadas em tal gestão, está a implantação de
e a avaliação em larga escala. Para saber mais sobre a bonificação por um currículo unificado que se apresenta como
resultados, ver Lei Complementar no 1.078/08 e Resoluções SEE nº 21/09;
22/09; 23/09 e 26/09. Para informações sobre o IDESP, consultar <http://
idesp.edunet.sp.gov.br>. 8 - Disponível em: <www.educacao.sp.gov.br>. Acesso em: 15 jan. 2010.
382 Alicia BONAMINO; Sandra Zákia SOUSA. Três gerações de avaliação da educação básica no Brasil: interfaces...
e a média dos resultados efetivamente alcança- sores que atuam em modalidades de ensino não
dos demonstra o percentual obtido pela escola testadas, como educação de jovens e adultos e
em relação às suas metas. educação infantil, têm acesso ao bônus caso a
As metas de 2008 foram definidas de escola possua alguma série testada. Para as es-
forma que as escolas alcançassem o ponto mé- colas que não alcançarem as metas, a legislação
dio entre o Idepe inicial, em 2005, e a meta de prevê reforço técnico, pedagógico e estrutural,
2009. Essas metas variaram entre os grupos de com o objetivo de elas reenquadrarem-se nos
baixo desempenho, desempenho intermediário e critérios do BDE no ano letivo seguinte.
alto desempenho. No entanto, a partir de 2009, Além do resultado das escolas, o site
as metas são únicas para todas as escolas den- da avaliação apresenta as matrizes utilizadas
tro de um mesmo grupo. na elaboração dos itens dos testes, com expli-
O Saepe constitui uma avaliação de ter- cações detalhadas sobre os descritores, os co-
ceira geração em apoio a mecanismos de res- nhecimentos e as competências esperadas para
ponsabilização forte cuja expressão mais con- cada série dos ensinos fundamental e médio,
sistente é o referido BDE. A bonificação varia além de boletins de resultados contendo a aná-
de 50% a 100%: as escolas estaduais que ob- lise contextual com informações nacionais e
tiverem um índice global abaixo de 50% não por município e Estado.
recebem o bônus; a escola que alcançar 50% O Saepe constitui-se, assim, como uma
da meta estipulada recebe a metade do bônus; a avaliação capaz de pautar o currículo e o que
partir daí, o valor é proporcional ao percentual os alunos devem aprender em cada fase do ci-
da meta atingido. clo escolar.
A Secretaria de Educação também in-
centiva o reconhecimento dos professores que Avaliação em larga escala e
permanecem numa mesma escola. Para tanto, o currículo escolar: o que dizem as
cálculo do bônus considera a proporcionalidade pesquisas?
no cumprimento da meta a partir de 50% e a
lotação do professor na escola por, no mínimo, Avaliações de segunda e terceira gera-
seis meses do ano letivo de referência para a ção, associadas à introdução de políticas de
concessão da remuneração. O BDE é coletivo, responsabilização baseadas em consequências
uma vez que todos os funcionários lotados e em simbólicas e materiais, têm o propósito de criar
exercício na escola têm direito ao bônus. Ele é incentivos para que o professor se esforce no
também proporcional ao salário e ao percentual aprendizado dos alunos. No entanto, evidên-
de cumprimento da meta. cias nacionais e internacionais mostram que
Em Pernambuco, o valor máximo a ser principalmente o uso de resultados das avalia-
recebido por cada servidor não está definido a ções de terceira geração para informar inicia-
priori. Enquanto em São Paulo esse valor che- tivas de responsabilização forte pode envolver
ga, no máximo, a 2,4 salários, em Pernambuco, riscos para o currículo escolar. Um deles é a
apenas o valor total alocado pelo governo situação conhecida como ensinar para o teste,
para pagamento do bônus é fixo. Além dis- que ocorre quando os professores concentram
so, a condição para que os servidores de uma seus esforços preferencialmente nos tópicos
escola tenham acesso ao bônus é a existência que são avaliados e desconsideram aspectos
de uma das séries testadas pelo Saepe (4ª e 8ª importantes do currículo, inclusive de caráter
série do ensino fundamental e 3º ano do ensino não cognitivo.
médio). Desse modo, uma escola que atenda ex- É difícil discordar da alegação de que as
clusivamente a modalidades de ensino não tes- avaliações em larga escala lidam com uma visão
tadas não tem acesso ao bônus. Porém, profes- estreita de currículo escolar diante do que as es-
384 Alicia BONAMINO; Sandra Zákia SOUSA. Três gerações de avaliação da educação básica no Brasil: interfaces...
Pesquisas que analisaram a implementa- obterem melhores resultados, como ensinar a pre-
ção da avaliação no Estado de São Paulo desta- encher gabaritos e aplicar provas com questões
cam elementos que ilustram as transformações semelhantes às provas do Sistema.
que vêm ocorrendo no currículo9. Os estudos Uma pesquisa realizada por Paulo
feitos há mais tempo tendem a indicar poucos Henrique Arcas (2009) focalizou eventuais re-
efeitos do SARESP no cotidiano escolar, embora percussões do SARESP na avaliação escolar,
destaquem reações de desconfiança e de resis- procurando apreender características e tendên-
tência ao Sistema por parte dos profissionais cias da avaliação após sua implantação. Para
da educação (OLIVEIRA, 1998; ESTEVES, 1998; tanto, realizou-se um estudo em uma diretoria
FELIPE, 1999; KAWAUCHI, 2001). Esses estu- regional de ensino na região metropolitana de
dos, que tiveram como foco eventuais reflexos São Paulo, buscando-se a opinião de professo-
do SARESP na escola, considerando, em espe- res-coordenadores. Por meio de questionário e
cial, opiniões e reações de professores, tendem entrevista, o objetivo foi analisar como viam o
a não identificar influências de seus resultados SARESP e como foram construindo suas opini-
no currículo escolar. ões acerca dele no período de sua vigência – no
É a partir dos estudos realizados na se- caso da referida pesquisa, até 2007. Essas opini-
gunda metade da década de 2000 que são iden- ões possibilitaram identificar como a avaliação
tificadas evidências de efeitos do SARESP no em larga escala vem incidindo na avaliação e
contexto escolar. Lilian Rose Freire (2008) re- no currículo escolar.
alça, nas conclusões de sua pesquisa, realizada Ficou evidente, na fala dos professores-
em uma escola da rede estadual, alguns usos dos -coordenadores entrevistados, que há uma
resultados do SARESP, tais como: i) utilização tendência de aceitação do SARESP, embora,
na composição das notas bimestrais dos alunos; inicialmente, o Sistema tenha sido visto por
ii) reprodução de questões na prova unificada eles com desconfiança. Há evidências de que
criada pela escola, com a intenção de treinar os dados obtidos na avaliação são analisados e
os alunos para a avaliação; iii) utilização, pe- discutidos no planejamento escolar, no início
los professores de português, das orientações do do ano, e também no replanejamento, no início
SARESP relativas à correção de redações, para do segundo semestre letivo. Os resultados da
orientar os alunos nas redações escolares, o que escola e das turmas são analisados e orientam o
pode representar aprimoramento de práticas vi- trabalho escolar, definindo habilidades, compe-
gentes; iv) incentivo à participação dos alunos tências e conteúdos a serem ensinados.
no dia da aplicação das provas do SARESP, por Assim, pode-se afirmar que o SARESP
meio de atribuição de nota a ser considerada na vem-se fazendo presente gradualmente, in-
média bimestral. fluenciado práticas, definindo metas, estabele-
As informações apresentadas por essa pes- cendo rumos, orientando o trabalho pedagógico.
quisa indicam que o significado assumido pelo Outra revelação importante sobre as implica-
SARESP e por seus resultados no contexto da ções de tal avaliação no contexto escolar é que
escola pesquisada não se associa à ideia de uma ela tem incidido sobre as práticas avaliativas
avaliação que traga subsídios para a orientação e desenvolvidas na escola. As evidências da refe-
o replanejamento do trabalho escolar. Com exce- rida pesquisa demonstraram que a avaliação da
ção da iniciativa no uso de critérios para correção aprendizagem realizada na escola toma a ava-
de redações, a interação com o SARESP, ao que liação em larga escala como referência.
parece, é mais instrumental, no sentido de im-
plantar iniciativas que possam ajudar os alunos a Entretanto, o que pôde ser constatado é
9 - As considerações relativas ao SARESP foram extraídas de SOUSA; que o SARESP, ao servir como referência
ARCAS, 2010. para as práticas avaliativas empreendidas
386 Alicia BONAMINO; Sandra Zákia SOUSA. Três gerações de avaliação da educação básica no Brasil: interfaces...
garantidas a todos os alunos de ensino fun- cisariam ser aprendidos por todos os alunos,
damental e médio. bem como uma definição mais clara do que es-
Diante disso, o desafio parece ser a com- ses alunos deveriam ter aprendido ao final de
patibilização dos objetivos, desenhos e usos cada ciclo nessas duas áreas do saber escolar.
dos resultados das três gerações de avaliação É aí que se insere a necessidade de aumentar
em larga escala a fim de propiciar uma dis- o acervo de pesquisas que contribuam para a
cussão informada sobre os aspectos específicos compreensão dos impactos das novas gerações
de língua portuguesa e matemática que pre- da avaliação educacional no currículo escolar.
Referências
ARCAS, Paulo Henrique. Implicações da progressão continuada e do SARESP na avaliação escolar: tensões, dilemas e
tendências. Tese (Doutorado) – Faculdade de Educação, Universidade de São Paulo, São Paulo, 2009.
BONAMINO, Alicia. Tempos de avaliação educacional: o SAEB, seus agentes, referências e tendências. Rio de Janeiro: Quartet,
2002.
BROOKE, Nigel. O futuro das políticas de responsabilização no Brasil. Cadernos de Pesquisa, São Paulo, v. 36, n. 128, p. 377-
401, 2006.
CARNOY, Martin; LOEB, Susanna. Does external accountability affect student outcomes? A cross-state analysis. Educational
Evaluation and Policy Analysis, v. 24, n. 4, p. 305-331, 2002.
CENEVIVA, Ricardo. Democracia, accountability e avaliação: a avaliação de políticas públicas como mecanismo de controle
democrático. Dissertação (Mestrado) – Fundação Getúlio Vargas, São Paulo, 2005.
ESTEVES, Maria Eunice de P. Sistema de Avaliação de Rendimento Escolar do Estado de São Paulo - SARESP: uma ação
planejada. Dissertação (Mestrado) – Pontifícia Universidade Católica de São Paulo, São Paulo, 1998.
FELIPE, Jesse Pereira. Uma análise crítica do Sistema de Avaliação de Rendimento Escolar do Estado de São Paulo:
SARESP. Dissertação (Mestrado) – Pontifícia Universidade Católica de São Paulo, São Paulo, 1999.
FERNANDES, Reynaldo. Índice de Desenvolvimento da Educação Básica (Ideb). Brasília: Instituto Nacional de Estudos e
Pesquisas Educacionais Anísio Teixeira, 2007.
FERNANDES, Reynaldo; GREMAUD, Amaury. Qualidade da educação básica: avaliação, indicadores e metas. In: VELOSO, Fernando
et al. (Orgs.). Educação básica no Brasil: construindo o país do futuro. Rio de Janeiro: Elseiver, 2009.
FREIRE, Lilian Rose S. Carvalho. SARESP 2005: as vicissitudes da avaliação em uma escola da rede estadual. Dissertação
(Mestrado) – Faculdade de Educação, Universidade de São Paulo, São Paulo, 2008.
FREITAS, Dirce Nei Teixeira de. A avaliação da educação básica no Brasil: dimensão normativa, pedagógica e educativa.
Campinas: Autores Associados, 2007.
GATTI, Bernadete A. Testes e avaliações do ensino no Brasil. Educação e Seleção, São Paulo, n. 16, p. 12-21, 1987.
HANUSHEK, Eric A. United States lessons about school accountability. CESifo DICE Report 4, 2004.
HORTA NETO, João Luiz. Avaliação externa: a utilização dos resultados do SAEB 2003 na gestão do sistema público de Ensino
Fundamental no Distrito Federal. Dissertação (Mestrado) – Faculdade de Educação, Universidade de Brasília, Brasília, DF, 2006.
KAWAUCHI, Mary. SARESP e ensino de história: algumas questões. Dissertação (Mestrado) – Faculdade de Educação,
Universidade de São Paulo, São Paulo. 2001.
LOPES, Valéria Virgínia. Cartografia da avaliação educacional no Brasil. Tese (Doutorado) – Faculdade de Educação, Universidade
de São Paulo, São Paulo, 2007.
OLIVEIRA, Ana Paula M. A Prova Brasil como política de regulação da rede pública do Distrito Federal. Dissertação (Mestrado)
– Faculdade de Educação, Universidade de Brasília, Brasília, DF, 2011.
OLIVEIRA, Duzolina Alfredo F. de. Uma avaliação política do SARESP. Dissertação (Mestrado) – Universidade Estadual de
Campinas, Campinas, 1998.
SÃO PAULO. Secretaria de Estado de Educação. SARESP: documento de implantação. São Paulo: FDE, 1996.
SOUSA, Sandra Zákia; ARCAS, Paulo Henrique. Implicações da avaliação em larga escala no currículo: revelações de escolas
estaduais de São Paulo. Educação: Teoria e Prática, Rio Claro, v. 20, n. 35, p. 181-199, jul./dez. 2010.
SOUSA, Sandra Zákia; OLIVEIRA, Romualdo Portela de. Sistemas de avaliação educacional no Brasil: características, tendências
e uso dos resultados. Relatório de pesquisa apresentado à FAPESP, São Paulo, jul. 2007.
ZAPONI, Margareth; VALENÇA, Epifânia. Política de responsabilização educacional: a experiência de Pernambuco. Abr. 2009.
Disponível em: <www.abave.org.br>.
Alicia Bonamino é professora associada da Pontifícia Universidade Católica do Rio de Janeiro e coordenadora do Laboratório
de Avaliação em Educação (LAEd).
Sandra Zákia Sousa é doutora em Educação, professora da Faculdade de Educação da Universidade de São Paulo, atuando
na pós-graduação em Estado, Sociedade e Educação, e do mestrado em Educação da Universidade Cidade de São Paulo.
Possui publicações predominantemente no campo da avaliação educacional. Email: sanzakia@usp.br
388 Alicia BONAMINO; Sandra Zákia SOUSA. Três gerações de avaliação da educação básica no Brasil: interfaces...