Nova forma de divulgar dados do Enem e do Censo Escolar pelo Inep contraria interesse público e inviabiliza diversas pesquisas

2022-03-16T12:44:39-03:00 22/02/2022|

O Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep) publicou em seu site, no dia 18/2, o que chamou de microdados do Enem 2020 e do Censo Escolar 2021. Sob o argumento de “suprimir a possibilidade de identificação de pessoas, em atendimento às normas previstas na Lei n.º 13.709, de 14 de agosto de 2018 (Lei Geral de Proteção de Dados Pessoais – LGPD)”, o órgão omitiu diversas informações fundamentais para o acompanhamento e a elaboração de políticas públicas. Indo, desta forma, na contramão do interesse público e dificultando o trabalho de pesquisadores da área de Educação. 

Em relação ao Enem, o caso menos grave, o Inep divulgou, de fato, os microdados, possibilitando o acesso às notas e respostas no nível do aluno. Contudo, a autarquia retirou o código das escolas, o que nos impede de fazer análises a partir da variável escola, separando os estudantes entre as unidades de ensino. Isso inviabiliza uma série de análises mais aprofundadas com foco nas desigualdades existentes no sistema. Exemplos: a) relação entre a nota dos estudantes no Enem e o nível socioeconômico médio dos alunos da escola; b) participação dos estudantes no Enem versus o nível socioeconômico da escola; c) identificação das desigualdades de notas no Enem intra e entre escolas. 

Nesse sentido, entendemos que, ao ocultar os dados das escolas, o Inep fez uma opção ruim para se adequar à LGPD. O órgão poderia ter “mascarado”  esses dados, utilizando códigos fictícios, que não permitiriam a identificação dos nomes das escolas — e a elaboração dos famigerados “rankings do Enem”, por exemplo — mas continuariam a possibilitar análises por nível socioeconômico dos alunos, que são importantes em termos de políticas públicas. Isso não é, a priori, algo complexo de ser feito e já é adotado há bastante tempo em outras avaliações internacionais, como é o caso do Pisa (Programme for International Student Assessment).

Em relação ao Censo Escolar, a situação é bem mais grave. Ao contrário do Enem, não é possível sequer chamar de “microdados” o que foi apresentado pelo Inep, já que não foram divulgados dados por aluno matriculado e por docente, que são unidades de observação do mapeamento. O órgão disponibilizou somente uma espécie de “sinopse estatística ampliada”, com dados que chegam ao nível da escola. É importante ressaltar que, desde 2007, os dados eram divulgados no nível do aluno e essa mudança representa um retrocesso. 

Sem os microdados do Censo Escolar, os pesquisadores não conseguem, por exemplo, fazer análises demográficas de acesso educacional por etapa de ensino ou por localização da escola (urbanas versus escolas rurais). São inviáveis ainda análises por cor/raça dos estudantes ou ainda considerando características específicas deles, como deficiência ou superdotação. No caso dos professores, faltam também informações sobre cor/raça, idade, formação e vínculo com a escola. Esses dados são essenciais para se conhecer melhor quem são os profissionais que atuam na Educação Básica para que, a partir disso, sejam criadas políticas que atendam às necessidades deles. 

Tão grave quanto a falta dos microdados da edição 2021 do Censo Escolar foi a retirada do portal do Inep de todas as bases de microdados do Censo Escolar de anos anteriores. 

Destacamos que a LGPD é uma lei importante e bem-vinda. Quando o Inep começou a divulgar os microdados do Censo Escolar, há 15 anos, tais informações costumavam ficar mais restritas entre os pesquisadores. Hoje, felizmente, há um público mais amplo com acesso a tais bases de dados e com conhecimento técnico para fazer essas análises, de jornalistas a gestores, o que exige também mais cuidado para assegurar a não identificação de diretores, professores e estudantes. 

Embora nome e CPF não estejam disponíveis, entendemos que há sim a necessidade de mecanismos adicionais para garantir a anonimização das informações. Um deles seria, por exemplo, a exclusão da data de nascimento dos estudantes e a substituição por datas de referência (indicando a idade deles em determinado dia e mês). Outra informação que não necessariamente é essencial para pesquisa e, eventualmente, poderia ser excluída é o local de nascimento do aluno. Em última instância, caso o Inep julgue complicado demais decidir quais variáveis manter e quais excluir das bases, uma opção seria “mascarar” os dados, o que não compromete parte dos estudos. As pesquisas mais complexas e dificultadas por essa questão poderiam ser feitas na sala de sigilo do Inep, que, no futuro, deveria ser possível de ser acessada a distância, e não apenas presencialmente, em Brasília, como é hoje. 

Defendemos que pesquisadores e a sociedade como um todo devem ter acesso às informações que necessitam. E não necessariamente eles precisam ser atendidos da mesma forma ou com o mesmo “produto”. O Inep deveria, além de voltar a permitir o acesso aos microdados, avançar em sinopses estatísticas cada vez mais detalhadas e em mecanismos de acesso a dados semelhantes ao do Sidra, do IBGE.

Reiteramos: a LGPD é importante e os dados devem ser anonimizados e preservados. Contudo, o Inep deveria, a partir de um estudo rigoroso sobre o tema, definir formas de adequar suas bases de dados para cumprir à LGPD, sem que isso represente falta de transparência, censura e, consequentemente, um enorme retrocesso na área de Educação. O não acesso aos dados não é e nunca será a melhor solução. 

*Crédito da foto: Valter Campanato/Agência Brasil