Iede realiza análise empírica sobre a supressão dos microdados do Censo Escolar

2022-04-08T18:52:59-03:00 10/03/2022|

O Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep) divulgou, no dia 18 de fevereiro, os dados detalhados do Censo Escolar 2021 e do Enem 2020. Sob a justificativa de atender à Lei Nº 13.709, de 14 de agosto de 2018, a Lei Geral de Proteção de Dados Pessoais (LGPD), o órgão realizou mudanças importantes nas bases de dados. No caso do Enem, removeu as variáveis que traziam informações sobre as escolas e os municípios dos participantes. Em relação ao Censo Escolar 2021, divulgou uma espécie de “sinopse estatística expandida”, excluindo informações no nível do aluno e dos docentes (não pode ser chamada de microdados). Além disso, as bases de dados de edições anteriores do Censo Escolar foram removidas do site do Inep.

Há, portanto, duas situações distintas impostas pelo Inep: no caso do Enem 2020, trata-se de adequação à LGPD, que foi entendida e aplicada de forma bastante restritiva. No caso do Censo Escolar 2021, mais grave, trata-se da supressão de dados: não foram divulgados os microdados da edição 2021, como também foram retiradas do site as bases anteriores do Censo.

Nós nos atemos ao Censo Escolar e propomos um exercício com a base de dados 2020 mostrando que, com a realização de ajustes em algumas variáveis e a exclusão de (poucas) outras, é possível pseudoanonimizar os dados de todos os estudantes.

A intenção é mostrar, empiricamente, que mesmo uma interpretação extrema — e equivocada — da LGPD não inviabilizaria a divulgação dos microdados. Há muitas opções, a partir do ajuste em variáveis, de reduzir drasticamente ou mesmo zerar a possibilidade de re-identificação dos titulares dos dados (estudantes, professores e diretores, no caso concreto).

Acesse aqui a análise que fizemos
Leia posicionamento do Iede sobre a nova forma de divulgação de dados do Enem e do Censo Escolar