Das Montanhas de Minas ao Oceano : Os Caminhos da Ciência para um futuro sustentável

20 a 24 de outubro de 2025

Trabalho 21689

Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Humanas e Sociais
Área temática Dimensões Sociais: ODS4
Setor Instituto de Ciências Humanas e Sociais
Bolsa FAPEMIG
Conclusão de bolsa Sim
Apoio financeiro FAPEMIG
Primeiro autor Milena Ester de Almeida
Orientador GILBERTO VENANCIO LUIZ
Título Aplicação de técnicas de machine learning na previsão de estudantes em risco de evasão em uma Universidade Federal
Resumo A evasão no ensino superior tem se consolidado como uma das principais preocupações das instituições públicas de ensino, por seus impactos negativos tanto na sustentabilidade financeira das universidades quanto na trajetória acadêmica e profissional dos estudantes. Este trabalho tem como objetivo aplicar técnicas de aprendizado de máquina supervisionado para prever a evasão estudantil na Universidade Federal de Viçosa, por meio da análise de dados acadêmicos e sociodemográficos de estudantes dos três campi da instituição, matriculados entre os anos de 2013 e 2024. A base de dados utilizada contempla variáveis sociodemográficas, como gênero, renda familiar, escolaridade dos pais, tipo de escola cursada no ensino médio e de desempenho acadêmico: notas do Enem, histórico de reprovações e coeficiente de rendimento acadêmico. Trata-se de uma pesquisa quantitativa, de caráter descritivo, atualmente em desenvolvimento, que tem como foco a construção de modelos preditivos utilizando algoritmos de aprendizado de máquina, tais como Redes Neurais Artificiais, Árvores de Decisão, Random Forest, Gradient Boosting e Support Vector Machine (SVM). Os modelos serão treinados com dados rotulados, classificando os estudantes como concluintes, abandonantes e ativos, e avaliados por meio de métricas como acurácia, precisão, recall, F1-score e AUC-ROC. A base de dados original contemplava um total de 68.514 estudantes dos três campi. Após os processos iniciais de limpeza e filtragem, que consideraram apenas os estudantes que ingressaram por meio do SISU, entre os anos de 2013 e 2024, e cujos registros estavam completos e compatíveis com os critérios definidos, sendo a amostra final composta por 39.397 estudantes. Para as análises, será usada a ferramenta Orange Data Mining, com base na linguagem Python. A partir dessa base, foi realizada uma análise exploratória preliminar das variáveis. Entre os estudantes da amostra, 49% são do sexo feminino e 51% do sexo masculino. Quanto ao tipo de escola cursada no ensino médio, 65% vieram de escolas públicas e 35% de escolas privadas. A média de reprovações por aluno foi de 4, enquanto o coeficiente de rendimento acumulado médio foi de 68 (em uma escala de 0 a 100). Em relação à situação acadêmica, 26% dos estudantes estavam em situação de abandono, 39% concluíram o curso e 35% permaneciam em situação regular no momento da coleta. Essas análises descritivas preliminares têm como objetivo apoiar a etapa de construção dos modelos de aprendizado de máquina, que ainda será realizada nas próximas fases do projeto. A comparação entre os três campi também contribuirá para a compreensão de possíveis diferenças regionais ou institucionais nos fatores associados à evasão. A partir dos resultados obtidos, espera-se que o modelo desenvolvido possa subsidiar o desenvolvimento de políticas institucionais de permanência estudantil.
Palavras-chave Evasão, Aprendizado de Máquina, Universidade
Apresentações
  • Vídeo: Local e horário não definidos.

Clique na forma de apresentação para ver a apresentação.

Link para apresentação Vídeo
Gerado em 0,87 segundos.