| Resumo |
Exercícios de programação são uma parte importante do aprendizado de programação. Neste contexto, existem ferramentas, denominadas Ambientes de Correção Automática de Códigos (ACAC), que oferecem recursos valiosos para correção automática desse tipo de atividade por meio de um conjunto de casos de testes previamente cadastrados. Os dados desses exercícios podem ser usados como insumo para diversas aplicações, incluindo-as no campo de Análise de Aprendizagem. No entanto, há uma carência de repositórios de dados com enunciados em português brasileiro. Logo, o objetivo deste trabalho é apresentar uma metodologia de coleta e modelagem de um repositório de dados de exercícios de programação, incluindo enunciados, casos de teste e metadados dos exercícios. Para isso, inicialmente, são definidas plataformas como fonte de dados e aplicadas técnicas de coleta automática de dados para extração do conteúdo desejado. A partir da coleta, os dados são modelados e disponibilizados em repositório público referenciado como "ProgramExBR", que está publicamente disponível em: https://doi.org/10.5281/zenodo.15724871. Em resumo, o "ProgramExBR" é composto por 2.102 exercícios de programação oriundos de plataformas plataformas: Neps Academy, OBI e SPOJ-Brasil. Experimentos iniciais realizados com o repositório de dados construído neste projeto atestam seu potencial para uso em tarefas como recomendação e/ou criação de listas personalizadas de exercícios de programação para alunos com diferentes necessidades. Ademais, vale ressaltar que este projeto apresenta algumas limitações que devem ser consideradas na análise dos dados extraídos, como exercícios em duplicidade devido a sua presença em mais de uma plataforma coletada, perda de parte da formatação original do conteúdo, como elementos de marcação, listas, ou símbolos matemáticos devido à sua conversão para o formato JSON, contudo, a URL original de cada exercício é preservada no repositório disponibilizado, permitindo que o usuário consulte o site de origem sempre que necessário. Finalmente, espera-se que o "ProgramExBR" construído neste estudo possa ser útil em diversos outros contextos, seja para auxílio dos docentes, seja para treinamento de modelos de inferência e geração de novos exercícios ou até mesmo para uma aplicação em Análise de Aprendizagem, como métodos de recomendação personalizada no âmbito educacional. |