"Ciências Básicas para o Desenvolvimento Sustentável"

24 a 26 de outubro de 2023

Trabalho 19342

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Ciência da computação
Setor Instituto de Ciências Exatas e Tecnológicas - Campus Florestal
Bolsa CNPq
Conclusão de bolsa Sim
Apoio financeiro CNPq
Primeiro autor Fábio Trindade Ramos
Orientador GLAUCIA BRAGA E SILVA
Outros membros Matheus Kauan Passos de Souza
Título Mineração de repositórios de software com a biblioteca RIT para investigar a influência da relevância dos comentários no processo de controle de mudança
Resumo INTRODUÇÃO: Considerando que projetos de software são comumente implementados por diversos desenvolvedores, a comunicação constitui um dos principais gargalos para se garantir bons resultados. Nesse contexto, sistemas de issue tracking, presentes em repositórios de software, como o GitHub, desempenham um papel fundamental ao armazenar informações acerca das comunicações. Esses sistemas permitem que desenvolvedores relatem uma issue (problema, melhoria ou novo requisito) e discutam sobre sua solução. OBJETIVOS: Este trabalho objetiva avaliar o comportamento e a influência da relevância temática dos comentários, calculada pela Biblioteca RIT, em repositórios open-source do GitHub com alta atividade em issue tracking. MATERIAIS E MÉTODOS: O cálculo da relevância temática dos comentários das issues será feito por meio da biblioteca RIT, que abrange uma execução em três etapas: extração dos dados; cálculo da relevância temática; e exportação dos dados para um arquivo CSV. Neste trabalho, houve um refinamento na RIT, com o objetivo de melhorar o cálculo de relevância temática,no que compete à limpeza de alguns elementos nos textos dos comentários que podem prejudicar o cálculo da métrica. Para isso, foi acrescentada uma etapa de pré-processamento, que retira elementos da descrição e comentários das issues, tais como, trechos de código, referências de imagem, links, entre outros. A versão refinada da biblioteca foi utilizada para minerar dados de issue tracking da organização Ruby on Rails no GitHub. Além disso, os dados de relevância temática foram analisados em conjunto com outros atributos, como quantidade de comentários, quantidade de desenvolvedores envolvidos na discussão e desenvolvedores com alta atividade em issue tracking para se analisar possíveis impactos no tempo de resolução das issues. Por fim, como a biblioteca não fornece as informações necessárias para calcular o tempo de resolução das issues, a API REST do GitHub foi utilizada para conseguir essas informações, como a data de criação e fechamento das issues. RESULTADOS E CONCLUSÕES: Como resultado da aplicação da biblioteca, foram obtidas, em menos de 12 horas, as relevâncias temáticas de 228.439 comentários de 49.104 issues de um total de 88 repositórios. Algumas versões anteriores da biblioteca, levariam diversos dias para realizar o cálculo de relevância temática para este mesmo volume de dados. Além disso, foi descoberto que issues criadas por desenvolvedores que postam comentários relevantes, são resolvidas mais rapidamente do que quando eles não são responsáveis pela sua criação. Por fim, observou-se que a relevância temática, por si só, não possui relação com o tempo de resolução das issues e são necessárias novas análises para se avaliar o impacto da mesma de forma combinada com outros atributos, como complexidade e prioridade das issues, por exemplo.
Palavras-chave Mineração de Textos, Tempo de Resolução e Comunicações em Issue Tracking, Relevância dos comentários
Forma de apresentação..... Painel
Link para apresentação Painel
Gerado em 0,65 segundos.