Resumo |
INTRODUÇÃO: Considerando que projetos de software são comumente implementados por diversos desenvolvedores, a comunicação constitui um dos principais gargalos para se garantir bons resultados. Nesse contexto, sistemas de issue tracking, presentes em repositórios de software, como o GitHub, desempenham um papel fundamental ao armazenar informações acerca das comunicações. Esses sistemas permitem que desenvolvedores relatem uma issue (problema, melhoria ou novo requisito) e discutam sobre sua solução. OBJETIVOS: Este trabalho objetiva avaliar o comportamento e a influência da relevância temática dos comentários, calculada pela Biblioteca RIT, em repositórios open-source do GitHub com alta atividade em issue tracking. MATERIAIS E MÉTODOS: O cálculo da relevância temática dos comentários das issues será feito por meio da biblioteca RIT, que abrange uma execução em três etapas: extração dos dados; cálculo da relevância temática; e exportação dos dados para um arquivo CSV. Neste trabalho, houve um refinamento na RIT, com o objetivo de melhorar o cálculo de relevância temática,no que compete à limpeza de alguns elementos nos textos dos comentários que podem prejudicar o cálculo da métrica. Para isso, foi acrescentada uma etapa de pré-processamento, que retira elementos da descrição e comentários das issues, tais como, trechos de código, referências de imagem, links, entre outros. A versão refinada da biblioteca foi utilizada para minerar dados de issue tracking da organização Ruby on Rails no GitHub. Além disso, os dados de relevância temática foram analisados em conjunto com outros atributos, como quantidade de comentários, quantidade de desenvolvedores envolvidos na discussão e desenvolvedores com alta atividade em issue tracking para se analisar possíveis impactos no tempo de resolução das issues. Por fim, como a biblioteca não fornece as informações necessárias para calcular o tempo de resolução das issues, a API REST do GitHub foi utilizada para conseguir essas informações, como a data de criação e fechamento das issues. RESULTADOS E CONCLUSÕES: Como resultado da aplicação da biblioteca, foram obtidas, em menos de 12 horas, as relevâncias temáticas de 228.439 comentários de 49.104 issues de um total de 88 repositórios. Algumas versões anteriores da biblioteca, levariam diversos dias para realizar o cálculo de relevância temática para este mesmo volume de dados. Além disso, foi descoberto que issues criadas por desenvolvedores que postam comentários relevantes, são resolvidas mais rapidamente do que quando eles não são responsáveis pela sua criação. Por fim, observou-se que a relevância temática, por si só, não possui relação com o tempo de resolução das issues e são necessárias novas análises para se avaliar o impacto da mesma de forma combinada com outros atributos, como complexidade e prioridade das issues, por exemplo. |