"A Transversalidade da Ciência, Tecnologia e Inovações para o Planeta"

5 a 7 de outubro de 2021

Trabalho 14570

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Ciência da computação
Setor Instituto de Ciências Exatas e Tecnológicas - Campus Florestal
Bolsa PIBIC/CNPq
Conclusão de bolsa Sim
Apoio financeiro CNPq
Primeiro autor Estela Miranda Batista
Orientador GLAUCIA BRAGA E SILVA
Outros membros Fábio Trindade Ramos, Melissa Araújo
Título ColMiner: Modularização do Cálculo de Relevância Temática
Resumo Considerando a natureza colaborativa do desenvolvimento de software, à medida que o processo evolui uma quantidade expressiva de informação referente ao trabalho da equipe é gerada. Tais informações ficam concentradas nos repositórios das ferramentas de issue tracking e versionamento de código e, se devidamente analisadas, geram conhecimento relevante para o gerenciamento dos projetos e das equipes. Este trabalho propõe refinamentos e extensões na ferramenta do ColMiner, capaz de analisar as comunicações ocorridas no issue tracking do GitHub. A ferramenta está sendo remodelada e modularizada para facilitar o desacoplamento e modificações futuras, sendo que este trabalho objetiva a modularização da principal métrica do ColMiner, com criação de uma biblioteca para cálculo da relevância temática dos comentários das issues. Para isso, os algoritmos foram revisados e melhorados e as classes UML usadas para cálculo da relevância temática foram remodeladas para fins de migração para a linguagem Python. Em virtude dessa migração, foram escolhidas API’s, bibliotecas e ferramentas para realizar a extração dos dados e o processamento das informações: a API do GitHub para extrair os dados de issue tracking; a ferramenta SOBEK, para gerar os grafos dos comentários; a biblioteca NLTK para tirar stopwords, usar o dicionário de sinônimos em inglês, o algoritmo de Stemming e a radicalização; a pysinonimos, para o dicionário de sinônimos em português; e a NetworkX, para fazer a geração da estrutura computacional dos grafos. Após a remodelagem e migração do código, foi criada a primeira versão da biblioteca do ColMiner para cálculo de relevância temática. Os algoritmos usados na biblioteca usam as implementações originais da ferramenta Colminer, mantendo, portanto, o trabalho de Azevedo (2011) como base, mas propõe algumas adaptações. A principal adaptação diz respeito ao algoritmo para geração do grafo da discussão, incluindo todos os comentários que antecedem o avaliado ao invés de apenas o comentário anterior, com o intuito de proporcionar uma melhor precisão no cálculo de relevância da discussão da issue como um todo. Do ponto de vista do desempenho, a modificação do uso da versão offline do SOBEK ao invés do acesso ao webservice, trouxe melhoria no desempenho, pois reduziu consideravelmente o tempo de execução para geração dos grafos dos comentários. A biblioteca está sendo testada e será validada por meio da consulta a especialistas, que analisarão a relevância de alguns comentários para fins de comparação com as análises realizadas pela biblioteca. Como trabalhos futuros, pretende-se adaptar a biblioteca para suportar outras plataformas, como por exemplo o StackOverflow, em que também é fundamental conhecer os comentários e respostas mais relevantes. [Breno Fabrício Terra Azevedo. 2011. Minerafórum : um recurso de apoio para análise qualitativa em fóruns de discussão. Tese de Doutorado em Informática na Computação. Universidade Federal do Rio Grande do Sul].
Palavras-chave Gerenciamento de Comunicação, Repositórios de Software, Relevância Temática
Forma de apresentação..... Vídeo
Link para apresentação Vídeo
Gerado em 0,63 segundos.