ISSN |
2237-9045 |
Instituição |
Universidade Federal de Viçosa |
Nível |
Graduação |
Modalidade |
Pesquisa |
Área de conhecimento |
Ciências Exatas e Tecnológicas |
Área temática |
Teoria e Tecnologia da informação |
Setor |
Instituto de Ciências Exatas e Tecnológicas |
Conclusão de bolsa |
Não |
Apoio financeiro |
SICOOB-UFVCredi |
Primeiro autor |
Murilo Rodrigues Gervasio |
Orientador |
PABLO LUIZ ARAUJO MUNHOZ |
Título |
Desenvolvimento de um algoritmo de agrupamento utilizando técnicas de pesquisa operacional. |
Resumo |
A grande dissipação da tecnologia em grande escala vem gerando uma quantidade enorme de dados, dados estes que são a matéria prima do conhecimento e que precisam ser processados e analisados para gerar informações e vantagens. Esse processo de "garimpagem" dos dados e extração de informação é chamado de mineração de dados, a mineração de dados aborda técnicas para retirada de informação em meio a uma grande quantidade de dados brutos. no qual é englobado o agrupamento. Agrupamento é uma técnica da mineração de dados que tem como objetivo principal o particionamento dos objetos de uma base de dados em grupos onde objetos que são similares entre si tendem a ser agrupados em um mesmo grupo e objetos de grupos distintos são dissimilares entre si, a partir dessa organização dos dados podem ser criadas relações entre grupos e até mesmo padrões de um determinado grupo. A quantidade de soluções possíveis para um problema de agrupamento é enorme, se tratando de um problema combinatório a quantidade de soluções cresce exponencialmente com quantidade de objetos da base de dados a ser particionada implicando que a busca da solução ótima é sempre de difícil alcance. Esse trabalho então tem como objetivo a elaboração de um algoritmo automático de agrupamento utilizando meta-heurísticas da área da pesquisa operacional tendo como objetivo a solução do problema de agrupamento, e sua implementação em C++. Para validação do mesmo o algoritmo é posto em comparação com algoritmos já bem consolidados da área como k-means que tenta solucionar o problema do agrupamento usando como base centros de massa, associando os objetos de um mesmo grupo a um centro de massa respectivo e o DBSCAN que particiona os objetos por meio de áreas de densidade, áreas com uma grande quantidade de objetos similares se tornam um grupo sendo separados por áreas de baixa densidade. A forma de comparação para validação do algoritmo é por meio de índices já existentes na literatura como jaccard, silhueta e rand que avaliam uma solução e informa um valor escalar para a solução de um agrupamento podendo então comparar as soluções do algoritmo desenvolvido com dos algoritmos previamente citados. São esperados então resultados suficientemente melhores que dos algoritmos já existentes na área de forma que seja viavel a utilização do algoritmo desenvolvido neste trabalho. |
Palavras-chave |
Mineração de dados, Pesquisa Operacional, Agrupamento |
Forma de apresentação..... |
Painel |