Ciência para a Redução das Desigualdades

16 a 18 de outubro de 2018

Trabalho 11085

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Teoria e Tecnologia da informação
Setor Instituto de Ciências Exatas e Tecnológicas
Conclusão de bolsa Não
Apoio financeiro SICOOB-UFVCredi
Primeiro autor Murilo Rodrigues Gervasio
Orientador PABLO LUIZ ARAUJO MUNHOZ
Título Desenvolvimento de um algoritmo de agrupamento utilizando técnicas de pesquisa operacional.
Resumo A grande dissipação da tecnologia em grande escala vem gerando uma quantidade enorme de dados, dados estes que são a matéria prima do conhecimento e que precisam ser processados e analisados para gerar informações e vantagens. Esse processo de "garimpagem" dos dados e extração de informação é chamado de mineração de dados, a mineração de dados aborda técnicas para retirada de informação em meio a uma grande quantidade de dados brutos. no qual é englobado o agrupamento. Agrupamento é uma técnica da mineração de dados que tem como objetivo principal o particionamento dos objetos de uma base de dados em grupos onde objetos que são similares entre si tendem a ser agrupados em um mesmo grupo e objetos de grupos distintos são dissimilares entre si, a partir dessa organização dos dados podem ser criadas relações entre grupos e até mesmo padrões de um determinado grupo. A quantidade de soluções possíveis para um problema de agrupamento é enorme, se tratando de um problema combinatório a quantidade de soluções cresce exponencialmente com quantidade de objetos da base de dados a ser particionada implicando que a busca da solução ótima é sempre de difícil alcance. Esse trabalho então tem como objetivo a elaboração de um algoritmo automático de agrupamento utilizando meta-heurísticas da área da pesquisa operacional tendo como objetivo a solução do problema de agrupamento, e sua implementação em C++. Para validação do mesmo o algoritmo é posto em comparação com algoritmos já bem consolidados da área como k-means que tenta solucionar o problema do agrupamento usando como base centros de massa, associando os objetos de um mesmo grupo a um centro de massa respectivo e o DBSCAN que particiona os objetos por meio de áreas de densidade, áreas com uma grande quantidade de objetos similares se tornam um grupo sendo separados por áreas de baixa densidade. A forma de comparação para validação do algoritmo é por meio de índices já existentes na literatura como jaccard, silhueta e rand que avaliam uma solução e informa um valor escalar para a solução de um agrupamento podendo então comparar as soluções do algoritmo desenvolvido com dos algoritmos previamente citados. São esperados então resultados suficientemente melhores que dos algoritmos já existentes na área de forma que seja viavel a utilização do algoritmo desenvolvido neste trabalho.
Palavras-chave Mineração de dados, Pesquisa Operacional, Agrupamento
Forma de apresentação..... Painel
Gerado em 0,60 segundos.