ISSN | 2237-9045 |
---|---|
Instituição | Universidade Federal de Viçosa |
Nível | Graduação |
Modalidade | Pesquisa |
Área de conhecimento | Ciências Exatas e Tecnológicas |
Área temática | Ciência da computação |
Setor | Instituto de Ciências Exatas e Tecnológicas - Campus Florestal |
Bolsa | PIBIC/CNPq |
Conclusão de bolsa | Sim |
Apoio financeiro | CNPq |
Primeiro autor | Pedro Augusto Maia Silva |
Orientador | FABRICIO AGUIAR SILVA |
Título | Classificação Semântica de Pontos de Interesse |
Resumo | Contextualização: Analisar e extrair informações de dados de localização podem trazer diversos benefícios, tanto para empresas privadas quanto para o âmbito público. Dentre as várias possibilidades de extração de conhecimento, uma delas é entender os pontos de interesses (PoIs) dos usuários, que são locais importantes e constantemente visitados pelos mesmos. Essa é uma tarefa muito importante, pois dados brutos de localização geralmente contém pouca informação para ser utilizada. Objetivo: Dessa maneira, o objetivo deste trabalho é implementar uma versão do algoritmo chamado K-FN utilizando as tecnologias Scala, Python e Spark, visando trabalhar com grandes volumes de dados. O K-FN explora a informação dos padrões de mobilidade dos usuários para prever cada categoria de um local visitado, ao invés de usar a maioria votada entre as categorias de locais concorrentes mais próximos. A decisão de usar este algoritmo leva em consideração o fato dele utilizar ambas as distâncias entre os vizinhos mais próximos e informações de movimentos sobre o usuário na cidade para selecionar o vizinho mais favorável. Materiais e métodos: Nesse sentido, a solução foi implementada para trabalhar com os dados de maneira paralela e distribuída no contexto da biblioteca SENDAS. O projeto utilizou da estrutura do “Traje Data Frame” contido na biblioteca para abstrair os dados e realizar as devidas manipulações. Dessa forma, a classificação semântica de pontos de interesse permite que a biblioteca possa trabalhar com dados geolocalizados, identificando a semântica descrita dos check-ins. Vale ressaltar que o trabalho anteriormente apresentado continha alguns gargalos e falhas na implementação que puderam ser solucionados aproveitando as estruturas da biblioteca como já supracitado, permitindo uma melhor eficiência do algoritmo. Além disso, algumas modificações e verificações permitiram que eventuais erros na implementação fossem minimizados, tais como verificação de divisão por 0 e a seleção das colunas estritamente necessárias para a execução. Resultados: Após as modificações implementadas, o algoritmo K-FN obteve uma acurácia e revocação de 78%, com uma precisão de 100%. Isso significa que o modelo teve um bom desempenho na identificação correta dos pontos de interesse dos usuários, com uma alta taxa de previsões corretas para as categorias dos locais visitados. |
Palavras-chave | Dados geoespaciais, Pontos de Interesse, Algoritmo de classificação |
Forma de apresentação..... | Painel |
Link para apresentação | Painel |
---|