"Ciências Básicas para o Desenvolvimento Sustentável"

24 a 26 de outubro de 2023

Trabalho 19632

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Ciência da computação
Setor Instituto de Ciências Exatas e Tecnológicas - Campus Florestal
Bolsa PIBIC/CNPq
Conclusão de bolsa Sim
Apoio financeiro CNPq
Primeiro autor Pedro Augusto Maia Silva
Orientador FABRICIO AGUIAR SILVA
Título Classificação Semântica de Pontos de Interesse
Resumo Contextualização: Analisar e extrair informações de dados de localização podem trazer diversos benefícios, tanto para empresas privadas quanto para o âmbito público. Dentre as várias possibilidades de extração de conhecimento, uma delas é entender os pontos de interesses (PoIs) dos usuários, que são locais importantes e constantemente visitados pelos mesmos. Essa é uma tarefa muito importante, pois dados brutos de localização geralmente contém pouca informação para ser utilizada.
Objetivo: Dessa maneira, o objetivo deste trabalho é implementar uma versão do algoritmo chamado K-FN utilizando as tecnologias Scala, Python e Spark, visando trabalhar com grandes volumes de dados. O K-FN explora a informação dos padrões de mobilidade dos usuários para prever cada categoria de um local visitado, ao invés de usar a maioria votada entre as categorias de locais concorrentes mais próximos. A decisão de usar este algoritmo leva em consideração o fato dele utilizar ambas as distâncias entre os vizinhos mais próximos e informações de movimentos sobre o usuário na cidade para selecionar o vizinho mais favorável.
Materiais e métodos: Nesse sentido, a solução foi implementada para trabalhar com os dados de maneira paralela e distribuída no contexto da biblioteca SENDAS. O projeto utilizou da estrutura do “Traje Data Frame” contido na biblioteca para abstrair os dados e realizar as devidas manipulações. Dessa forma, a classificação semântica de pontos de interesse permite que a biblioteca possa trabalhar com dados geolocalizados, identificando a semântica descrita dos check-ins.
Vale ressaltar que o trabalho anteriormente apresentado continha alguns gargalos e falhas na implementação que puderam ser solucionados aproveitando as estruturas da biblioteca como já supracitado, permitindo uma melhor eficiência do algoritmo. Além disso, algumas modificações e verificações permitiram que eventuais erros na implementação fossem minimizados, tais como verificação de divisão por 0 e a seleção das colunas estritamente necessárias para a execução.
Resultados: Após as modificações implementadas, o algoritmo K-FN obteve uma acurácia e revocação de 78%, com uma precisão de 100%. Isso significa que o modelo teve um bom desempenho na identificação correta dos pontos de interesse dos usuários, com uma alta taxa de previsões corretas para as categorias dos locais visitados.
Palavras-chave Dados geoespaciais, Pontos de Interesse, Algoritmo de classificação
Forma de apresentação..... Painel
Link para apresentação Painel
Gerado em 0,64 segundos.