Simpósio de Integração Acadêmica - Universidade Federal de Viçosa

"Ciências Básicas para o Desenvolvimento Sustentável"

24 a 26 de outubro de 2023

Trabalho 19632

ISSN	2237-9045
Instituição	Universidade Federal de Viçosa
Nível	Graduação
Modalidade	Pesquisa
Área de conhecimento	Ciências Exatas e Tecnológicas
Área temática	Ciência da computação
Setor	Instituto de Ciências Exatas e Tecnológicas - Campus Florestal
Bolsa	PIBIC/CNPq
Conclusão de bolsa	Sim
Apoio financeiro	CNPq
Primeiro autor	Pedro Augusto Maia Silva
Orientador	FABRICIO AGUIAR SILVA
Título	Classificação Semântica de Pontos de Interesse
Resumo	Contextualização: Analisar e extrair informações de dados de localização podem trazer diversos benefícios, tanto para empresas privadas quanto para o âmbito público. Dentre as várias possibilidades de extração de conhecimento, uma delas é entender os pontos de interesses (PoIs) dos usuários, que são locais importantes e constantemente visitados pelos mesmos. Essa é uma tarefa muito importante, pois dados brutos de localização geralmente contém pouca informação para ser utilizada. Objetivo: Dessa maneira, o objetivo deste trabalho é implementar uma versão do algoritmo chamado K-FN utilizando as tecnologias Scala, Python e Spark, visando trabalhar com grandes volumes de dados. O K-FN explora a informação dos padrões de mobilidade dos usuários para prever cada categoria de um local visitado, ao invés de usar a maioria votada entre as categorias de locais concorrentes mais próximos. A decisão de usar este algoritmo leva em consideração o fato dele utilizar ambas as distâncias entre os vizinhos mais próximos e informações de movimentos sobre o usuário na cidade para selecionar o vizinho mais favorável. Materiais e métodos: Nesse sentido, a solução foi implementada para trabalhar com os dados de maneira paralela e distribuída no contexto da biblioteca SENDAS. O projeto utilizou da estrutura do “Traje Data Frame” contido na biblioteca para abstrair os dados e realizar as devidas manipulações. Dessa forma, a classificação semântica de pontos de interesse permite que a biblioteca possa trabalhar com dados geolocalizados, identificando a semântica descrita dos check-ins. Vale ressaltar que o trabalho anteriormente apresentado continha alguns gargalos e falhas na implementação que puderam ser solucionados aproveitando as estruturas da biblioteca como já supracitado, permitindo uma melhor eficiência do algoritmo. Além disso, algumas modificações e verificações permitiram que eventuais erros na implementação fossem minimizados, tais como verificação de divisão por 0 e a seleção das colunas estritamente necessárias para a execução. Resultados: Após as modificações implementadas, o algoritmo K-FN obteve uma acurácia e revocação de 78%, com uma precisão de 100%. Isso significa que o modelo teve um bom desempenho na identificação correta dos pontos de interesse dos usuários, com uma alta taxa de previsões corretas para as categorias dos locais visitados.
Palavras-chave	Dados geoespaciais, Pontos de Interesse, Algoritmo de classificação
Forma de apresentação.....	Painel

Link para apresentação	Painel

Universidade Federal de Viçosa

Gerado em 0,75 segundos.