"Ciências Básicas para o Desenvolvimento Sustentável"

24 a 26 de outubro de 2023

Trabalho 18197

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Ciência da computação
Setor Instituto de Ciências Exatas e Tecnológicas - Campus Florestal
Bolsa FAPEMIG
Conclusão de bolsa Sim
Apoio financeiro FAPEMIG
Primeiro autor Miguel Antônio Ribeiro e Silva
Orientador THAIS REGINA DE MOURA BRAGA SILVA
Outros membros Gabriel Vitor da Fonseca Miranda
Título Elaboração de rotas seguras para veículos coletivos urbanos
Resumo O objetivo do projeto em questão é investigar soluções para a elaboração de rotas seguras para veículos coletivos urbanos, levando em consideração dados sobre criminalidade municipal disponíveis. Neste contexto, o foco deste trabalho foi aprofundar a elaboração da base de dados que será utilizada para delimitação das áreas criminais a serem consideradas na criação deste tipo de rotas. Utilizando a APIv2 do Twitter, foram coletados e analisados sistematicamente tweets da cidade de São Paulo relacionados a crimes, visando coletar as informações desejadas.

O primeiro desafio foi selecionar as palavras chave relacionadas ao vocabulário criminal que pudessem ser utilizadas para filtrar tweets. Para isso, uma revisão de trabalhos da literatura foi realizada a fim de condensar os melhores e mais usados termos.

Um desafio adicional na busca por tweets com relatos criminais foi a determinação da localização associada aos crimes. Inicialmente, a estratégia era utilizar as coordenadas geográficas disponíveis no campo "place" dos tweets publicados por usuários que habilitaram sua localização. No entanto, essa opção foi descontinuada pela rede social em janeiro de 2014. A partir desta data, apenas tweets que continham informações provenientes do compartilhamento de outras redes sociais, como o Instagram, ainda possuíam a informação de latitude e longitude. Para contornar essa limitação, foram realizados estudos aprofundados sobre como filtrar os tweets por locais.

Uma das abordagens utilizadas foi o uso dos campos "place_id" e "place_name" presentes também no campo "place" de um tweet. Esses campos fornecem informações sobre um local em diferentes níveis, como cidade e bairro, especificando um polígono geográfico relacionado a essa localização.

Com o objetivo de facilitar a busca por bairros específicos, utilizando esses campos, foi criado um arquivo contendo todos os bairros da cidade de São Paulo. Esse arquivo foi utilizado para realizar buscas específicas de crimes ocorridos nessas áreas.

No entanto, descobriu-se que nem todos os tweets da cidade de São Paulo possuem um lugar (bairro) associado a eles. Alguns tweets possuem apenas informações de nível cidade, o que torna a localização de um crime muito genérica.

Ao buscar uma solução para esta questão, foi observado que, em muitos casos, a localização registrada em um tweet não corresponde ao local real do crime. Nesse sentido, foi levantada a possibilidade de buscar informações sobre a localização diretamente no texto publicado pelo usuário. Para abordar essa questão, está sendo conduzida uma revisão bibliográfica abrangente, visando identificar as melhores práticas no campo do Processamento de Linguagem Natural (PLN).

Os próximos passos do trabalho envolvem a seleção de estratégias de PLN e a construção de uma solução que combine os resultados desses algoritmos com os dados de localização dos tweets.
Palavras-chave criminalidade, Twitter, processamento de linguagem natural
Forma de apresentação..... Painel
Link para apresentação Painel
Gerado em 0,60 segundos.