ISSN | 2237-9045 |
---|---|
Instituição | Universidade Federal de Viçosa |
Nível | Graduação |
Modalidade | Pesquisa |
Área de conhecimento | Ciências Exatas e Tecnológicas |
Área temática | Ciência da computação |
Setor | Instituto de Ciências Exatas e Tecnológicas - Campus Florestal |
Bolsa | FAPEMIG |
Conclusão de bolsa | Sim |
Apoio financeiro | FAPEMIG |
Primeiro autor | Miguel Antônio Ribeiro e Silva |
Orientador | THAIS REGINA DE MOURA BRAGA SILVA |
Outros membros | Gabriel Vitor da Fonseca Miranda |
Título | Elaboração de rotas seguras para veículos coletivos urbanos |
Resumo | O objetivo do projeto em questão é investigar soluções para a elaboração de rotas seguras para veículos coletivos urbanos, levando em consideração dados sobre criminalidade municipal disponíveis. Neste contexto, o foco deste trabalho foi aprofundar a elaboração da base de dados que será utilizada para delimitação das áreas criminais a serem consideradas na criação deste tipo de rotas. Utilizando a APIv2 do Twitter, foram coletados e analisados sistematicamente tweets da cidade de São Paulo relacionados a crimes, visando coletar as informações desejadas. O primeiro desafio foi selecionar as palavras chave relacionadas ao vocabulário criminal que pudessem ser utilizadas para filtrar tweets. Para isso, uma revisão de trabalhos da literatura foi realizada a fim de condensar os melhores e mais usados termos. Um desafio adicional na busca por tweets com relatos criminais foi a determinação da localização associada aos crimes. Inicialmente, a estratégia era utilizar as coordenadas geográficas disponíveis no campo "place" dos tweets publicados por usuários que habilitaram sua localização. No entanto, essa opção foi descontinuada pela rede social em janeiro de 2014. A partir desta data, apenas tweets que continham informações provenientes do compartilhamento de outras redes sociais, como o Instagram, ainda possuíam a informação de latitude e longitude. Para contornar essa limitação, foram realizados estudos aprofundados sobre como filtrar os tweets por locais. Uma das abordagens utilizadas foi o uso dos campos "place_id" e "place_name" presentes também no campo "place" de um tweet. Esses campos fornecem informações sobre um local em diferentes níveis, como cidade e bairro, especificando um polígono geográfico relacionado a essa localização. Com o objetivo de facilitar a busca por bairros específicos, utilizando esses campos, foi criado um arquivo contendo todos os bairros da cidade de São Paulo. Esse arquivo foi utilizado para realizar buscas específicas de crimes ocorridos nessas áreas. No entanto, descobriu-se que nem todos os tweets da cidade de São Paulo possuem um lugar (bairro) associado a eles. Alguns tweets possuem apenas informações de nível cidade, o que torna a localização de um crime muito genérica. Ao buscar uma solução para esta questão, foi observado que, em muitos casos, a localização registrada em um tweet não corresponde ao local real do crime. Nesse sentido, foi levantada a possibilidade de buscar informações sobre a localização diretamente no texto publicado pelo usuário. Para abordar essa questão, está sendo conduzida uma revisão bibliográfica abrangente, visando identificar as melhores práticas no campo do Processamento de Linguagem Natural (PLN). Os próximos passos do trabalho envolvem a seleção de estratégias de PLN e a construção de uma solução que combine os resultados desses algoritmos com os dados de localização dos tweets. |
Palavras-chave | criminalidade, Twitter, processamento de linguagem natural |
Forma de apresentação..... | Painel |
Link para apresentação | Painel |
---|