Resumo |
Governos vêm adotando o conceito de cidade inteligente associado ao uso de dados disponibilizados através das tecnologias da informação e comunicação (TICs) como forma de alcançar uma melhor gestão: nota-se, então, o potencial do uso de TIC 's junto a tecnologias informacionais relacionadas à Data Science como ferramentas que auxiliam o planejamento urbano. O presente trabalho teve como objetivo explorar essas potenciais ferramentas de planejamento e gestão urbana, estudando técnicas de obtenção de dados, além do processamento e análise por meio da mineração de dados. O estudo se deu através de artigos que abordaram o tema cidades inteligentes e as tecnologias que as envolvem, bem como o uso da mineração de dados, a fim de entender técnicas e buscar sua aplicabilidade no setor público, haja vista o grande uso no setor privado. Com isso, foi possível não somente entender o estado da arte da mineração de dados como também todo o processo de descoberta do conhecimento em base de dados (Knowledge Discovery in Databases – KDD), testando diversas técnicas em dados de mídias sociais. Os testes de algoritmos foram feitos utilizando a linguagem Python devido ao número de bibliotecas existentes voltadas para ciência de dados, além de ser uma linguagem open source; a metodologia segue as etapas do processo de descoberta do conhecimento: seleção, pré-processamento, transformação, mineração e avaliação. Para os testes voltados às técnicas de obtenção de dados, foi utilizada a biblioteca Python BeautifulSoup juntamente com a Urllib, que coleciona vários módulos para trabalhar com URLs. Utilizou-se, ainda, o Facepager, que é outra ferramenta open source que possibilita uma busca automatizada em páginas públicas de algumas redes sociais. Assim, foram coletados conteúdos de blogs de turismo e avaliações no site TripAdvisor, além de comentários em posts públicos de páginas do Facebook. Em seguida, foi feito o pré-processamento destes dados utilizando as bibliotecas Python Numpy e Pandas, ambas voltadas para manipulação e análise de dados. Por fim, utilizando as bibliotecas Python como sklearn, nltk e gensim foi possível a transformação e mineração dos dados, aplicando técnicas de processamento de linguagem natural de agrupamento, análise de sentimentos e modelagem de tópicos. Para visualização e análise dos resultados utilizou-se nuvens de palavras e gráficos a partir das bibliotecas WordCloud e Matplotlib. Deste modo, foi possível obter análises observando como os cidadãos expressam suas necessidades e expectativas nas mídias sociais, conhecendo os assuntos mais abordados pelos mesmos, assim como as percepções do espaço urbano em que estão inseridos, sendo ainda possível estimar qual o sentimento contido nessa opinião. Assim, as técnicas de data science se mostram como ferramenta capaz de aumentar a participação popular e utilizar dados online para auxiliar na gestão urbana, sendo a gestão participativa uma das práticas que torna uma cidade inteligente. |