Resumo |
Atualmente, no mundo digital, os dados se tornaram algo fundamental tanto para as empresas quanto para a população em geral. Nesse contexto, é relevante a realização da coleta e manipulação de dados nas mais diversas áreas do conhecimento. O web scraping é responsável justamente por realizar a coleta de dados na web, quando feito de forma automatizada pode auxiliar em tarefas cotidianas simples ou complexas. O objetivo deste projeto é coletar dados dos fundos de investimento imobiliários listados na bolsa de valores (B3), e com base nesses dados, calcular o dividend yield mensal dos fundos analisados. Deve-se tomar cuidado ao realizar o processo de web scraping, pois, o mal deste recurso pode acarretar problemas jurídicos. Por isso, todos os dados utilizados neste projeto seguem as regras impostas pelo site oficial da B3. Python é a linguagem utilizada no projeto. Adicionalmente, foram usadas as seguintes bibliotecas externas: Selenium, Beautiful Soup, sqlite3, Pandas e lxml. O SQlite foi utilizado como base de dados local, no qual foi criado um diretório cujo arquivo com os dados coletados está localizado. A partir do site oficial da B3, foi coletada a tabela com nome de todos os fundos imobiliários do IFIX atual, os quais serão os fundos a serem analisados. A primeira tarefa foi coletar os dados de cada fundo referente às informações do ‘aviso aos cotistas', são elas: valor do provento, data de pagamento do provento e data base. A segunda tarefa foi a de coletar a cotação de fechamento de cada fundo analisado no dia referente à sua data base. Após a coleta de dados o bot deve fazer o cálculo do dividend yield mensal de cada fundo analisado. Por fim, o bot salva os dados coletados na base de dados local nas seguintes tabelas: fiis_datas e fiis_valores. Em termos de uso, basta iniciar o bot, esperar sua execução, para que todos os dados sejam devidamente coletados do site da B3 e armazenados na base de dados. Com este projeto pode-se evidenciar a importância do web scraping na atualidade, além de ressaltar a relevância que o conhecimento computacional pode proporcionar sendo útil no dia a dia de qualquer pessoa. |