“Bicentenário da Independência: 200 anos de ciência, tecnologia e inovação no Brasil e 96 anos de contribuição da UFV”.

8 a 10 de novembro de 2022

Trabalho 17489

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Pós-graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Geociências
Setor Departamento de Engenharia Civil
Bolsa CAPES
Conclusão de bolsa Não
Primeiro autor Thales Silva Heck
Orientador JULIO CESAR DE OLIVEIRA
Outros membros NILCILENE DAS GRACAS MEDEIROS
Título Análise da influência de fatores ambientais nos casos de dengue registrados no ano de 2013 em Viçosa-MG utilizando algoritmos de aprendizado de máquina
Resumo Há muitos anos os epidemiologistas se beneficiam do geoprocessamento a fim de identificarem fatores ambientais (FA) em regiões propícias à proliferação de doenças e vetores específicos, e assim determinar suas possíveis causas. Esta pesquisa tem como objetivo principal identificar os FA que possuem maior influência sobre o número de casos de dengue (NCD) registrados no município de Viçosa, tendo apenas o custo computacional para o processamento de dados públicos e economizando recursos com pesquisas de campo extensas. Os dados base para a pesquisa foram os NCD diários para o ano 2013 e FA descritos a seguir: precipitação total (PPTG4), temperatura média (TMG4), temperatura de orvalho média (TOMG4), temperatura mínima (TMNG4) e temperatura de orvalho mínima (TONG4). Todos os dados foram padronizados e os FA foram defasados em 1, 2, 3, 4, 5, 6, 7 e 8 semanas para que o não-sincronismo entre os FA e NCD fosse identificado, sendo que os melhores resultados de correlação se deram com a defasagem de 4 semanas. Utilizou-se as linguagens R e Python para o processamento dos dados. Foram gerados modelos de regressão utilizando os algoritmos K-Nearest Neighbor (KNN), Random-Forest (RF), Bagging (BG) e Decision Tree (DT) e a Regressão linear multivariada (RLM). O algoritmo KNN apresentou r² = 73,89% e a RLM um r² = 77,20%, sendo estes os melhores resultados. Conclui-se que os dados públicos podem ser suficientes para a modelagem do problema e que embora o período de estudos seja curto, os resultados foram satisfatórios e o KNN apresentou um modelo que se adequa ao NCD, além disso indica-se a necessidade de relacionar mais FA e a posição geográfica para cada caso registrado, expandir a série temporal para análises mais consistentes e acuradas e se possível realizar um estudo de campo para coleta de ovos e larvas do mosquito, a fim de estabelecer uma relação entre os FA estudados, os ovos e os casos registrados com a devida defasagem de tempo entre as ocorrências para predizer momentos de crises epidêmicas.
Palavras-chave aprendizado de maquina, KNN, epidemiologia
Forma de apresentação..... Painel
Link para apresentação Painel
Gerado em 0,67 segundos.