Resumo |
Há muitos anos os epidemiologistas se beneficiam do geoprocessamento a fim de identificarem fatores ambientais (FA) em regiões propícias à proliferação de doenças e vetores específicos, e assim determinar suas possíveis causas. Esta pesquisa tem como objetivo principal identificar os FA que possuem maior influência sobre o número de casos de dengue (NCD) registrados no município de Viçosa, tendo apenas o custo computacional para o processamento de dados públicos e economizando recursos com pesquisas de campo extensas. Os dados base para a pesquisa foram os NCD diários para o ano 2013 e FA descritos a seguir: precipitação total (PPTG4), temperatura média (TMG4), temperatura de orvalho média (TOMG4), temperatura mínima (TMNG4) e temperatura de orvalho mínima (TONG4). Todos os dados foram padronizados e os FA foram defasados em 1, 2, 3, 4, 5, 6, 7 e 8 semanas para que o não-sincronismo entre os FA e NCD fosse identificado, sendo que os melhores resultados de correlação se deram com a defasagem de 4 semanas. Utilizou-se as linguagens R e Python para o processamento dos dados. Foram gerados modelos de regressão utilizando os algoritmos K-Nearest Neighbor (KNN), Random-Forest (RF), Bagging (BG) e Decision Tree (DT) e a Regressão linear multivariada (RLM). O algoritmo KNN apresentou r² = 73,89% e a RLM um r² = 77,20%, sendo estes os melhores resultados. Conclui-se que os dados públicos podem ser suficientes para a modelagem do problema e que embora o período de estudos seja curto, os resultados foram satisfatórios e o KNN apresentou um modelo que se adequa ao NCD, além disso indica-se a necessidade de relacionar mais FA e a posição geográfica para cada caso registrado, expandir a série temporal para análises mais consistentes e acuradas e se possível realizar um estudo de campo para coleta de ovos e larvas do mosquito, a fim de estabelecer uma relação entre os FA estudados, os ovos e os casos registrados com a devida defasagem de tempo entre as ocorrências para predizer momentos de crises epidêmicas. |