“Bicentenário da Independência: 200 anos de ciência, tecnologia e inovação no Brasil e 96 anos de contribuição da UFV”.

8 a 10 de novembro de 2022

Trabalho 17451

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Saúde coletiva
Setor Instituto de Ciências Exatas e Tecnológicas - Campus Rio Paranaíba
Conclusão de bolsa Não
Primeiro autor Ricardo Bortolucci Patriani de Carvalho
Orientador ADRIANA ZANELLA MARTINHAGO
Título análise descritiva de dados digitais públicos da saúde nos cenários social e regional
Resumo Este trabalho de conclusão de curso é uma pesquisa descritiva de caráter epidemiológico. A epidemiologia é um conceito que teve origem a mais de 2000 anos e se trata de um esforço para melhorar a saúde das populações. Com os meios digitais de registro o estudo epidemiológico está mais amplo e facilitado, sendo possível capturar registros públicos de saúde de diversas regiões de um país sem que seja necessário o deslocamento físico do pesquisador. Sendo assim, o que viabiliza o estudo são as diversas bases de dados que registram e disponibilizam informações epidemiológicas. Porém, com o acesso a muitos dados surgiu a necessidade de métodos computacionais que processassem amostras grandes e multidimensionais (diversas características ligadas a um objeto de estudo) a fim de extrair informações úteis. Neste contexto, o objetivo do trabalho é analisar indicadores sociais de municípios e a partir do georreferenciamento dos casos fornecer visualização dos resultados. Para a realização do projeto foram adotadas as etapas do processo Knowledge Discovery in Databases (KDD) da mineração de dados que modela ciclos de trabalho desde a coleta dos dados até a obtenção de informações úteis. Até o momento foram realizadas as etapas de coleta e pré-processamento. A coleta dos dados foi realizada através das bases DATASUS e IBGE em que os dados de saúde coletados foram relacionados a indicadores sociais do estado de São Paulo. O pré-processamento foi realizado para padronizar os dados coletados e para isso foi utilizada a linguagem de programação Python e bibliotecas matemáticas e de manipulação de arquivos. Na etapa de agrupamento (clusterização) de dados estão sendo implementados fluxos com os algoritmos Kmedias e Clusterização Hierárquica Aglomerativa, implementados por bibliotecas Python, para posteriormente realizar a validação, comparação entre os métodos, e interpretação das informações geradas. Nas etapas finais também serão gerados mapas que demostrem a dispersão da amostra pela área considerada na coleta. Como resultado do trabalho espera-se fornecer informações que possam auxiliar a tomada de decisão da área de saúde.
Palavras-chave Epidemiologia, Mineração de Dados, Geoprocessamento
Forma de apresentação..... Painel
Link para apresentação Painel
Gerado em 0,72 segundos.