Simpósio de Integração Acadêmica - Universidade Federal de Viçosa

“Inteligência Artificial: A Nova Fronteira da Ciência Brasileira”

19 a 24 de outubro de 2020

Trabalho 13572

ISSN	2237-9045
Instituição	Universidade Federal de Viçosa
Nível	Graduação
Modalidade	Pesquisa
Área de conhecimento	Ciências Exatas e Tecnológicas
Área temática	Inteligência Artificial
Setor	Departamento de Educação
Bolsa	Outros
Conclusão de bolsa	Não
Apoio financeiro	Outros
Primeiro autor	Gabriel Siqueira Kakizaki
Orientador	HENRIQUE PINTO GOMIDE
Outros membros	Ana Flávia Santos Souza, Antonia Machado de Oliveira Mauler
Título	Predição de sinistro em saúde utilizando aprendizado de máquina
Resumo	Introdução: Devido ao aumento crescente nos gastos com saúde, novas alternativas vêm sendo desenvolvidas para auxiliar gestores a garantir que a população se torne mais saudável com o melhor custo benefício. Algoritmos de inteligência artificial são ferramentas que apresentam grande potencial para prever custos e para alocar recursos de saúde. Objetivos: O objetivo do presente estudo foi comparar o desempenho de algoritmos de aprendizagem de máquinas na predição de custos em saúde. Métodos: Os participantes desse estudo foram 932 colaboradores de um hospital geral privado da cidade de São Paulo. Os critérios de inclusão foram: ter 18 anos de idade ou mais e ser segurado pelo plano de saúde. Os critérios de exclusão foram: não estar trabalhando durante o período da pesquisa e não completar todos os itens do questionário. Esse foi um estudo prognóstico retrospectivo, utilizando dados já coletados e realizando predições para o espaço de um ano. As medidas utilizadas para avaliar o desempenho dos modelos preditivos foram o coeficiente de determinação (R²), e o erro absoluto médio (MAE). Os atributos utilizados para a predição foram gastos com o plano de saúde nos 12 meses anteriores à pesquisa, informações demográficas (sexo, idade) e a soma dos fatores de risco (rinite, sinusite, enxaqueca, gastrite, etc.) coletados por meio de instrumentos adaptados e validados. Os dados foram divididos em treino (70%) e teste (30%), e para a validação e ajuste de hiperparâmetros foi utilizado o método de validação cruzada k-fold (k=5). Foram comparadas as métricas de desempenhos dos seguintes algoritmos: GLM, Lasso, Random Forests, CatBoost, e XGBoost. Os dados foram analisados usando Python. Resultados: Aproximadamente três quartos dos participantes era do sexo feminino, com ensino médio completo, com idade média de 34,8 (DP=10,4). Quase quatro em cinco usou o plano de saúde nos 12 meses que antecederam a avaliação de saúde. Usando os dados de teste, os modelos apresentaram os seguintes R² e MAE, respectivamente: GLM (mínimos quadrados): 0,12, 2119,5; Regressão Lasso, 0,13, 2114,2; Random Forest: 0,10, 2138,0; CatBoost: 0,13; 2120,5; XGBoost: 0,12, 2123,3. Conclusões: Os modelos apresentaram performances semelhantes. O modelo que apresentou melhor desempenho para a maior parte da população foi Regressão Lasso, compatível com os valores de referência encontrados na literatura internacional, demonstrando sua aplicabilidade na predição de sinistro em saúde.
Palavras-chave	aprendizagem de máquinas, predição de sinistros em saúde, saúde suplementar
Forma de apresentação.....	Vídeo

Link para apresentação	Vídeo

Universidade Federal de Viçosa

Gerado em 0,72 segundos.