“Inteligência Artificial: A Nova Fronteira da Ciência Brasileira”

19 a 24 de outubro de 2020

Trabalho 13572

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Inteligência Artificial
Setor Departamento de Educação
Bolsa Outros
Conclusão de bolsa Não
Apoio financeiro Outros
Primeiro autor Gabriel Siqueira Kakizaki
Orientador HENRIQUE PINTO GOMIDE
Outros membros Ana Flávia Santos Souza, Antonia Machado de Oliveira Mauler
Título Predição de sinistro em saúde utilizando aprendizado de máquina
Resumo Introdução: Devido ao aumento crescente nos gastos com saúde, novas alternativas vêm sendo desenvolvidas para auxiliar gestores a garantir que a população se torne mais saudável com o melhor custo benefício. Algoritmos de inteligência artificial são ferramentas que apresentam grande potencial para prever custos e para alocar recursos de saúde. Objetivos: O objetivo do presente estudo foi comparar o desempenho de algoritmos de aprendizagem de máquinas na predição de custos em saúde. Métodos: Os participantes desse estudo foram 932 colaboradores de um hospital geral privado da cidade de São Paulo. Os critérios de inclusão foram: ter 18 anos de idade ou mais e ser segurado pelo plano de saúde. Os critérios de exclusão foram: não estar trabalhando durante o período da pesquisa e não completar todos os itens do questionário. Esse foi um estudo prognóstico retrospectivo, utilizando dados já coletados e realizando predições para o espaço de um ano. As medidas utilizadas para avaliar o desempenho dos modelos preditivos foram o coeficiente de determinação (R²), e o erro absoluto médio (MAE). Os atributos utilizados para a predição foram gastos com o plano de saúde nos 12 meses anteriores à pesquisa, informações demográficas (sexo, idade) e a soma dos fatores de risco (rinite, sinusite, enxaqueca, gastrite, etc.) coletados por meio de instrumentos adaptados e validados. Os dados foram divididos em treino (70%) e teste (30%), e para a validação e ajuste de hiperparâmetros foi utilizado o método de validação cruzada k-fold (k=5). Foram comparadas as métricas de desempenhos dos seguintes algoritmos: GLM, Lasso, Random Forests, CatBoost, e XGBoost. Os dados foram analisados usando Python. Resultados: Aproximadamente três quartos dos participantes era do sexo feminino, com ensino médio completo, com idade média de 34,8 (DP=10,4). Quase quatro em cinco usou o plano de saúde nos 12 meses que antecederam a avaliação de saúde. Usando os dados de teste, os modelos apresentaram os seguintes R² e MAE, respectivamente: GLM (mínimos quadrados): 0,12, 2119,5; Regressão Lasso, 0,13, 2114,2; Random Forest: 0,10, 2138,0; CatBoost: 0,13; 2120,5; XGBoost: 0,12, 2123,3. Conclusões: Os modelos apresentaram performances semelhantes. O modelo que apresentou melhor desempenho para a maior parte da população foi Regressão Lasso, compatível com os valores de referência encontrados na literatura internacional, demonstrando sua aplicabilidade na predição de sinistro em saúde.
Palavras-chave aprendizagem de máquinas, predição de sinistros em saúde, saúde suplementar
Forma de apresentação..... Vídeo
Link para apresentação Vídeo
Gerado em 0,64 segundos.