Resumo |
Introdução: Devido ao aumento crescente nos gastos com saúde, novas alternativas vêm sendo desenvolvidas para auxiliar gestores a garantir que a população se torne mais saudável com o melhor custo benefício. Algoritmos de inteligência artificial são ferramentas que apresentam grande potencial para prever custos e para alocar recursos de saúde. Objetivos: O objetivo do presente estudo foi comparar o desempenho de algoritmos de aprendizagem de máquinas na predição de custos em saúde. Métodos: Os participantes desse estudo foram 932 colaboradores de um hospital geral privado da cidade de São Paulo. Os critérios de inclusão foram: ter 18 anos de idade ou mais e ser segurado pelo plano de saúde. Os critérios de exclusão foram: não estar trabalhando durante o período da pesquisa e não completar todos os itens do questionário. Esse foi um estudo prognóstico retrospectivo, utilizando dados já coletados e realizando predições para o espaço de um ano. As medidas utilizadas para avaliar o desempenho dos modelos preditivos foram o coeficiente de determinação (R²), e o erro absoluto médio (MAE). Os atributos utilizados para a predição foram gastos com o plano de saúde nos 12 meses anteriores à pesquisa, informações demográficas (sexo, idade) e a soma dos fatores de risco (rinite, sinusite, enxaqueca, gastrite, etc.) coletados por meio de instrumentos adaptados e validados. Os dados foram divididos em treino (70%) e teste (30%), e para a validação e ajuste de hiperparâmetros foi utilizado o método de validação cruzada k-fold (k=5). Foram comparadas as métricas de desempenhos dos seguintes algoritmos: GLM, Lasso, Random Forests, CatBoost, e XGBoost. Os dados foram analisados usando Python. Resultados: Aproximadamente três quartos dos participantes era do sexo feminino, com ensino médio completo, com idade média de 34,8 (DP=10,4). Quase quatro em cinco usou o plano de saúde nos 12 meses que antecederam a avaliação de saúde. Usando os dados de teste, os modelos apresentaram os seguintes R² e MAE, respectivamente: GLM (mínimos quadrados): 0,12, 2119,5; Regressão Lasso, 0,13, 2114,2; Random Forest: 0,10, 2138,0; CatBoost: 0,13; 2120,5; XGBoost: 0,12, 2123,3. Conclusões: Os modelos apresentaram performances semelhantes. O modelo que apresentou melhor desempenho para a maior parte da população foi Regressão Lasso, compatível com os valores de referência encontrados na literatura internacional, demonstrando sua aplicabilidade na predição de sinistro em saúde. |