Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes
aprendizado de máquina, resistência insulínica, adolescentes, saúde pública, HOMA-IR.
Introdução: A resistência à insulina é definida como uma diminuição da resposta dos tecidos às ações celulares mediadas pela insulina, sendo o inverso da sensibilidade à insulina. Atualmente existem métodos considerados padrão-ouro para medir a resistência à insulina, como o clamp euglicêmico hiperinsulinêmico e o clamp hiperglicêmico. Mas, estes métodos são caros, trabalhosos e raramente utilizados em grandes estudos epidemiológicos. Objetivo: Avaliar o melhor modelo preditivo de aprendizado de máquina para prever a resistência à insulina no ERICA (2013-2014). Métodos: Estudamos aproximadamente 38.000 adolescentes, utilizando as variáveis HDL colesterol, LDL colesterol, triglicerídeos, circunferência da cintura, estado nutricional, inatividade física, tabagismo, consumo de álcool, comportamento sedentário, nível socioeconômico, pressão arterial e idade para criação dos modelos de aprendizado de máquina. A amostra foi estratificada por sexo e desenvolvemos os modelos de Regressão Logística (RL), Poisson, Rede Neural Profunda (RNP), XGBoost, Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM). Avaliámos os modelos utilizando a área sob a curva ROC (AUC), as curvas de calibração e a análise da curva de decisão (DCA) e o gráfico SHapley Additive exPlanations. Resultados: Os modelos RL, Poisson, XGBoost, RNP e RF apresentaram a AUC mais elevada, variando entre 0,72 e 0,8 para meninos e meninas. Três modelos (RL, XGBoost e RNP) apresentaram uma calibração mais elevada nas meninas do que nos meninos, 80% e 60%, respetivamente. A curva DCA mostrou valores de prevalência em torno de 18% para as meninas e 16% para os meninos e, para além deste limiar de probabilidade, todos os modelos, com exceção do modelo SV,poderiam ser benéficos na intervenção clínica. Por fim, os preditores clínicos mais importantes encontrados para ambos os sexos foram a circunferência da cintura, triglicerídeos e idade. Conclusões: Nosso estudo sugere que a RL pode ser útil para prever a resistência à insulina em adolescentes do ERICA , pois destaca-se como a melhor escolha devido à sua interpretabilidade, ampla aplicabilidade em contextos clínicos, eficiência computacional e desempenho comparável aos outros modelos desenvolvidos.