“Para viabilizar as funções dos modelos, foi estruturada uma base de dados representativa com
personas geradas a partir da combinação de comportamentos temporais e exames simulados
ao longo de um ano. A fusão desses dados com o dataset CDC Diabetes Health Indicators
garantiu maior realismo e confiabilidade.
– A implementação dos modelos de classificação inclui algoritmos como Regressão
Logística, Decision Tree, Random Forest, Gradient Boosting e SGDClassifier. Para
equilibrar recall e precisão, foi criado um Comitê de Modelos que combina Random Forest
e SGDClassifier, otimizando a detecção de abandono sem comprometer a confiabilidade
das previsões.
– Além da análise preditiva, foram implementadas rotas de Inteligência Artificial Explicável,
permitindo a consulta das predições do modelo e a explicação dos fatores mais relevantes
na classificação dos pacientes. A rota do SHAP possibilita a escolha entre os modelos
individuais e o Comitê, fornecendo insights para melhor compreensão das predições.”