glm

如何在结果相似的不同模型之间进行选择?RF、GLM和XGBoost

我是一名医生,试图根据大约1500名患者的数据库建立预测模型,每个患者有60多个参数。我正在处理一个分类问题,并进行了分层分割,并在训练每个时间点的随机森林、GLM和极限梯度增强模型之前使用Boruta算法进行了特征选择。所有模型的AUC约为0.80,RF的Brier评分在0.09-0.17之间,其他两个的Brier得分在0.13-0.23之间。-如何解释我的结果?我的理解是,由于GLM模型表现良好,预测因子之间存在线性关联,但RF在性能上仍略有优势,但其缺点是更“复杂的模型”。