xgboost

如何在结果相似的不同模型之间进行选择?RF、GLM和XGBoost

我是一名医生,试图根据大约1500名患者的数据库建立预测模型,每个患者有60多个参数。我正在处理一个分类问题,并进行了分层分割,并在训练每个时间点的随机森林、GLM和极限梯度增强模型之前使用Boruta算法进行了特征选择。所有模型的AUC约为0.80,RF的Brier评分在0.09-0.17之间,其他两个的Brier得分在0.13-0.23之间。-如何解释我的结果?我的理解是,由于GLM模型表现良好,预测因子之间存在线性关联,但RF在性能上仍略有优势,但其缺点是更“复杂的模型”。

LibLinear使用总结L1,L2正则

首先,liblinear和libsvm都是国立台湾大学林智仁老师团队开发的,libsvm早在2000年就已经发布,liblinear则在2007年才发布首个版本。关于实际时间对比,liblinear作者官方给出了以下数据:对于LIBSVM数据集中某实例"20242个样本/47236个特征",在保持交叉验证的精度接近的情况下,liblinear仅耗时约3秒,远远小于libsvm的346秒。线性svm还是logisticregression/L1正则化项还是L2正则化项liblinear支持多种solver模

如何在Windows上的python中安装XGBoost包

我试图在python中安装XGBoost包.我使用的是Windows操作系统,64位.我经历了以下事情.包目录指出xgboost对Windows不稳定并被禁用:Windows上的pip安装目前已被禁用以进行进一步的调查,请从github安装.https://pypi.python.org/pypi/xgboost/我不熟悉VisualStudio,面临构建XGBoost的问题.我错过了在数据科学中