scikit-learn

sklearn的准确度分数未返回值

我有一个数据集,并使用pd.get_dummies对目标列进行了热编码。然后我使用sklearn的train_test_split函数来创建训练、测试和验证集。然后使用standardScalar()规范化训练集(特性)。我已经将特征和目标的训练集拟合到逻辑回归模型中。我现在正在尝试计算训练、验证和测试集的准确度分数,但我没有运气。

计算集合模型估计误差的标准偏差

最后,我想确定每天超出置信区间的极端结果。但我很难计算装袋回归器中每个模型的残差的逐点标准差。我的示例代码如下:;我在网上找到了这个方法但我不确定x.predict部分使用什么,因为我有4个以上的功能。

用sklearn拟合多维数据的线性回归

我正在尝试使用时间序列数据上的sklearn拟合线性回归。唯一的问题是,据我所知,数据不符合通常的时间序列格式。下面是一个示例:我很抱歉,如果这有点难读,但我的想法是,每个列表都代表了当时的一些上下文,其中的每个列表。这是可以的,除非我有多个上下文,但我希望它们都在同一个模型上训练。顺便说一句,当运行上面的代码时,我会得到逻辑上的错误:因为,sklearn需要以下格式的数据:

Scikit-learn实例之理解SVM正则化系数C

前言SVM比较详细的介绍可以参考:支持向量机SVM首先简要回顾一下SVM算法:如下图所示,寻找一个超平面划分数据,使得两类数据到超平面的距离均大余等于1/||w||。正则化系数C实际使用时,并不能保证所有数据被完美划分,例如在-例中混杂了一个+例,标准的SVM就无法求解,如下图所示。代码本实例绘制了在不同正则化系数C下,SVM选择最佳分界线。实际上标准SVM对应C=无穷。

Scikit-learn Preprocessing 预处理

首先说明下sklearn中preprocessing库里面的scale函数使用方法:根据参数的不同,可以沿任意轴标准化数据集。方法2:sklearn.preprocessing.StandardScaler类该方法也可以对数据X进行标准化处理,实例如下:这两个方法得到最后的结果都是一样的。在sklearn中,sklearn.preprocessing.Binarizer函数可以实现这一功能。这些数据无法直接使用scikit-learn分类器直接训练,所以需要进行处理。

centos-6.4源码安装scikit-learn

源码安装scikit-learn在linux下安装scikit-learn时遇到各种问题,特别是scipy这个包。另外,还有一个问题就是版本的问题,所以这里列出了与python-2.7.9对应可以使用的版本。python:2.7.9setuptools:1.4.2pip:1.3.1numpy:1.11.2scipy:0.11.1scikit-learn:0.18.1panda:0.18.1安装软件准备安装python-2.7.9这里不再详细描述python-2.7.9的安装过程,可以查看先关文章。