scikit-learn

sklearn的准确度分数未返回值

我有一个数据集，并使用pd.get_dummies对目标列进行了热编码。然后我使用sklearn的train_test_split函数来创建训练、测试和验证集。然后使用standardScalar（）规范化训练集（特性）。我已经将特征和目标的训练集拟合到逻辑回归模型中。我现在正在尝试计算训练、验证和测试集的准确度分数，但我没有运气。

basic_string:：resize在GCP上部署自定义Sklearn模型时出错

我想使用预先构建的scikit学习容器在GCP上部署一个成功的定制培训工作。

计算集合模型估计误差的标准偏差

最后，我想确定每天超出置信区间的极端结果。但我很难计算装袋回归器中每个模型的残差的逐点标准差。我的示例代码如下：；我在网上找到了这个方法但我不确定x.predict部分使用什么，因为我有4个以上的功能。

用sklearn拟合多维数据的线性回归

我正在尝试使用时间序列数据上的sklearn拟合线性回归。唯一的问题是，据我所知，数据不符合通常的时间序列格式。下面是一个示例：我很抱歉，如果这有点难读，但我的想法是，每个列表都代表了当时的一些上下文，其中的每个列表。这是可以的，除非我有多个上下文，但我希望它们都在同一个模型上训练。顺便说一句，当运行上面的代码时，我会得到逻辑上的错误：因为，sklearn需要以下格式的数据：

分类报告中少数类别的准确度、召回率和F1分数均为零

我在使用SkLearn包中的SVM和MLP分类器时出错。使用zero_division参数控制此行为_warn_prf用于拆分数据集的代码SVM分类器代码MLP分类器代码两个分类器的错误相同

Scikit-learn实例之理解SVM正则化系数C

前言SVM比较详细的介绍可以参考：支持向量机SVM首先简要回顾一下SVM算法：如下图所示，寻找一个超平面划分数据，使得两类数据到超平面的距离均大余等于1/||w||。正则化系数C实际使用时，并不能保证所有数据被完美划分，例如在-例中混杂了一个＋例，标准的SVM就无法求解，如下图所示。代码本实例绘制了在不同正则化系数C下，SVM选择最佳分界线。实际上标准SVM对应C=无穷。

Scikit-learn Preprocessing 预处理

首先说明下sklearn中preprocessing库里面的scale函数使用方法：根据参数的不同，可以沿任意轴标准化数据集。方法2：sklearn.preprocessing.StandardScaler类该方法也可以对数据X进行标准化处理，实例如下：这两个方法得到最后的结果都是一样的。在sklearn中，sklearn.preprocessing.Binarizer函数可以实现这一功能。这些数据无法直接使用scikit-learn分类器直接训练，所以需要进行处理。

centos-6.4源码安装scikit-learn

源码安装scikit-learn在linux下安装scikit-learn时遇到各种问题，特别是scipy这个包。另外，还有一个问题就是版本的问题，所以这里列出了与python-2.7.9对应可以使用的版本。python:2.7.9setuptools:1.4.2pip:1.3.1numpy:1.11.2scipy:0.11.1scikit-learn:0.18.1panda:0.18.1安装软件准备安装python-2.7.9这里不再详细描述python-2.7.9的安装过程，可以查看先关文章。

scikit-learn 首页 scikit-learn

scikit-learn

首页

scikit-learn