scikitlearn

Python Sci-Kit 学习：多标签分类 ValueError：无法将字符串转换为浮点数：

我正在尝试使用 scikit learn 0 17 进行多标签分类我的数据看起来像 training Col1 Col2 asd dfgfg 1 2 3 poioi oiopiop 4 test Col1 asdas gwergwger

python machinelearning scikitlearn multilabelclassification

如何在 Scikit-learn 聚合聚类中使用 Pearson 相关性作为距离度量

我有以下内容data http dpaste com 031VZPM txt State Murder Assault UrbanPop Rape Alabama 13 200 236 58 21 200 Alaska 10 000 263

python r pandas scikitlearn

scikit加权f1分数计算及使用

我有一个关于weightedsklearn metrics f1 score 中的平均值 sklearn metrics f1 score y true y pred labels None pos label 1 average weig

machinelearning NLP scikitlearn precisionrecall

多类分类的每类 F1 分数

我正在使用 python 和 scikit learn 解决多类分类问题目前我正在使用classification report函数来评估我的分类器的性能获得如下报告 gt gt gt print classification rep

python machinelearning scikitlearn

仅正样本和未标记数据集的二元半监督分类

我的数据由评论组成保存在文件中其中很少被标记为正面我想使用半监督和PU http www cs uic edu liub publications ICDM 03 pdf分类将这些评论分为正面和负面类别我想知道 python sci

scikitlearn Classification

Sklearn 随机森林回归器的错误

当尝试使用 y 数据拟合随机森林回归器模型时如下所示 0 00000000e 00 1 36094276e 02 4 46608221e 03 8 72660888e 03 1 31375786e 04 1 73580193e 04 2

python NumPy machinelearning scikitlearn RandomForest

Scikit - 如何定义绘制 roc 曲线的阈值

我有一个增强树模型以及测试数据集的概率和分类我正在尝试绘制相同的 roc curve 但我无法弄清楚如何在 scikit learn 中定义 roc 曲线的阈值 alpha from sklearn metrics import prec

python scikitlearn ROC

没有预测器的 Sklearn 回归

是否可以在 sklearn 中使用或不使用即仅使用截距预测器来运行回归例如逻辑回归这似乎是一个相当标准的类型分析也许这些信息已经在输出中可用我发现的唯一相关的事情是sklearn svm l1 min c但这会返回一个非空模型

python scikitlearn Regression LogisticRegression

SGDClassifier 每次为文本分类提供不同的准确度

我使用 SVM 分类器将文本分类为好文本和乱码我正在使用 python 的 scikit learn 并按如下方式执行 Created on May 5 2017 import re import random import numpy

python scikitlearn NLP Classification

在Python或Sklearn中用整数值对具有字符串值的列变量进行编码

如何用整数值对数据表中字符串类型的列值进行编码例如我有两个特征变量颜色可能的字符串值 R G 和 B 和技能可能的字符串值 C Java SQL 和 Python 给定数据表有两列 Color gt R G B B G R B G

python NLP scikitlearn

借助 AWS SageMaker，是否可以使用 sagemaker SDK 部署预先训练的模型？

我试图避免将现有模型训练过程迁移到 SageMaker 并避免创建自定义 Docker 容器来托管我们训练过的模型我的希望是将我们现有的经过训练的模型注入到 AWS 通过以下方式提供的预构建的 scikit learn 容器中 sage

python amazonwebservices scikitlearn amazonsagemaker

MiniBatchKMeans OverflowError：无法将浮点无穷大转换为整数？

我正在尝试找到正确数量的簇 k 根据轮廓分数使用sklearn cluster MiniBatchKMeans from sklearn cluster import MiniBatchKMeans from sklearn feature

python types scikitlearn infinity

如何在交叉验证和GridSearchCV中实现SMOTE

我对 Python 比较陌生您能帮助我将 SMOTE 的实施改进为适当的管道吗我想要的是在每次 k 次迭代的训练集上应用过采样和欠采样以便模型在平衡的数据集上进行训练并在不平衡的遗漏部分上进行评估问题是当我这样做时我无法使用熟

python scikitlearn pipeline crossvalidation Gridsearch

Sklearn LogisticRegressionCV 的类似数组的输入

最初我从a读取数据 csv文件但在这里我从列表构建数据框以便可以重现问题目的是使用交叉验证来训练逻辑回归模型LogisticRegressionCV indeps M F M F M M F M M F F F F F M F F

python pandas scikitlearn LogisticRegression

Scorer函数：make_scorer/score_func和的区别

在 scikit 0 18 1 文档中我发现接下来的内容有点令人困惑似乎可以通过多种方式编写自己的评分函数但有什么区别呢网格搜索简历 http scikit learn org stable modules generated sk

python python27 scikitlearn Gridsearch

如何使用SVM求精确率、召回率、准确率？

重复计算 Precision Recall 和 F Score https stackoverflow com questions 16927964 how to calculate precision recall and f score

machinelearning SVM scikitlearn Libsvm

在处理 VotingClassifier 或网格搜索时，Sklearn 中的 GradientBoostingClassifier 是否有类别权重（或替代方法）？

我正在使用 GradientBoostingClassifier 来处理不平衡的标记数据集 Sklearn 中似乎不存在类权重作为该分类器的参数我发现我可以在合适时使用sample weight 但在处理VotingClassifier

scikitlearn Classification

使用逻辑回归时sklearn重要特征错误

以下代码使用随机森林模型为我提供一个显示特征重要性的图表 from sklearn feature selection import SelectFromModel import matplotlib clf RandomForestCla

python scikitlearn Classification

Scikit-learn Ridge 分类器：提取类概率

我目前正在使用 sklearn 的 Ridge 分类器并且希望将此分类器与 sklearn 和其他库中的分类器集成为了做到这一点理想的做法是提取给定输入属于类列表中每个类的概率目前我正在使用 model decision func

python machinelearning Classification scikitlearn

sklearn - 如何在one-hot编码时合并丢失的数据

我试图保留数据集中包含缺失数据的行当使用 sklearn 对一列或多列进行 one hot 编码时是否可以写一个规则if currentItem null or if currentItem 0然后将输出数组设置为全0 e g A

python NumPy scikitlearn