Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
Python Sci-Kit 学习:多标签分类 ValueError:无法将字符串转换为浮点数:
我正在尝试使用 scikit learn 0 17 进行多标签分类 我的数据看起来像 training Col1 Col2 asd dfgfg 1 2 3 poioi oiopiop 4 test Col1 asdas gwergwger
python
machinelearning
scikitlearn
multilabelclassification
如何在 Scikit-learn 聚合聚类中使用 Pearson 相关性作为距离度量
我有以下内容data http dpaste com 031VZPM txt State Murder Assault UrbanPop Rape Alabama 13 200 236 58 21 200 Alaska 10 000 263
python
r
pandas
scikitlearn
scikit加权f1分数计算及使用
我有一个关于weightedsklearn metrics f1 score 中的平均值 sklearn metrics f1 score y true y pred labels None pos label 1 average weig
machinelearning
NLP
scikitlearn
precisionrecall
多类分类的每类 F1 分数
我正在使用 python 和 scikit learn 解决多类分类问题 目前 我正在使用classification report函数来评估我的分类器的性能 获得如下报告 gt gt gt print classification rep
python
machinelearning
scikitlearn
仅正样本和未标记数据集的二元半监督分类
我的数据由评论组成 保存在文件中 其中很少被标记为正面 我想使用半监督和PU http www cs uic edu liub publications ICDM 03 pdf分类将这些评论分为正面和负面类别 我想知道 python sci
scikitlearn
Classification
Sklearn 随机森林回归器的错误
当尝试使用 y 数据拟合随机森林回归器模型时 如下所示 0 00000000e 00 1 36094276e 02 4 46608221e 03 8 72660888e 03 1 31375786e 04 1 73580193e 04 2
python
NumPy
machinelearning
scikitlearn
RandomForest
Scikit - 如何定义绘制 roc 曲线的阈值
我有一个增强树模型以及测试数据集的概率和分类 我正在尝试绘制相同的 roc curve 但我无法弄清楚如何在 scikit learn 中定义 roc 曲线的阈值 alpha from sklearn metrics import prec
python
scikitlearn
ROC
没有预测器的 Sklearn 回归
是否可以在 sklearn 中使用或不使用 即仅使用截距 预测器来运行回归 例如逻辑回归 这似乎是一个相当标准的类型分析 也许这些信息已经在输出中可用 我发现的唯一相关的事情是sklearn svm l1 min c但这会返回一个非空模型
python
scikitlearn
Regression
LogisticRegression
SGDClassifier 每次为文本分类提供不同的准确度
我使用 SVM 分类器将文本分类为好文本和乱码 我正在使用 python 的 scikit learn 并按如下方式执行 Created on May 5 2017 import re import random import numpy
python
scikitlearn
NLP
Classification
在Python或Sklearn中用整数值对具有字符串值的列变量进行编码
如何用整数值对数据表中字符串类型的列值进行编码 例如 我有两个特征变量 颜色 可能的字符串值 R G 和 B 和技能 可能的字符串值 C Java SQL 和 Python 给定数据表有两列 Color gt R G B B G R B G
python
NLP
scikitlearn
借助 AWS SageMaker,是否可以使用 sagemaker SDK 部署预先训练的模型?
我试图避免将现有模型训练过程迁移到 SageMaker 并避免创建自定义 Docker 容器来托管我们训练过的模型 我的希望是将我们现有的 经过训练的模型注入到 AWS 通过以下方式提供的预构建的 scikit learn 容器中 sage
python
amazonwebservices
scikitlearn
amazonsagemaker
MiniBatchKMeans OverflowError:无法将浮点无穷大转换为整数?
我正在尝试找到正确数量的簇 k 根据轮廓分数使用sklearn cluster MiniBatchKMeans from sklearn cluster import MiniBatchKMeans from sklearn feature
python
types
scikitlearn
infinity
如何在交叉验证和GridSearchCV中实现SMOTE
我对 Python 比较陌生 您能帮助我将 SMOTE 的实施改进为适当的管道吗 我想要的是在每次 k 次迭代的训练集上应用过采样和欠采样 以便模型在平衡的数据集上进行训练 并在不平衡的遗漏部分上进行评估 问题是 当我这样做时 我无法使用熟
python
scikitlearn
pipeline
crossvalidation
Gridsearch
Sklearn LogisticRegressionCV 的类似数组的输入
最初 我从a读取数据 csv文件 但在这里我从列表构建数据框 以便可以重现问题 目的是使用交叉验证来训练逻辑回归模型LogisticRegressionCV indeps M F M F M M F M M F F F F F M F F
python
pandas
scikitlearn
LogisticRegression
Scorer函数:make_scorer/score_func和的区别
在 scikit 0 18 1 文档中 我发现接下来的内容有点令人困惑 似乎可以通过多种方式编写自己的评分函数 但有什么区别呢 网格搜索简历 http scikit learn org stable modules generated sk
python
python27
scikitlearn
Gridsearch
如何使用SVM求精确率、召回率、准确率?
重复计算 Precision Recall 和 F Score https stackoverflow com questions 16927964 how to calculate precision recall and f score
machinelearning
SVM
scikitlearn
Libsvm
在处理 VotingClassifier 或网格搜索时,Sklearn 中的 GradientBoostingClassifier 是否有类别权重(或替代方法)?
我正在使用 GradientBoostingClassifier 来处理不平衡的标记数据集 Sklearn 中似乎不存在类权重作为该分类器的参数 我发现我可以在合适时使用sample weight 但在处理VotingClassifier
scikitlearn
Classification
使用逻辑回归时sklearn重要特征错误
以下代码使用随机森林模型为我提供一个显示特征重要性的图表 from sklearn feature selection import SelectFromModel import matplotlib clf RandomForestCla
python
scikitlearn
Classification
Scikit-learn Ridge 分类器:提取类概率
我目前正在使用 sklearn 的 Ridge 分类器 并且希望将此分类器与 sklearn 和其他库中的分类器集成 为了做到这一点 理想的做法是提取给定输入属于类列表中每个类的概率 目前 我正在使用 model decision func
python
machinelearning
Classification
scikitlearn
sklearn - 如何在one-hot编码时合并丢失的数据
我试图保留数据集中包含缺失数据的行 当使用 sklearn 对一列 或多列 进行 one hot 编码时 是否可以写一个规则if currentItem null or if currentItem 0然后将输出数组设置为全0 e g A
python
NumPy
scikitlearn
«
1
2
3
4
5
6
...42
»