Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
使用 Scikit Learn SVM 准备文本分类数据
我正在尝试应用 Scikit learn 中的 SVM 对我收集的推文进行分类 因此 将有两个类别 将它们命名为 A 和 B 目前 我将所有推文分类为两个文本文件 A txt 和 B txt 但是 我不确定 Scikit Learn SVM
python
SVM
scikitlearn
避免在 scikit learn StandardScaler 中缩放二进制列
我正在 sci kit learn 中构建线性回归模型 并将输入缩放为 sci kit learn Pipeline 中的预处理步骤 有什么方法可以避免缩放二进制列吗 发生的情况是这些列与其他列一起缩放 导致值以 0 为中心 而不是 0 或
python
scikitlearn
multidimensionalscaling
scikit-learn 中的分层训练/测试分割
我需要将数据分为训练集 75 和测试集 25 我目前使用下面的代码来做到这一点 X Xt userInfo userInfo train sklearn cross validation train test split X userInf
python
scikitlearn
使用 Scikit Learn 的 DictVectorizer 时出现 toarray 内存错误
我正在尝试对我的数据实施 SelectKBest 算法 以从中获得最佳功能 为此 我首先使用 DictVectorizer 预处理数据 该数据由 1061427 行和 15 个特征组成 每个功能都有许多不同的值 我相信由于高基数我遇到了内存
python
scipy
scikitlearn
我们能否通过接受(或忽略)新功能来使 ML 模型(pickle 文件)更加健壮?
我训练了一个 ML 模型 并将其存储到 Pickle 文件中 在我的新脚本中 我正在阅读新的 现实世界数据 我想对其进行预测 然而 我正在挣扎 我有一列 包含字符串值 例如 Sex Male Female This is just as e
python
pandas
machinelearning
scikitlearn
pickle
模型 Score() 与 r2_score 之间的差异
我正在训练 Linear Regression 分类器并尝试衡量其预测准确性 from sklearn metrics import r2 score from sklearn linear model import LinearRegre
scikitlearn
sklearnpandas
无法克隆对象
这是针对 TF 2 0 的 请在下面找到我的代码 该代码使用以下命令执行 GridSearch 和交叉验证sklearn model selection GridSearchCV对于运行完美的 mnist 数据集 Build Functio
python3x
tensorflow
Keras
scikitlearn
tfkeras
从 sklearn 导入指标时出现导入错误
当我尝试从 sklearn 导入指标时 出现以下错误 from sklearn metrics import mean absolute percentage error ImportError cannot import name mea
python
scikitlearn
是否可以通过 scikit-learn 中自定义内核的网格搜索来调整参数?
我有一个自定义内核函数 并且我将 GridSearchCV 函数与 SVC kernel my kernel 一起使用 my kernel 函数需要一个参数 k 来调整 所以我想知道是否可以配置 param grid 选项来调整我的自定义内
python
scikitlearn
导入 scikit-learn 模块时出错
我试图从集群模块调用一个函数 如下所示 import sklearn db sklearn cluster DBSCAN 我收到以下错误 AttributeError module object has no attribute clust
python
scikitlearn
如何从 sklearn 反转标签编码器以获取多列?
我想在多列上使用 LabelEncoder 的 inverse transform 函数 这是我在数据帧上应用 LabelEncoder 时用于多个列的代码 class MultiColumnLabelEncoder def init se
python
scikitlearn
categoricaldata
将多种算法与 sklearn pipeline 进行比较
我正在尝试建立一个 scikit learn 管道来简化我的工作 我面临的问题是我不知道哪种算法 随机森林 朴素贝叶斯 决策树等 最适合 所以我需要尝试每种算法并比较结果 然而 管道一次只能采用一种算法吗 例如 下面的管道仅采用 SGDCl
python
Algorithm
machinelearning
scikitlearn
sklearn中如何对连续属性进行离散化?
我的数据由连续特征和分类特征混合组成 下面是我的数据的 csv 格式的一个小片段 将其视为由在不同城市经营商店的超级连锁店收集的数据 city avg income in city population square feet of sto
scikitlearn
discretization
从 SKlearn 决策树中检索决策边界线(x,y 坐标格式)
我正在尝试在外部可视化平台上创建曲面图 我正在使用 iris 数据集sklearn 决策树文档页面 我还使用相同的方法来创建决策曲面图 但我的最终目标不是 matplot lib 视觉效果 因此从这里我将数据输入到我的可视化软件中 为此 我
python
python3x
matplotlib
scikitlearn
错误,TensorSliceReader 构造函数不成功:无法找到 ram 解封文件的任何匹配文件
我遇到了这个错误 我无法解开我的 jupyter 笔记本上的文件 import os import pickle import joblib import pandas as pd from sklearn preprocessing im
python
tensorflow
scikitlearn
pickle
joblib
如何从sklearn的CCA模块获得第一个规范相关性?
在 Python 的 scikit learn 中 有一个名为 cross decomposition 的模块 其中包含规范相关分析 CCA 类 我一直在试图弄清楚如何给出形状 n m 的 2 类多维向量并获得第一个规范相关系数 查看文档
python
scikitlearn
如何在 scikit-learn 中使用创建我自己的数据集?
我想创建自己的数据集 并在 scikit learn 中使用它 Scikit learn 有一些数据集 例如 波士顿住房数据集 csv 用户可以通过以下方式使用它 from sklearn import datasets boston da
python
csv
machinelearning
scikitlearn
Dataset
如何在 gensim 创建的 word2vec 上运行 tsne?
我想可视化从 gensim 库创建的 word2vec 我尝试了 sklearn 但似乎我需要安装开发人员版本才能获得它 我尝试安装开发人员版本 但这在我的机器上不起作用 是否可以修改此代码以可视化 word2vec 模型 tsne pyt
scikitlearn
gensim
Word2Vec
light gbm - python API 与 Scikit-learn API
我正在尝试应用 LightGBM 并已经完成了 Python API文档 Training API 和 Scikit learn API 有什么区别吗 我们可以使用这两个 API 来针对同一问题获得相同的结果吗 简短的回答 是的 如果您以相
python
scikitlearn
lightGBM
获取 GridSearchCV 的标准差
在 scikit learn 0 20 之前我们可以使用result grid scores result best index 以获得标准差 它返回例如 mean 0 76172 std 0 05225 params n neighbor
python
scikitlearn
datascience
crossvalidation
Gridsearch
«
1 ...
36
37
38
39
40
41
42
...44
»