scikitlearn

使用 Scikit Learn SVM 准备文本分类数据

我正在尝试应用 Scikit learn 中的 SVM 对我收集的推文进行分类因此将有两个类别将它们命名为 A 和 B 目前我将所有推文分类为两个文本文件 A txt 和 B txt 但是我不确定 Scikit Learn SVM

python SVM scikitlearn

避免在 scikit learn StandardScaler 中缩放二进制列

我正在 sci kit learn 中构建线性回归模型并将输入缩放为 sci kit learn Pipeline 中的预处理步骤有什么方法可以避免缩放二进制列吗发生的情况是这些列与其他列一起缩放导致值以 0 为中心而不是 0 或

python scikitlearn multidimensionalscaling

scikit-learn 中的分层训练/测试分割

我需要将数据分为训练集 75 和测试集 25 我目前使用下面的代码来做到这一点 X Xt userInfo userInfo train sklearn cross validation train test split X userInf

python scikitlearn

使用 Scikit Learn 的 DictVectorizer 时出现 toarray 内存错误

我正在尝试对我的数据实施 SelectKBest 算法以从中获得最佳功能为此我首先使用 DictVectorizer 预处理数据该数据由 1061427 行和 15 个特征组成每个功能都有许多不同的值我相信由于高基数我遇到了内存

python scipy scikitlearn

我们能否通过接受（或忽略）新功能来使 ML 模型（pickle 文件）更加健壮？

我训练了一个 ML 模型并将其存储到 Pickle 文件中在我的新脚本中我正在阅读新的现实世界数据我想对其进行预测然而我正在挣扎我有一列包含字符串值例如 Sex Male Female This is just as e

python pandas machinelearning scikitlearn pickle

模型 Score() 与 r2_score 之间的差异

我正在训练 Linear Regression 分类器并尝试衡量其预测准确性 from sklearn metrics import r2 score from sklearn linear model import LinearRegre

scikitlearn sklearnpandas

无法克隆对象

这是针对 TF 2 0 的请在下面找到我的代码该代码使用以下命令执行 GridSearch 和交叉验证sklearn model selection GridSearchCV对于运行完美的 mnist 数据集 Build Functio

python3x tensorflow Keras scikitlearn tfkeras

从 sklearn 导入指标时出现导入错误

当我尝试从 sklearn 导入指标时出现以下错误 from sklearn metrics import mean absolute percentage error ImportError cannot import name mea

python scikitlearn

是否可以通过 scikit-learn 中自定义内核的网格搜索来调整参数？

我有一个自定义内核函数并且我将 GridSearchCV 函数与 SVC kernel my kernel 一起使用 my kernel 函数需要一个参数 k 来调整所以我想知道是否可以配置 param grid 选项来调整我的自定义内

python scikitlearn

导入 scikit-learn 模块时出错

我试图从集群模块调用一个函数如下所示 import sklearn db sklearn cluster DBSCAN 我收到以下错误 AttributeError module object has no attribute clust

python scikitlearn

如何从 sklearn 反转标签编码器以获取多列？

我想在多列上使用 LabelEncoder 的 inverse transform 函数这是我在数据帧上应用 LabelEncoder 时用于多个列的代码 class MultiColumnLabelEncoder def init se

python scikitlearn categoricaldata

将多种算法与 sklearn pipeline 进行比较

我正在尝试建立一个 scikit learn 管道来简化我的工作我面临的问题是我不知道哪种算法随机森林朴素贝叶斯决策树等最适合所以我需要尝试每种算法并比较结果然而管道一次只能采用一种算法吗例如下面的管道仅采用 SGDCl

python Algorithm machinelearning scikitlearn

sklearn中如何对连续属性进行离散化？

我的数据由连续特征和分类特征混合组成下面是我的数据的 csv 格式的一个小片段将其视为由在不同城市经营商店的超级连锁店收集的数据 city avg income in city population square feet of sto

scikitlearn discretization

从 SKlearn 决策树中检索决策边界线（x,y 坐标格式）

我正在尝试在外部可视化平台上创建曲面图我正在使用 iris 数据集sklearn 决策树文档页面我还使用相同的方法来创建决策曲面图但我的最终目标不是 matplot lib 视觉效果因此从这里我将数据输入到我的可视化软件中为此我

python python3x matplotlib scikitlearn

错误，TensorSliceReader 构造函数不成功：无法找到 ram 解封文件的任何匹配文件

我遇到了这个错误我无法解开我的 jupyter 笔记本上的文件 import os import pickle import joblib import pandas as pd from sklearn preprocessing im

python tensorflow scikitlearn pickle joblib

如何从sklearn的CCA模块获得第一个规范相关性？

在 Python 的 scikit learn 中有一个名为 cross decomposition 的模块其中包含规范相关分析 CCA 类我一直在试图弄清楚如何给出形状 n m 的 2 类多维向量并获得第一个规范相关系数查看文档

python scikitlearn

如何在 scikit-learn 中使用创建我自己的数据集？

我想创建自己的数据集并在 scikit learn 中使用它 Scikit learn 有一些数据集例如波士顿住房数据集 csv 用户可以通过以下方式使用它 from sklearn import datasets boston da

python csv machinelearning scikitlearn Dataset

如何在 gensim 创建的 word2vec 上运行 tsne？

我想可视化从 gensim 库创建的 word2vec 我尝试了 sklearn 但似乎我需要安装开发人员版本才能获得它我尝试安装开发人员版本但这在我的机器上不起作用是否可以修改此代码以可视化 word2vec 模型 tsne pyt

scikitlearn gensim Word2Vec

light gbm - python API 与 Scikit-learn API

我正在尝试应用 LightGBM 并已经完成了 Python API文档 Training API 和 Scikit learn API 有什么区别吗我们可以使用这两个 API 来针对同一问题获得相同的结果吗简短的回答是的如果您以相

python scikitlearn lightGBM

获取 GridSearchCV 的标准差

在 scikit learn 0 20 之前我们可以使用result grid scores result best index 以获得标准差它返回例如 mean 0 76172 std 0 05225 params n neighbor

python scikitlearn datascience crossvalidation Gridsearch