sklearn 中估计器管道的参数 clf 无效

2024-02-23

有人可以检查以下代码的问题吗？我在构建模型的过程中是否有任何错误？我已经在参数中添加了两个“clf__”。

clf=RandomForestClassifier()
pca = PCA()
pca_clf = make_pipeline(pca, clf) 


kfold = KFold(n_splits=10, random_state=22)



parameters = {'clf__n_estimators': [4, 6, 9], 'clf__max_features': ['log2', 
'sqrt','auto'],'clf__criterion': ['entropy', 'gini'], 'clf__max_depth': [2, 
 3, 5, 10], 'clf__min_samples_split': [2, 3, 5],
'clf__min_samples_leaf': [1,5,8] }

grid_RF=GridSearchCV(pca_clf,param_grid=parameters,
        scoring='accuracy',cv=kfold)
grid_RF = grid_RF.fit(X_train, y_train)
clf = grid_RF.best_estimator_
clf.fit(X_train, y_train)
grid_RF.best_score_

cv_result = cross_val_score(clf,X_train,y_train, cv = kfold,scoring = 
"accuracy")

cv_result.mean()

您假设使用make_pipeline以错误的方式。从文档 http://scikit-learn.org/stable/modules/generated/sklearn.pipeline.make_pipeline.html:-

这是 Pipeline 构造函数的简写；它不需要，并且不允许命名估计器。相反，他们的名字将自动设置为其类型的小写。

因此，这意味着当您提供 PCA 对象时，其名称将被设置为“pca”（小写），当您向其提供 RandomForestClassifier 对象时，它将被命名为“randomforestclassifier”，而不是您所想的“clf” 。

所以现在你制作的参数网格是无效的，因为它包含clf__并且它不存在于管道中。

解决方案1：

替换这一行：

pca_clf = make_pipeline(pca, clf)

With

pca_clf = Pipeline([('pca', pca), ('clf', clf)])

解决方案2：

如果您不想更改pca_clf = make_pipeline(pca, clf)行，然后替换所有出现的 clf 在你的parameters像这样的“随机森林分类器”：

parameters = {'randomforestclassifier__n_estimators': [4, 6, 9], 
              'randomforestclassifier__max_features': ['log2', 'sqrt','auto'],
              'randomforestclassifier__criterion': ['entropy', 'gini'], 
              'randomforestclassifier__max_depth': [2, 3, 5, 10], 
              'randomforestclassifier__min_samples_split': [2, 3, 5],
              'randomforestclassifier__min_samples_leaf': [1,5,8] }

Sidenote：无需在代码中执行此操作：

clf = grid_RF.best_estimator_
clf.fit(X_train, y_train)

The best_estimator_将已经安装了具有最佳找到参数的整个数据，因此您调用clf.fit()是多余的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scikitlearn

pipeline

PCA

sklearn 中估计器管道的参数 clf 无效的相关文章

判断线程是否已经启动

如何判断Python线程是否已经启动有一个方法is alive 但这是真的before and while一个线程正在运行你可以看看ident领域的Thread实例这Python 2 7 线程文档 http docs python o
Python3+Kivy+Plyer 推送通知图标问题

我在使用 Android 的简单通知测试应用程序时遇到了一个奇怪的错误错误 python AttributeError type object notification org notificator R drawable has no
如何在groupby之后将pandas数据框拆分为许多列

我希望能够在 pandas 中使用 groupby 按列对数据进行分组然后将其拆分以便每个组都是数据框中自己的列 e g time data 0 1 2 0 1 2 3 0 2 3 4 0 3 1 2 1 4 2 3 1 5 3 4 1
如何 json_normalize() df 中的特定字段并保留其他列？ [复制]

这个问题在这里已经有答案了这是我的简单示例我的实际数据集中的 json 字段非常嵌套因此我一次解压一层我需要在 json normalize 之后保留数据集上的某些列 https pandas pydata org docs ref
为 PyCharm 中的所有配置设置相同的环境变量

我有一个与 Celery 和很多不同的工作人员一起的项目如何避免每次将 PyCharm 中的环境变量复制粘贴到每个运行调试配置有什么方法可以在项目设置中设置它们吗找到解决方案here https stackoverflow com
远程控制或脚本打开 Office 从 Python 编辑 Word 文档

我想最好在 Windows 上在特定文档上启动 Open Office 搜索固定字符串并将其替换为我的程序选择的另一个字符串我该如何从外部 Python 程序中做到这一点 OLE 什么原生 Python 脚本解决方案 The doc
如何在 openpyxl 中设置或更改表格的默认高度

我想通过openpyxl更改表格高度并且我希望首先默认一个更大的高度值然后我可以设置自动换行以使我的表格更漂亮但我不知道如何更改默认高度唯一的到目前为止我知道更改表格高度的方法是设置 row dimension idx heigh
在python中调用subprocess.Popen时“系统找不到指定的文件”

我正在尝试使用svnmerge py合并一些文件它在底层使用 python 当我使用它时我收到一个错误系统找不到指定的文件工作中的同事正在运行相同版本的svnmerge py 以及 python 2 5 2 特别是 r252 609
一起使用 Argparse 和 Json

我是 Python 初学者我想知道 Argparse 和 JSON 是否可以一起使用说我有变量p q r 我可以将它们添加到 argparse 中 parser add argument p param1 help x variabl
我有一个 Employee 类，我想返回“姓名”列表

我有一个 Employee 类我想返回姓名列表雇员 py class Employee object def init self id name members None self id id self name name self
如何解码 dtype=numpy.string_ 的 numpy 数组？

我需要使用 Python 3 解码按以下方式编码的字符串 gt gt gt s numpy asarray numpy string hello nworld gt gt gt s array b hello nworld dtype S1
Pandas，按最大返回值进行分组 AssertionError：

熊猫有问题我想听听你的意见我有这个数据框我需要在其中获取最大值代码就在下面 df stack pd DataFrame 1 0 2016 0 NonResidential Hotel 98101 0 DOWNTOWN 47 6122
如何使用注释和聚合在 Django 的 ORM 中执行此 GROUP BY 查询

我真的不知道如何翻译GROUP BY and HAVING到姜戈的QuerySet annotate and QuerySet aggregate 我正在尝试将这个 SQL 查询转换为 ORM 语言 SELECT EXTRACT year
Docker 日志中的 Python 异常标记为流：stdout

我想解析和处理来自 docker 容器的所有错误但当我期望 stderr 时 Python 异常标记为 stdout 举个简单的例子app py raise Exception 然后我在 docker 容器中运行这个文件但在 var l
dask allocate() 或 apply() 中的变量列名

我有适用于pandas 但我在将其转换为使用时遇到问题dask 有一个部分解决方案here https stackoverflow com questions 32363114 how do i change rows and column
本地设置的 Cython 编译器指令是否影响一个或所有函数？

我正在努力使用 Cython 加速一些 Python Numpy 代码并且对本地设置如定义的here http docs cython org en latest src reference compilation html在文档中
Pandas DataFrame：如何计算组中第一行和最后一行的差异？

这是我的熊猫数据框 import pandas as pd import numpy as np data column1 338 519 871 1731 2693 2963 3379 3789 3910 4109 4307 4800 4
Python列表对象属性“append”是只读的

正如标题所说在Python中我试图做到这一点以便当有人输入一个选择在本例中为Choice13 时它会从密码列表中删除旧密码并添加新密码 passwords mrjoebblock mrjoefblock mrjoegblock m
使用Python重命名目录中的多个文件

我正在尝试使用以下 Python 脚本重命名目录中的多个文件 import os path Users myName Desktop directory files os listdir path i 1 for file in files
如何抑制 Pandas Future 警告？

当我运行该程序时 Pandas 每次都会给出如下所示的未来警告 D Python lib site packages pandas core frame py 3581 FutureWarning rename with inplace

随机推荐

为什么将演示文稿保存到类似文件的对象会产生空白演示文稿？

作为回应这个答案 https stackoverflow com a 46980767 1868136对于我之前的问题我编写了以下简短的程序来尝试重现该问题 from pptx import Presentation from io im
即使调用“SetWindowPos()”后，“SetWindowLong()”函数也不会更改窗口样式

我使用以下代码创建静态控件 hWnd CreateWindowExW 0 L STATIC Content c str SS LEFT WS VISIBLE WS CHILD SS SUNKEN 200 120 120 40 hWndPar
如何使用 PyUSB 写入控制端点

我有一个 USB 设备其代码如下 import usb core import usb util device usb core find idVendor 0xC251 idProduct 0x2201 print device pro
作为类中的成员“变量”起作用

我正在考虑如何使用一些先进的技术来改进我的简单计算器我想问是否有某种方法可以创建一个具有可以为每个实例定义的函数的类 class Function public Function function Function private fu
Android 设备的后退和主页按钮按下事件 (cocos2d-x 3)

我这样做是为了抓住Home and BackAndroid 设备上的按钮按下事件被覆盖void Layer onKeyReleased EventKeyboard KeyCode keyCode Event event 像这样的函数 vo
线程优先级和线程精度

线程优先级会提高准确性吗Thread sleep 50 我们知道当您调用 sleep 50 毫秒时线程并不准确但是它是否会提高准确性呢如果线程被列为MAX PRIORITY 将感谢任何形式的解释睡眠的准确性取决于操作系统如果您想
无法访问 HTMLCollection 的值

测试 html
单个 SQL 查询查找数据库中所有列中的空值

我想确定所有表中每列中空值的数量我有一个数据库它由大约 250 个表组成其中大多数都在使用中问题是几乎所有表都包含为某些短期创建的不需要的列术语使用现在我们想要识别所有表中具有空值的列由于表的计数很大并且时间较少我想知道一种最
确定文件映射到内存的次数

是否可以获取 Linux 中特定文件描述符上的内存映射总量为了清楚起见我制作了一个如何打开创建内存映射的小示例代码 int fileDescriptor open mapname O RDWR O CREAT O EXCL 0666
关于在 C# 桌面应用程序中使用 php Web 服务的问题

我正在开发一个 C 桌面应用程序并在尝试使用该应用程序时使用在 php 应用程序中开发的网络服务我只是添加该网络服务的网络引用并尝试通过以下代码进行访问 WebReference TestWSDL pdl new testingApp
从控制台上的 PyQt5 浏览器中删除日志

我有一个 PyQt5 应用程序虚拟桌面 https github com DSSecret Studios Dev Virtual Desktop有一个内置浏览器当我使用浏览器时我从浏览器中收到 JS 错误类似于 Chrome 在 W
'&.' 是什么意思？ in '&.sub-title' 表示在scss 中？

我是 CSS 和 SCSS 的新手在下面的代码中 title width 718px sub title width 938px 什么是方法和嵌套类一样吗 The 连接父类结果是 title sub title 而不是 title
如何在Python中安装gcp？

许多 BigQuery 示例都以以下内容开头 import gcp bigquery as bq 但我得到ImportError No module named gcp bigquery每当我尝试运行这个时我如何安装这个库我正在使用 p
在 MATLAB 中绕其中心旋转图像矩阵

假设我有一个 2x2 矩阵其中填充了代表平面的值现在我想以 3D 方式在 z 方向上围绕自身旋转平面为了更好地理解请参见下图我想知道这是否可以通过简单的仿射矩阵实现因此我创建了以下简单的脚本 Create a random v
Xamarin PCLCrypto SHA256 给出不同的哈希值

我有一个 Xamarin Forms XAML 便携式项目我需要从字符串中获取 SHA256 我使用 PCLCrypto 来查找哈希因为 PCL 中不存在 System Security Cryptography 我从 API 获取 s
如何使用`React.createElement`子参数（没有jsx）

React createElement采用展开的 children 参数 var d React DOM React createElement LabeledElement label Foo d input value foo 但我找不
如何为相机设置 android:screenOrientation="portrait"

我正在使用 Samsung Galaxy Note 运行phonegap 应用程序当我拍照时我可以看到屏幕在进入相机之前旋转我怎样才能禁用这个功能我尝试在主线程和相机活动上强制纵向但那些似乎不起作用
无法声明只有一个参数的匿名对象

有这样的代码 class SomeClass public SomeClass SomeClass SomeClass b SomeClass SomeClass b SomeClass c int main SomeClass a Som
Python MySql 插入不起作用

我正在使用 python MySQL API 从 python 程序连接到 Mysql 数据库我几天来面临一个问题我无法将记录插入数据库不知道原因是什么这是我连接并将记录插入数据库的方式 db MySQLdb connect loc
sklearn 中估计器管道的参数 clf 无效

有人可以检查以下代码的问题吗我在构建模型的过程中是否有任何错误我已经在参数中添加了两个 clf clf RandomForestClassifier pca PCA pca clf make pipeline pca clf kfold

热门标签