GridSearchCV Pipeline 中的替代不同模型

2024-03-13

我想在 sklearn 中构建一个 Pipeline 并使用 GridSearchCV 测试不同的模型。

举个例子（请不要关注具体选择的型号）：

reg = LogisticRegression()

proj1 = PCA(n_components=2)
proj2 = MDS()
proj3 = TSNE()

pipe = [('proj', proj1), ('reg' , reg)]

pipe = Pipeline(pipe)

param_grid = {
    'reg__c': [0.01, 0.1, 1],
}

clf = GridSearchCV(pipe, param_grid = param_grid)

在这里，如果我想尝试不同的降维模型，我需要编写不同的管道并手动比较它们。有简单的方法吗？

我想出的一种解决方案是定义我自己的从基本估计器派生的类：

class Projection(BaseEstimator):
    def __init__(self, est_name):
        if est_name == "MDS":
            self.model = MDS()
        ...
    ...
    def fit_transform(self, X):
        return self.model.fit_transform(X)

我认为它会起作用，我只需创建一个 Projection 对象并将其传递给 Pipeline，使用估计器的名称作为它的参数。

但对我来说，这种方式有点混乱并且不可扩展：它让我每次想要比较不同的模型时都定义新的类。为了继续这个解决方案，我们可以实现一个类来完成相同的工作，但是使用任意一组模型。对我来说这似乎过于复杂。

比较不同模型的最自然和Python式的方法是什么？

假设您想要使用 PCA 和 TruncatedSVD 作为维度缩减步骤。

pca = decomposition.PCA()
svd = decomposition.TruncatedSVD()
svm = SVC()
n_components = [20, 40, 64]

你可以这样做：

pipe = Pipeline(steps=[('reduction', pca), ('svm', svm)])

# Change params_grid -> Instead of dict, make it a list of dict
# In the first element, pass parameters related to pca, and in second related to svd

params_grid = [{
'svm__C': [1, 10, 100, 1000],
'svm__kernel': ['linear', 'rbf'],
'svm__gamma': [0.001, 0.0001],
'reduction':pca,
'reduction__n_components': n_components,
},
{
'svm__C': [1, 10, 100, 1000],
'svm__kernel': ['linear', 'rbf'],
'svm__gamma': [0.001, 0.0001],
'reduction':svd,
'reduction__n_components': n_components,
'reduction__algorithm':['randomized']
}]

现在只需将管道对象传递给 gridsearchCV

grd = GridSearchCV(pipe, param_grid = params_grid)

Calling grd.fit()将使用以下所有值在 params_grid 列表的两个元素上搜索参数one一次。

更详细的请看我的另一个回答：使用网格搜索获得最佳模型的“并行”管道 https://stackoverflow.com/questions/42266737/parallel-pipeline-to-get-best-model-using-gridsearch/42271829#42271829

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scikitlearn

pipeline

crossvalidation

Gridsearch

GridSearchCV Pipeline 中的替代不同模型的相关文章

env: python: 使用 Xcode 构建应用程序时没有这样的文件或目录

当我在 Xcode 在 MacOS 12 3 上中构建运行存档我的应用程序时遇到此错误 env python No such file or directory Command Ld failed with a nonzero e
如何获取右侧数据框中不在左侧数据框中的数据

我有两个数据帧我正在尝试输出其中一个数据帧中的数据而不是另一个数据帧中的数据我可以使用第一个数据帧中的数据但不能使用第二个数据帧中的数据 only new old merge new outer on Employee ID Ben
keras 层教程和示例

我正在尝试编码和学习不同的神经网络模型我对输入维度有很多复杂性我正在寻找一些教程显示层的差异以及如何设置每个层的输入和输出 Keras 文档 https keras io layers core 向您展示所有input shape每层
Python 的“platform.mac_ver()”报告不正确的 MacOS 版本

我正在使用Pythonplatform module https docs python org 3 library platform html要识别 MacOS 版本如下所示 import platform print platform
将预训练的手套词嵌入与 scikit-learn 结合使用

我已经使用 keras 来使用预先训练的词嵌入但我不太确定如何在 scikit learn 模型上执行此操作我也需要在 sklearn 中执行此操作因为我正在使用vecstack集成 keras 序列模型和 sklearn 模型这就
如何使用 QWebView 显示 html。 Python？

如何在控制台中显示 HTML 格式的网页 import sys from PyQt4 QtGui import QApplication from PyQt4 QtCore import QUrl from PyQt4 QtWebKit i
将字段重新格式化为列，其他字段（与先前结构中成为列的字段配对）成为新列中的字段

我的任务是清理慈善机构设计的移动应用程序中的数据在一个部分中用户问答应用程序使用会话由一行表示该部分由重复的问题答案字段对组成其中一个字段代表所提出的问题然后它旁边的字段代表相应的答案每个问题字段和答案列对一起代表一个独特的问
使用DockerOperator时如何同时使用xcom_push=True和auto_remove=True？

Problem 跑步时DockerOperator with xcom push True xcom all True and auto remove True 任务会引发错误就好像容器在读取其内容之前被删除一样STDOUT Exampl
参数太少错误，同时未使用参数占位符

我尝试使用 PYODBC 在 Access 数据库中执行 SQL 查询但出现以下错误 pyodbc Error 07002 07002 Microsoft ODBC Microsoft Access 驱动程序参数太少预期为 1 301
将 pandas 多索引数据帧转换为嵌套字典

我有一个 pandas 多索引数据框我试图将其输出为嵌套字典 create the dataset data clump thickness 0 0 274 0 0 1 19 0 1 0 67 0 1 1 12 0 2 0 83 0 2
如何在 Python for 循环中获取 GAE ndb 中当前记录的密钥？

我目前有一个网页其中显示数据存储中的记录列表以及编辑链接我想从数据库转换它至新开发银行我是 Python 和 GAE 新手当前代码 tbody for listtype in listtypes tr td listtype Li
Tkinter 按钮鼠标右键和左键单击有不同的命令

我正在用 Python 制作扫雷游戏并使用 tkinter 库来创建 gui 有没有绑定到 tkinter 按钮两个命令的方法一个是右键单击按钮时的命令另一个是单击左键时的命令通常按钮仅设计用于单击但 tkinter 允许您为
更新或插入 MySQL Python

如果记录已存在我需要更新一行如果不存在我需要创建一个新记录我理解 ON DUPLICATE KEY 将使用 MYSQLdb 完成此操作但是我无法使其正常工作我的代码如下 cursor database cursor cursor
Tkinter：通过多处理启动进程会创建不需要的新窗口

我计划围绕数值模拟编写一个小型 GUI 这就是我现在使用 Tkinter 的原因模拟应在单独的进程中从 GUI 启动为了玩一下我定义了一个函数 random process 来生成成对的 randn 数字这应该是一个真正的模拟过程
Python 上每个系数具有特定约束的多元线性回归

我目前正在数据集上运行多元线性回归起初我没有意识到我需要限制自己的体重事实上我需要有特定的正权重和负权重更准确地说我正在做一个评分系统这就是为什么我的一些变量应该对音符产生积极或消极的影响然而当运行我的模型时结果不符合我
如何更改Python使用的SQLite版本？

我在 Debian 9 12 上安装了 Python 3 8 和 SQLite 3 16 2 并且需要升级到较新版本的 SQLite 我已经下载并编译了 SQLite 网站上提供的合并并将其放入 usr bin 所以当我这样做时 sqli
使用 pyspark 计算所有可能的单词对

我有一个文本文档我需要找到整个文档中重复单词对的可能数量例如我有下面的word文档该文档有两行每行用分隔文档 My name is Sam My name is Sam My name is Sam My name is Sa
Pandas：合并多个数据框并控制列名称？

我想将九个 Pandas 数据帧合并到一个数据帧中对两列进行联接控制列名称这可能吗我有九个数据集它们都有以下列 org name items spend 我想将它们加入到具有以下列的单个数据框中 org name items df
matplotlib imshow() 和像素强度

我试图了解矩阵的值是如何输入到 matplotlib 的imshow 函数确定灰度模式下像素的强度考虑示例代码 import random import matplotlib pyplot as plt import matplotlib
捕获 SQLAlchemy 异常

我可以使用什么捕获 SQLAlechmy 异常的上层异常 gt gt gt from sqlalchemy import exc gt gt gt dir exc ArgumentError CircularDependencyError

随机推荐

设置Android布局元素的背景颜色

我正在尝试在某种程度上克隆活动的设计然而我在一项非常简单的任务上遇到了问题我已经创建了如图所示的布局标题是TextView in a RelativeLayout 现在我想改变背景颜色RelativeLayout 但我似乎无法弄清楚
如何更改 xib 中的占位符文本颜色？

如何更改 xib 中的占位符文本颜色我已经尝试过关键路径的事情但它给了我 NSException 任何人都可以帮忙吗修改占位符文本颜色的最简单方法是通过 Xcode Storyboard 界面生成器选择感兴趣的 UITextFiel
为什么匿名类不能有 lambda 属性，但可以有 Func<> 属性？ [复制]

这个问题在这里已经有答案了我正在尝试了解 C 对匿名类型的限制考虑以下代码 var myAwesomeObject new fn1 new Func
如何创建由两种颜色并排组成的android可绘制对象？

使用 XML 是否可以创建一个可绘制对象其中一半为 color1 另一半为 color2 当我将该可绘制对象设置为视图的背景时它应该如下图所示通过xml来做
有什么办法可以配置Struts绑定null而不是空字符串吗？

当用户决定将表单中的字段保留为空时 Apache Struts 会绑定为空String作为属性的值ActionForm 有什么方法可以全局修改行为并选择null而不是空的String 我知道 Spring MVC 的做法完全相同但还有字符
PhoneGap 相机在捕获图像后无法确认

我正在制作一个应用程序来测试 PhoneGap 的功能以便稍后我可以将其用于更大的项目我试图通过构建一个简单的测试应用程序来让相机 API 正常工作该应用程序仅捕获并显示图像奇怪的是当我按下捕获按钮时会触发navigate cam
Scala 中的高效字符串连接

JVM 通过以下方式优化字符串连接并将其替换为StringBuilder 这在 Scala 中应该是一样的但是如果字符串连接起来会发生什么 var x x x y x z 据我所知该方法将字符串视为字符序列因此即使 JVM 可以创建
如何声明基于泛型类型的指针？

我有一堂这样的课 type A class procedure
将结构移至单独的文件中而不拆分为单独的模块？

我有这个文件层次结构 main rs protocol protocol mod rs protocol struct rs In struct rs pub struct Struct members i8 impl Struct pub
从静态类型到动态类型

我一直致力于静态类型语言 C C Java 我一直在使用 Clojure 我真的很喜欢它我担心的一件事是假设我有一个窗口它接受 3 个模块作为参数并且随着需求的变化我需要将另一个模块传递给函数我只是更改了该函数编译器在我使用它
如何使用 grep 搜索当前目录中包含字符串“hello”但仅显示 .h 和 .cc 文件的所有文件？

如何使用 grep 搜索当前目录中包含字符串 hello 的所有文件并仅显示 h 和 cc 文件 grep r include cc h hello 内容为递归搜索也在所有子目录中查找包含 hello 的所有 cc 或 h 文件当前
在 PHP 中使用 group_concat 回显 mysql 数据

这是我的 SQL 小提琴 SQL小提琴 http rextester com GERD25923 我正在尝试使用 PHP 来回显这个结果这是我的预期结果 Some Stuff Here The Dark Knight Rises 7 5
jquery：如果（目标）是（'.wrapper'）的子级，那么（做某事）

var target this attr href if target is child of wrapper then do something 简单的语法有人可以在这里告诉我正确的语法吗 if target parents wrapp
Graphviz安装Ubuntu 14.04

我正在尝试使用创建一个点文件京东项目 http javaddlib sourceforge net jdd 它需要安装 Graphviz 我尝试使用控制台安装它 sudo apt get install graphviz 在这种情况下虽然
在powershell中获取当前用户的微软帐户名

如何在 PowerShell 中获取当前用户的 Microsoft 帐户用户名我了解如何获取本地用户名例如 env username 和其他类似的用户名但不是 Microsoft 帐户名通常是电子邮件地址感谢您的任何帮助阿里 I
在 Perl 中查找列表中缺失的数字

例如给定 1 2 5 6 7 我想确定3和4丢失了我发现以下代码可以实现我的目标 usr bin perl use Data Dumper list 1 2 5 6 7 missing map list 1 1 list 1 1 lis
将自定义图像放置在绘图窗口中 - 作为自定义数据标记或注释这些标记

I have a set of 150x150px png images and a set of x y coordinates that they correspond to Is there a way to plot the ima
帮助我理解

GridSearchCV Pipeline 中的替代不同模型

GridSearchCV Pipeline 中的替代不同模型 的相关文章

随机推荐

GridSearchCV Pipeline 中的替代不同模型的相关文章