从 sklearn.pipeline.Pipeline 获取转换器结果

2024-01-05

我正在使用一个sklearn.pipeline.Pipeline我的聚类对象。

pipe = sklearn.pipeline.Pipeline([('transformer1': transformer1),
                                  ('transformer2': transformer2),
                                  ('clusterer': clusterer)])

然后我使用轮廓分数来评估结果。

sil = preprocessing.silhouette_score(X, y)

我想知道如何获得X或来自管道的转换后的数据，因为它只返回clusterer.fit_predict(X).

我知道我可以通过将管道拆分为

pipe = sklearn.pipeline.Pipeline([('transformer1': transformer1),
                                  ('transformer2': transformer2)])

X = pipe.fit_transform(data)
res = clusterer.fit_predict(X)
sil = preprocessing.silhouette_score(X, res)

但我想在一条管道中完成这一切。

如果您想要在管道的中间步骤上拟合和转换数据，那么重用相同的管道是没有意义的，最好使用您指定的新管道，因为调用fit()会忘记所有以前学到的数据。

但是如果你只想transform()并查看已安装管道上的中间数据，然后可以通过访问named_steps http://scikit-learn.org/stable/modules/generated/sklearn.pipeline.Pipeline.html范围。

new_pipe = sklearn.pipeline.Pipeline([('transformer1': 
                                           old_pipe.named_steps['transformer1']),
                                      ('transformer2': 
                                          old_pipe.named_steps['transformer2'])])

或者直接使用内部变量steps like:

transformer_steps = old_pipe.steps
new_pipe = sklearn.pipeline.Pipeline([('transformer1': transformer_steps[0]),
                                  ('transformer2': transformer_steps[1])])

然后调用new_pipe.transform().

Update:如果您有0.18或更高版本，那么您可以将管道内的非必需估计器设置为None在同一管道中获得结果。其讨论于这个问题在 scikit-learn github https://github.com/scikit-learn/scikit-learn/issues/7536在您的情况下上述用法：

pipe.set_params(clusterer=None)
pipe.transform(df)

但请注意，也许可以存放已安装的clusterer在其他地方这样做，否则当您想要使用该功能时，您需要再次安装整个管道。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python27

scikitlearn

pipeline

从 sklearn.pipeline.Pipeline 获取转换器结果的相关文章

ImageDataGenerator 预测类 - 为什么预测未正确从概率转换为预测类？

我有一个这样设置的目录 images val class1 class2 test all classes train class1 class2 每个目录中都有一组图像我想预测测试中的每个图像是否属于 1 类或 2 类我写这个是为了读
如何使 QStyledItemDelegate 的子类在 PySide/PyQt 中的 QListView 中鼠标悬停时正确反应？

在解决我在前面的问题中提到的问题的过程中问题1 https stackoverflow com questions 33253745 how to most efficiently implement a pyside qlistview
from __future__ importabsolute_import 实际上做了什么？

I have answered https stackoverflow com a 22679558 2588818一个关于Python中绝对导入的问题我认为我通过阅读理解了这个问题Python 2 5 变更日志 https docs p
Python C-Api 线程问题

我正在编写一个 C 程序它使用用 python 编写的网络库我将 python lib 与 python C api 一起嵌入该库异步发送所有请求并在请求完成时通过信号通知我这意味着理论上实际上我有两个与线程相关的问题从 c
Python：Tkinter Treeview 可搜索

相当直接的问题尽管我用了最好的谷歌搜索但我找不到任何相关内容我有一个 Python 应用程序它使用 Tkinter Treeview 小部件作为表格这对于我需要使用它的用途来说效果很好但最终会在一些树中出现几百个项目无论如何
使用 python 从 hive 读取数据时的性能问题

我在 hive 中有一个表其中包含 351 837 110 MB 大小记录我正在使用 python 读取该表并写入 sql server 在此过程中从 hive 读取数据到 pandas dataframe 需要很长时间当我加载整
如何计算第一和第三四分位数？

我有数据框 time diff avg trips 0 0 450000 1 0 1 0 483333 1 0 2 0 500000 1 0 3 0 516667 1 0 4 0 533333 2 0 我想获得该列的第一个四分位数第三个四
如何解决 Python 'Pyzbar' 库的导入错误？

我刚刚开始熟悉 Pyzbar 库但是当使用decode方法我得到一个错误这是代码 import cv2 import numpy as np import pyzbar code image cv2 imread C Users Ace
找到分类的重要特征

我正在尝试使用逻辑回归模型对一些脑电图数据进行分类这似乎给出了我的数据的最佳分类我拥有的数据来自多通道 EEG 设置因此本质上我有一个 63 x 116 x 50 的矩阵即通道 x 时间点 x 试验次数有两种试验类型均为 50
__init__ 的正确类型注释

什么是正确的类型注释 init python 中的函数 class MyClass 以下哪一项更有意义 def init self type None gt None def init self type MyClass gt MyClas
在 python 中使用 graphviz 从 DOT 文件绘制有向图

这是API参考 http graphviz readthedocs io en latest api html for graphviz 我找不到任何从现有的生成有向图的方法dot源文件方法如render and view保存在新文件中
在提供给 sklearn 管道中的分类器之前获取所选特征的名称和数量

我在用sel SelectFromModel ExtraTreesClassifier 10 threshold mean 选择我的数据集中最重要的特征然后我想将这些选定的特征提供给我的 keras 分类器但是我的基于 keras 的神
导入错误：无法导入名称“_print_elapsed_time”

你好我正在尝试使用 sklearn 中的 make pipeline 模块但是当我尝试使用以下命令导入它时 from sklearn pipeline import make pipeline 我收到此错误 ImportError ca
如何使用sklearn Pipeline和FeatureUnion选择多个（数字和文本）列进行文本分类？

我开发了一个用于多标签分类的文本模型这OneVsRest分类器 http scikit learn org stable modules generated sklearn multiclass OneVsRestClassifier h
sklearn pipeline + keras顺序模型-如何获取历史记录？

Keras https keras io模型当 fit被调用时返回一个历史对象如果我将此模型用作 sklearn 管道的一步是否可以检索它顺便说一句我正在使用 python 3 6 提前致谢 History 回调记录每个时期的训
Python PIL 由于某种原因无法打开 PDF

所以我的程序能够打开 PNG 但不能打开 PDF 所以我这样做只是为了测试但它仍然无法打开甚至是一个简单的 PDF 我不知道为什么 from PIL import Image with Image open r Adams K a pd
我的 R 平方分数为负，但使用 k 倍交叉验证的准确度分数约为 92%

对于下面的代码我的 r 平方分数为负但使用 k 折交叉验证的准确度分数为 92 这怎么可能我使用随机森林回归算法来预测一些数据数据集的链接在下面的链接中给出 https www kaggle com ludobenistant hr
随机森林修剪

我有 sklearn 随机森林回归器它非常重有 1 6 GB 并且在预测值时工作很长时间我想把它修剪一下让它变得更轻据我所知决策树和森林没有实施修剪我无法自己实现它因为树代码是用 C 编写的而我不知道有谁知道解决方案吗
如果包含字符串，pandas 重命名列

我想遍历数据框中的所有列并重命名或映射列如果它们包含某些字符串例如将包含 agriculture 的所有列重命名为字符串 agri 我正在考虑使用rename and str contains但不知道如何将它们结合起来以实现我想
scikit-learn RandomForestClassifier 中的子样本大小

如何控制用于训练森林中每棵树的子样本的大小根据 scikit learn 的文档随机森林是一种适合许多决策的元估计器数据集的各个子样本上的树分类器并使用平均以提高预测准确性并控制过度拟合子样本大小始终与原始输入样本相同大小但如

随机推荐

C++ MSVS，我应该做什么文件“清理”？（错误：D8037）

在 C MSVS2008 中工作我遇到了越来越烦人的问题断点在错误的行上执行未捕获等这是一个包含数千个文件的非常大的工作空间所以我忍受了我经历了标准的东西干净深度干净手动删除 idb pdb il 等它没有解决
Angular 6 - 如何在单击子菜单项时使用 routerLinkActive 将父菜单项设置为活动状态？

我正在使用 Angular 6 并且遇到了有关导航菜单的问题当我单击子项目时使用 routerLinkActive 时只有子项目被设置为活动状态而不是父项目我想知道在 Angular 6 中选择子项时如何将父项类设置为活动状态假
Chrome 扩展在调用 launchWebAuthFlow API 时导致 Microsoft Edge 浏览器崩溃

我们有一个在 Chromium Edge 和 Chrome 浏览器上运行的 Chrome 扩展在今天之前它工作得很好但今天它在调用 API 后开始使 Microsoft Edge 崩溃并且在调试时我们看到错误来自此 API https
解析错误：语法错误，文件第 128 行出现意外的 $end

嗨这是代码它是一个页面用于在下拉列表中显示数据库中可用的表然后在表中显示结果执行此操作的实际代码在中间本身可以完美运行但是当我尝试在其周围添加模板时我会收到错误
Chrome 调试器中显示“警告：显示临时标头”

I noticed a strange caution message when looking at downloaded resources using Google chrome inspector F12 显示临时标题我发现了一些
使用 Python 通过 ssh 执行命令

我正在编写一个脚本来自动执行 Python 中的一些命令行命令目前我正在拨打这样的电话 cmd some unix command retcode subprocess call cmd shell True 但是我需要在远程计算机上
在 Terraform 中使用本地 Docker 镜像

我想在 Terraform 中使用本地 Docker 映像更具体地说我有一个 Google Cloud Build Pipeline 它构建了一个 Docker 映像我想将其部署到带有 Terraform 的 GCP Cloud Ru
为什么 int j = 012 给出输出 10？

在我的实际项目中偶然发生了这里是我修改的小程序我不明白为什么它会给出输出10 public class Int public static void main String args int j 012 accidentaly i put
fusion 能看穿新型包装吗？

Given newtype MyVec MyVec unVec Data Vector deriving Functor etc 这将创建类似于 instance Functor MyVec where fmap f MyVec Data
如何使用 django-tables2 从自定义 sql 渲染表？

我正在使用 Django 和 django tables2 在 Web 界面中很好地表示 sql 查询我有一个遗留的 sql 代码通过标准 models py 定义它非常非常复杂问题是如何使用 django tables2 从自定义
ld：找不到 -lz 的库

这让我发疯当我尝试在模拟器上编译时一切正常但在设备上我收到此错误 ld library not found for lz Command Developer Platforms iPhoneOS platform Developer
新版 Google Play 管理中心出现数以千计的奇怪崩溃

Google Play 管理中心的 ANR 和崩溃部分最近已更新可显示更多 ANR 和崩溃自动从选择加入的用户收集我在各种 Android 版本和设备上发现了很多奇怪的新崩溃 1 最常见的每周出现数千次没有任何类名的 ClassN
什么是$cacheFactory？

我完全找不到任何关于具体内容的信息 cacheFactory是什么以及它如何在您的应用程序中发挥作用角度文档说构造缓存对象并提供对它们的访问的工厂 cacheFactory http docs angularjs org api ng
从数组中创建列表

进行练习时遇到困难雄辩的Javascript书 http eloquentjavascript net 任务是从数组中创建一个列表该列表是这样的 var list value 1 rest value 2 rest value 3 res
样式输入文件和自动提交

我试图有一个用户单击的单个文本链接它会询问用户他她想要上传哪个文件然后自动将其发布到表单中我怎样才能达到同样的效果我知道我必须设置文件输入的样式但如何让它在选择文件时自动发布非常感谢在页面中嵌入 javascript 是不好
Django：模板中显示的多维字典

我有以下视图但发现无法通过模板显示 sm request session get active semester semester dates SemesterDates objects filter semester sm schedu
jQuery 文件大小

在jQuery的官方网站上他们说缩小后的文件大小是18k 但是下载后我发现是53 9K 下载后我需要做一些压缩吗该网站声称它已缩小为 18kgzipped 因此您需要设置 Web 服务器来压缩 JavaScript 文件才能查看文件
Outlook VSTO 功能区到主页 tabControlId

我正在写一个VSTO http en wikipedia org wiki Visual Studio Tools for Office 微软Outlook http en wikipedia org wiki Microsoft Outl
使用 Gmail API 从 Gmail 下载附件

我在用邮箱API https developers google com gmail api访问我的 Gmail 数据以及谷歌Python API客户端 https github com googleapis google api pyth
从 sklearn.pipeline.Pipeline 获取转换器结果

我正在使用一个sklearn pipeline Pipeline我的聚类对象 pipe sklearn pipeline Pipeline transformer1 transformer1 transformer2 transformer

从 sklearn.pipeline.Pipeline 获取转换器结果

从 sklearn.pipeline.Pipeline 获取转换器结果 的相关文章

随机推荐

热门标签

从 sklearn.pipeline.Pipeline 获取转换器结果的相关文章