从 sklearn.pipeline.Pipeline 获取转换器结果

2024-01-05

我正在使用一个sklearn.pipeline.Pipeline我的聚类对象。

pipe = sklearn.pipeline.Pipeline([('transformer1': transformer1),
                                  ('transformer2': transformer2),
                                  ('clusterer': clusterer)])

然后我使用轮廓分数来评估结果。

sil = preprocessing.silhouette_score(X, y)

我想知道如何获得X或来自管道的转换后的数据,因为它只返回clusterer.fit_predict(X).

我知道我可以通过将管道拆分为

pipe = sklearn.pipeline.Pipeline([('transformer1': transformer1),
                                  ('transformer2': transformer2)])

X = pipe.fit_transform(data)
res = clusterer.fit_predict(X)
sil = preprocessing.silhouette_score(X, res)

但我想在一条管道中完成这一切。


如果您想要在管道的中间步骤上拟合和转换数据,那么重用相同的管道是没有意义的,最好使用您指定的新管道,因为调用fit()会忘记所有以前学到的数据。

但是如果你只想transform()并查看已安装管道上的中间数据,然后可以通过访问named_steps http://scikit-learn.org/stable/modules/generated/sklearn.pipeline.Pipeline.html范围。

new_pipe = sklearn.pipeline.Pipeline([('transformer1': 
                                           old_pipe.named_steps['transformer1']),
                                      ('transformer2': 
                                          old_pipe.named_steps['transformer2'])])

或者直接使用内部变量steps like:

transformer_steps = old_pipe.steps
new_pipe = sklearn.pipeline.Pipeline([('transformer1': transformer_steps[0]),
                                  ('transformer2': transformer_steps[1])])

然后调用new_pipe.transform().

Update:如果您有0.18或更高版本,那么您可以将管道内的非必需估计器设置为None在同一管道中获得结果。其讨论于这个问题在 scikit-learn github https://github.com/scikit-learn/scikit-learn/issues/7536在您的情况下上述用法:

pipe.set_params(clusterer=None)
pipe.transform(df)

但请注意,也许可以存放已安装的clusterer在其他地方这样做,否则当您想要使用该功能时,您需要再次安装整个管道。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

从 sklearn.pipeline.Pipeline 获取转换器结果 的相关文章

随机推荐

  • C++ MSVS,我应该做什么文件“清理”? (错误:D8037)

    在 C MSVS2008 中工作 我遇到了越来越烦人的问题 断点在错误的行上执行 未捕获等 这是一个包含数千个文件的非常大的工作空间 所以我 忍受了 我经历了 标准 的东西 干净 深度 干净 手动删除 idb pdb il 等 它没有解决
  • Angular 6 - 如何在单击子菜单项时使用 routerLinkActive 将父菜单项设置为活动状态?

    我正在使用 Angular 6 并且遇到了有关导航菜单的问题 当我单击子项目时 使用 routerLinkActive 时 只有子项目被设置为活动状态 而不是父项目 我想知道在 Angular 6 中选择子项时如何将父项类设置为活动状态 假
  • Chrome 扩展在调用 launchWebAuthFlow API 时导致 Microsoft Edge 浏览器崩溃

    我们有一个在 Chromium Edge 和 Chrome 浏览器上运行的 Chrome 扩展 在今天之前它工作得很好 但今天它在调用 API 后开始使 Microsoft Edge 崩溃 并且在调试时我们看到错误来自此 API https
  • 解析错误:语法错误,文件第 128 行出现意外的 $end

    嗨 这是代码 它是一个页面 用于在下拉列表中显示数据库中可用的表 然后在表中显示结果 执行此操作的实际代码 在中间 本身可以完美运行 但是当我尝试在其周围添加模板时 我会收到错误
  • Chrome 调试器中显示“警告:显示临时标头”

    I noticed a strange caution message when looking at downloaded resources using Google chrome inspector F12 显示临时标题 我发现了一些
  • 使用 Python 通过 ssh 执行命令

    我正在编写一个脚本来自动执行 Python 中的一些命令行命令 目前 我正在拨打这样的电话 cmd some unix command retcode subprocess call cmd shell True 但是 我需要在远程计算机上
  • 在 Terraform 中使用本地 Docker 镜像

    我想在 Terraform 中使用本地 Docker 映像 更具体地说 我有一个 Google Cloud Build Pipeline 它构建了一个 Docker 映像 我想将其部署到带有 Terraform 的 GCP Cloud Ru
  • 为什么 int j = 012 给出输出 10?

    在我的实际项目中偶然发生了这里是我修改的小程序 我不明白为什么它会给出输出10 public class Int public static void main String args int j 012 accidentaly i put
  • fusion 能看穿新型包装吗?

    Given newtype MyVec MyVec unVec Data Vector deriving Functor etc 这将创建 类似于 instance Functor MyVec where fmap f MyVec Data
  • 如何使用 django-tables2 从自定义 sql 渲染表?

    我正在使用 Django 和 django tables2 在 Web 界面中很好地表示 sql 查询 我有一个遗留的 sql 代码 通过标准 models py 定义它非常非常复杂 问题是 如何使用 django tables2 从自定义
  • ld:找不到 -lz 的库

    这让我发疯 当我尝试在模拟器上编译时 一切正常 但在设备上我收到此错误 ld library not found for lz Command Developer Platforms iPhoneOS platform Developer
  • 新版 Google Play 管理中心出现数以千计的奇怪崩溃

    Google Play 管理中心的 ANR 和崩溃部分最近已更新 可显示更多 ANR 和崩溃 自动从选择加入的用户收集 我在各种 Android 版本和设备上发现了很多奇怪的新崩溃 1 最常见的 每周出现数千次 没有任何类名的 ClassN
  • 什么是$cacheFactory?

    我完全找不到任何关于具体内容的信息 cacheFactory是什么以及它如何在您的应用程序中发挥作用 角度文档说 构造缓存对象并提供对它们的访问的工厂 cacheFactory http docs angularjs org api ng
  • 从数组中创建列表

    进行练习时遇到困难雄辩的Javascript书 http eloquentjavascript net 任务是从数组中创建一个列表 该列表是这样的 var list value 1 rest value 2 rest value 3 res
  • 样式输入文件和自动提交

    我试图有一个用户单击的单个文本链接 它会询问用户他 她想要上传哪个文件 然后自动将其发布到表单中 我怎样才能达到同样的效果 我知道我必须设置文件输入的样式 但如何让它在选择文件时自动发布 非常感谢 在页面中嵌入 javascript 是不好
  • Django:模板中显示的多维字典

    我有以下视图 但发现无法通过模板显示 sm request session get active semester semester dates SemesterDates objects filter semester sm schedu
  • jQuery 文件大小

    在jQuery的官方网站上 他们说缩小后的文件大小是18k 但是下载后 我发现是53 9K 下载后我需要做一些压缩吗 该网站声称它已缩小为 18kgzipped 因此 您需要设置 Web 服务器来压缩 JavaScript 文件才能查看文件
  • Outlook VSTO 功能区到主页 tabControlId

    我正在写一个VSTO http en wikipedia org wiki Visual Studio Tools for Office 微软Outlook http en wikipedia org wiki Microsoft Outl
  • 使用 Gmail API 从 Gmail 下载附件

    我在用邮箱API https developers google com gmail api访问我的 Gmail 数据以及谷歌Python API客户端 https github com googleapis google api pyth
  • 从 sklearn.pipeline.Pipeline 获取转换器结果

    我正在使用一个sklearn pipeline Pipeline我的聚类对象 pipe sklearn pipeline Pipeline transformer1 transformer1 transformer2 transformer