如何从sklearn管道变压器中提取特征名称？

2023-11-29

以供参考：

Python 3.8.3
sklearn 1.0.2

我有一个scikit-learn pipeline为我格式化一些数据，如下所述：

我定义我的pipeline像这样：

# Pipeline 1
cat_selector = make_column_selector(dtype_include=object)
num_selector = make_column_selector(dtype_include=np.number)

cat_linear_processor = OneHotEncoder(handle_unknown="ignore", drop='first', sparse=False)
num_linear_processor = make_pipeline(SimpleImputer(strategy="median", add_indicator=True), MinMaxScaler(feature_range=(-1,1)))

linear_preprocessor = make_column_transformer( (num_linear_processor, num_selector), (cat_linear_processor, cat_selector) )

model_params ={'alpha': 0.0013879181970625643,
 'l1_ratio': 0.9634269882730605,
 'fit_intercept': True,
 'normalize': False,
 'max_iter': 245.69684524349375,
 'tol': 0.01855761485447601,
 'positive': False,
 'selection': 'random'}
model = ElasticNet(**model_params)

pipeline = make_pipeline(linear_preprocessor, model)

pipeline.steps yields:

[('columntransformer',
  ColumnTransformer(transformers=[('pipeline',
                                   Pipeline(steps=[('simpleimputer',
                                                    SimpleImputer(add_indicator=True,
                                                                  strategy='median')),
                                                   ('minmaxscaler',
                                                    MinMaxScaler(feature_range=(-1,
                                                                                1)))]),
                                   <sklearn.compose._column_transformer.make_column_selector object at 0x0000029CA3231EE0>),
                                  ('onehotencoder',
                                   OneHotEncoder(handle_unknown='ignore',
                                                 sparse=False),
                                   <sklearn.compose._column_transformer.make_column_selector object at 0x0000029CA542F040>)])),
 ('elasticnet',
  ElasticNet(alpha=0.0013879181970625643, l1_ratio=0.9634269882730605,
             max_iter=245.69684524349375, normalize=False, selection='random',
             tol=0.01855761485447601))]

我想做的是检索训练/测试数据的特征名称。

我尝试参考许多其他问题：

Sklearn Pipeline：在 ColumnTransformer 中 OneHotEncode 后获取特征名称
您可以使用 Sklearn 的 Transformer API 持续跟踪列标签吗？
使用ColumnTransformer.get_feature_names创建反向特征映射

然而，这些解决方案并没有奏效。例如：

[i for i in v.get_feature_names() for k, v in pipeline.named_steps.items() if hasattr(v,'get_feature_names')]

Yields:

----> 1 [i for i in v.get_feature_names() for k, v in pipeline.named_steps.items() if hasattr(v,'get_feature_names')]

NameError: name 'v' is not defined

I tried:

pipeline[:-1].get_feature_names_out()

Yields:

AttributeError: Estimator simpleimputer does not provide get_feature_names_out. Did you mean to call pipeline[:-1].get_feature_names_out()?

如何从当前管道编码后检索特征名称？

我想这篇文章可能会有所帮助：

在sklearn pipeline之后获取特征名称

也就是说，问题应该只是sklearn的版本。我几个月前发布的内容中引用的 PR 似乎刚刚被合并，尽管此后还没有新版本发布。安装实际的sklearn 的开发版本, scikit-learn 1.1.dev0应该可以解决问题（至少对我来说是这样）。

您可以安装每晚构建像这样：pip install --pre --extra-index https://pypi.anaconda.org/scipy-wheels-nightly/simple scikit-learn -U.

这是一个关于toy数据集：

import pandas as pd
import numpy as np
from sklearn.preprocessing import OneHotEncoder, MinMaxScaler
from sklearn.impute import SimpleImputer
from sklearn.pipeline import make_pipeline
from sklearn.compose import make_column_selector, make_column_transformer
from sklearn.linear_model import ElasticNet

X = pd.DataFrame({'city': ['London', 'London', 'Paris', 'Sallisaw', ''],
              'title': ['His Last Bow', 'How Watson Learned the Trick', 'A Moveable Feast', 'The Grapes of Wrath', 'The Jungle'],
              'expert_rating': [5, 3, 4, 5, 3],
              'user_rating': [4, 5, 4, 2, 3]})

# Pipeline 1
cat_selector = make_column_selector(dtype_include=object)
num_selector = make_column_selector(dtype_include=np.number)

cat_linear_processor = OneHotEncoder(handle_unknown="ignore", drop='first', sparse=False)
num_linear_processor = make_pipeline(SimpleImputer(strategy="median", add_indicator=True), MinMaxScaler(feature_range=(-1,1)))

linear_preprocessor = make_column_transformer( (num_linear_processor, num_selector), (cat_linear_processor, cat_selector) )

model_params ={
    'alpha': 0.0013879181970625643,
    'l1_ratio': 0.9634269882730605,
    'fit_intercept': True,
    'normalize': False,
    'max_iter': 245,
    'tol': 0.01855761485447601,
    'positive': False,
    'selection': 'random'}
model = ElasticNet(**model_params)

pipeline = make_pipeline(linear_preprocessor, model)
pipeline.fit(X.iloc[:, :-1], X.iloc[:, -1])

pipeline[:-1].get_feature_names_out()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scikitlearn

pipeline

如何从sklearn管道变压器中提取特征名称？的相关文章

如何并排绘制具有相同 X 坐标的条形图（“闪避”）

import matplotlib pyplot as plt gridnumber range 1 4 b1 plt bar gridnumber 0 2 0 3 0 1 width 0 4 label Bar 1 align cente
在二维数组中进行所有可能的组合

我正在尝试制作具有所有可能组合的 4x4 16 像素黑白图像数组我制作了以下数组作为模板 template 0 0 0 0 start with all white pixels 0 0 0 0 0 0 0 0 0 0 0 0 然后我想迭
如何打印前面有一定数量空格的整数？

C has printf Xd Y 它只打印整数 X 并使其在控制台窗口上占据 Y 空格例如 printf 3d 10 console 10 printf 5d 5 console 5 我如何在 python 3 中使用它 This pr
virtualenvwrapper 函数在 shell 脚本中不可用

所以我再一次制作了一个很棒的 python 程序它让我的生活变得更加轻松并节省了大量时间当然这涉及到一个 virtualenv 用mkvirtualenvvirtualenvwrapper 的功能该项目有一个requiremen
pandas read_csv 之前预处理数据文件

我使用 SAP 的数据输出但它既不是 CSV 因为它不引用包含其分隔符的字符串也不是固定宽度因为它具有多字节字符它是一种固定宽度字符为了将其放入 pandas 我当前读取文件获取分隔符位置对分隔符周围的每一行进行切片然后
删除 tkinter 文本默认绑定

我正在制作一个简单的 tkinter 文本编辑器但我想要所有默认绑定文本小部件如果可能的话删除例如当我按Ctrl i它默认插入一个制表符我制作了一个事件绑定来打印文本框中有多少行我将事件绑定设置为Ctrl i以及当我运行它时它会
在 python 中发送标头[重复]

这个问题在这里已经有答案了我有以下 python 脚本我想发送假标头信息以便我的应用程序就像 Firefox 一样运行我怎么能这么做呢 import urllib urllib2 cookielib username passw
我可以同时打开两个 Tkinter Windows 吗？

可以同时打开2个窗口吗 import tkinter as Tk import random import math root Tk Tk canvas Tk Canvas root background image Tk PhotoIma
对法语文本进行词形还原[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一些法语文本需要以某种方式进行处理为此我需要首先将文本标记为单词然后对这些单词进行词形还原以避免多次处理相同的词根据我
lmfit模型拟合然后预测

我正在领养lmfit进行曲线拟合并使用拟合模型进行预测然而下面的代码并没有达到我想要的效果能否请你帮忙谢谢 import numpy as np from lmfit import Model def linearModel x a0
argparse 不检查位置参数

我正在创建一个脚本它使用 argparse 接受位置参数和可选参数我已经阅读了 Doug 的教程和 python 文档但找不到答案 parser argparse ArgumentParser description script t
右键单击 QPushButton 上的 contextMenu

对于我的应用程序我在 Qt Designer 中创建了一个 GUI 并将其转换为 python 2 6 代码关于一些QPushButton 与设计器创建我想添加右键单击上下文菜单菜单选项取决于应用程序状态如何实现这样的上下文菜单
如何在 python 中使用交叉验证执行 GridSearchCV

我正在执行超参数调整RandomForest如下使用GridSearchCV X np array df features all features y np array df gold standard labels x train x
提高光线追踪命中功能的性能

我有一个简单的 python 光线追踪器渲染 200x200 的图像需要 4 分钟这对于我的口味来说绝对是太多了我想改善这种情况几点我为每个像素发射多条光线以提供抗锯齿功能每个像素总共发射 16 条光线 200x200x16
机器学习的周期性数据（例如度角 -> 179 与 -179 相差 2）

我使用 Python 进行核密度估计并使用高斯混合模型对多维数据样本的可能性进行排名每一条数据都是一个角度我不确定如何处理机器学习的角度数据的周期性首先我通过添加 360 来删除所有负角因此所有负角都变成了正角 179 变成了
在字符串内打印单引号

我想输出 XYZ s ABC 我在Python IDLE中尝试了以下3条语句第一条和第二条语句输出 a before 带打印功能的第三条语句不输出 before 作为 Python 新手我想了解为什么之前输出在第 1 条和第 2 条
如何将 django ModelForm 字段显示为不可编辑

接受我的初步教训django ModelForm 我想让用户能够编辑博客中的条目 BlogEntry has a date postedTime title and content 我想向用户展示一个编辑表单其中显示所有这些字段但仅包含
带 Qt 的菜单栏/系统托盘应用程序

我是 Qt PyQt 的新手我正在尝试制作一个应用程序其功能将从菜单栏系统托盘执行这里展示了一个完美的例子我找不到关于如何做到这一点的好资源有人可以建议吗 Thanks 我认为您正在寻找与QMenu and QMainWindo
JSONDecodeError：额外数据：Python [重复]

这个问题在这里已经有答案了我使用以下代码从文件加载 json file file name obj list with open file as f for json obj in f obj list append loads json
如何在不同的目录中执行python脚本？

Solved对于可能觉得这有帮助的人请参阅下面我的答案我有两个脚本 a py 和 b py 在我当前的目录 C Users MyName Desktop MAIN 中我运行 gt python a py 第一个脚本 a py 在我当前

随机推荐

我的应用程序刚刚因使用广告支持框架而被拒绝。哪个图书馆负责？

这只是一个更新没有改变与拒绝原因有关的任何内容以下是调解中心的回复原因程序许可协议解放军 3 3 12 我们发现您的应用使用 iOS 广告标识符但不包含广告功能这不符合 App Store 审查指南要求的 iOS 开发者计划许
定义中而非声明中的 const 值参数真的是 C++ 吗？

这类似于但不同这个问题下面是一些简单的测试代码来说明我在 Sun CC 中发现的一些奇怪之处 main cpp include wtc hpp int main int char testy t t lame 99 return 0
从 JSP 输出创建 PDF

我有一个带有 PDF 导出选项的网页我必须在 PDF 中显示页面的内容目前我使用 iText PDF Library 来生成 PDF 问题是使用 iText 创建 PDF 是一个相当大的挑战此外我们经常对网页的布局 UI 进行更改
Android静态方法可以很好地实时绘制后台线程数据，但这是一个好的解决方案吗？

我一直在问一系列关于我的 Android 项目的不断变化的问题该项目不断实时绘制蓝牙数据而且我在提问方面也做得不太好所以我需要做的是编辑这个问题清理它添加重要的细节最重要的是我需要添加相关代码部分的代码片段特别是我已经修改过很
广告拦截器会拦截 Ajax 调用响应 html

我正在页面上呈现一些统计信息因为这需要一些时间我在页面加载后将此请求作为 ajax 调用
限制插件汇编代码访问

我想创建一个插件架构在其中我可以将程序集 API 限制为非常受限制的内容即仅允许函数白名单是否可以限制插件程序集可以调用哪些函数方法我可以使用 AppDomains 来做到这一点吗有人有一个简单的例子吗 NET 添加了可能符合要
最小的 Android 小部件，从未收到 APPWIDGET_DELETED 和 APPWIDGET_DISABLED 意图

我遇到的问题与之前提出的问题非常相似但不完全相同参考 1 2 3 4 我编写了一个最小的 Android 小部件并且APPWIDGET DELETED and APPWIDGET DISABLED从未被收到在上面的参考文献1和2中
有了 ASP.NET 会员资格，我如何显示 403？

默认情况下当用户无权访问受保护页面时 ASP NET 的成员资格提供程序将重定向到 loginUrl 有没有办法在不重定向用户的情况下显示自定义 403 错误页面我想避免将用户发送到登录页面并在地址栏中显示 ReturnUrl 查询字符
根据url参数设置Cookie

每当用户点击我们的附属链接之一并登陆我们的 URL 中包含 src uni 的网站时我都需要设置一个 cookie URL 将如下所示创建cookie的函数 function SetCookie var url window locat
有哪些比 .gitignore 更有效的方法可以将文件保留在存储库之外？

我的开发团队中的人员不断推送特定于构建的文件文件夹节点模块和其他到我们的存储库中尽管这些文件位于 gitignore文件大概是git add all f或与之相关的东西这是一种巨大的痛苦而且事实证明让人们停止这样做很困难有什么
IdentityServer4反向通道注销问题

在 ASP NET Core 2 上使用 IdentityServer4 使用 ASP NET MVC5 与此用例相关的两个客户端编辑使用cookie进行身份验证隐式流程使用反向通道注销如下所示涉及 4 个应用程序两个客户端
如何在 Zend Framework 2 应用程序中模块的 getConfig() 中使用 global.php/local.php 配置？

在 ZF2 应用程序中我有一些配置即 1 需要根据环境而有所不同 2 特定于具体模块我目前正在使用它here描述全局 php 和本地 php return array modules gt array Cache gt array
Swift：触发 TableViewCell 导致另一个 ViewController 中 UIWebView 中的链接

当我点击一个tableViewCell我想要一个链接特定于该单元格的indexPath row 在带有 webView 的新 viewController 中打开示例我点击了第三个单元格tableViewwww apple com 将
如何在iOS中制作其他语言的键盘

我想创建一个与 iPhone 键盘不同的高棉键盘我怎样才能做到这一点不幸的是您无法控制键盘的语言用户通过设置应用程序选择他们想要使用的键盘并可以使用键盘上的地球图标在它们之间切换打开键盘后它将打开最近使用的键盘
Feign 客户端 - 动态授权标头

我有一项服务可以获取带有授权标头的 http 请求在处理请求时我想使用 Feign Client 来查询另一个服务对其他服务的查询应包含相同的授权标头目前我使用 Filter 从传入请求中提取授权标头并将标头存储在 Thread
RxJS Observables 嵌套订阅？

有什么方法可以简化像下面的代码示例这样的事情我找不到合适的运营商有人可以举一个简短的例子吗 this returnsObservable1 subscribe success gt this returnsObservable2 sub
SonarQube 和 BitBucket 在 Pull 请求上集成

我是 BitBucket 的新手继承了一个项目现在正在尝试加快速度并完成代码我们有一个 DevSecOps 管道使用 BitBucket 作为 SCM SonarQube 作为静态分析引擎以及 Maven 或 Jenkins 具体取
指南是否保证是唯一的？

我使用 Guid 作为数据库中的主键想知道是否有可能生成重复的 Guid 指南是否保证是唯一的虽然不能保证每个生成的 GUID 都是唯一的但唯一键的总数 2 128 或 3 4 10 38 非常大因此相同数字生成两次的概率非常小例
错误：异步模块或处理程序已完成，而异步操作仍处于挂起状态

我有一个控制器操作方法来保存用户详细信息如下所示 public async Task
如何从sklearn管道变压器中提取特征名称？

以供参考 Python 3 8 3 sklearn 1 0 2 我有一个scikit learn pipeline为我格式化一些数据如下所述我定义我的pipeline像这样 Pipeline 1 cat selector make co

如何从sklearn管道变压器中提取特征名称？

如何从sklearn管道变压器中提取特征名称？ 的相关文章

随机推荐

热门标签

如何从sklearn管道变压器中提取特征名称？的相关文章