从 Scikit (Python) 中的管道检索中间特征

2024-02-13

我使用的管道与给定的管道非常相似在这个例子中 http://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html#building-a-pipeline :

>>> text_clf = Pipeline([('vect', CountVectorizer()),
...                      ('tfidf', TfidfTransformer()),
...                      ('clf', MultinomialNB()),
... ])

我用过的GridSearchCV找到参数网格上的最佳估计器。

但是，我想获取我的训练集的列名称get_feature_names()方法来自CountVectorizer()。这是否可以在不实施的情况下实现CountVectorizer()管道外？

使用get_params()函数中，您可以访问管道的各个部分及其各自的内部参数。下面是一个访问的例子'vect'

text_clf = Pipeline([('vect', CountVectorizer()),
                     ('tfidf', TfidfTransformer()),
                     ('clf', MultinomialNB())]
print text_clf.get_params()['vect']

产量（对我来说）

CountVectorizer(analyzer=u'word', binary=False, decode_error=u'strict',
    dtype=<type 'numpy.int64'>, encoding=u'utf-8', input=u'content',
    lowercase=True, max_df=1.0, max_features=None, min_df=1,
    ngram_range=(1, 1), preprocessor=None, stop_words=None,
    strip_accents=None, token_pattern=u'(?u)\\b\\w\\w+\\b',
    tokenizer=None, vocabulary=None)

我还没有将管道安装到本示例中的任何数据，因此调用get_feature_names()此时会返回错误。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scikitlearn

pipeline

从 Scikit (Python) 中的管道检索中间特征的相关文章

Python3+Kivy+Plyer 推送通知图标问题

我在使用 Android 的简单通知测试应用程序时遇到了一个奇怪的错误错误 python AttributeError type object notification org notificator R drawable has no
OpenCV 错误：使用 COLOR_BGR2GRAY 函数时断言失败

我在使用 opencv 时遇到了一个奇怪的问题我在 jupyter 笔记本中工作时没有任何问题但在尝试运行此 Sublime 时却出现问题错误是 OpenCV错误 cvtColor中断言失败深度 CV 8U 深度 CV 16U 深度
对打开文件的脚本进行单元测试

我编写了一个脚本它打开一个文件读取内容并进行一些操作和计算并将它们存储在集合和字典中我该如何为这样的事情编写单元测试我的问题具体是我会测试文件是否打开文件很大这是unix字典文件我如何对计算进行单元测试我真的必须手动计算
返回不包括指定键的字典副本

我想创建一个函数返回字典的副本不包括列表中指定的键考虑这本词典 my dict keyA 1 keyB 2 keyC 3 致电without keys my dict keyB keyC 应该返回 keyA 1 我想用一行简洁的字典理
为 PyCharm 中的所有配置设置相同的环境变量

我有一个与 Celery 和很多不同的工作人员一起的项目如何避免每次将 PyCharm 中的环境变量复制粘贴到每个运行调试配置有什么方法可以在项目设置中设置它们吗找到解决方案here https stackoverflow com
使用 Python 中的 IAM 角色访问 AWS API Gateway

我有一个 AWS API 网关我想使用它来保护其安全IAM 角色 http docs aws amazon com apigateway latest developerguide permissions html 我正在寻找一个包来帮助
使用 Python 抓取维基百科数据

我正在尝试从以下内容中检索 3 列 NFL 球队球员姓名大学球队维基百科页面 http en wikipedia org wiki 2008 NFL draft 我是 python 新手一直在尝试使用 beautifulsoup 来
在 Windows 上将 Word2vec 与 Tensorflow 结合使用

In 本教程文件 https github com tensorflow models blob master tutorials embedding word2vec py L45通过 Tensorflow 找到以下行第 45 行来加
如何在 Keras 中使用部分输入进行训练，其余部分用于损失函数

我是 Keras 新手正在尝试实现神经网络机器学习模型输入张量看起来像 X1 X2 和输出 Y 注意 X1 和 X2 是相关的在模型中只有 X1 将用于训练但 X1 和 X2 都将传递给损失函数该损失函数是 X1 X2 y pr
如何获取 Matplotlib 生成的散点图的像素坐标？

我使用 Matplotlib 生成散点图的 PNG 文件现在对于每个散点图除了 PNG 文件之外我还会also就像生成散点图中各个点的像素坐标列表一样我用来生成散点图 PNG 文件的代码基本上是这样的 from matplotli
Matplotlib 将颜色图 tab20 更改为三种颜色

Matplotlib 有一些新的且非常方便的颜色图选项卡颜色图 https matplotlib org examples color colormaps reference html 我错过的是生成像 tab20b 或 tab20c 这
从 Apache 运行 python 脚本的最简单方法

我花了很长时间试图弄清楚这一点我基本上正在尝试开发一个网站当用户单击特定按钮时我必须在其中执行 python 脚本在研究了 Stack Overflow 和 Google 之后我需要配置 Apache 以便能够运行 CGI 脚本
PermanentTaskFailure：“模块”对象没有属性“迁移”

我在 google appengine 上使用 Nick Johnson 的批量更新库 http blog notdot net 2010 03 Announcing a robust datastore bulk update utili
django如何将字符串转换为模块？

我试图了解 django 的另一个神奇之处它可以将字符串转换为模块 In settings py INSTALLED APPS声明如下 INSTALLED APPS django contrib auth django contrib c
Pandas DataFrame：如何计算组中第一行和最后一行的差异？

这是我的熊猫数据框 import pandas as pd import numpy as np data column1 338 519 871 1731 2693 2963 3379 3789 3910 4109 4307 4800 4
Python列表对象属性“append”是只读的

正如标题所说在Python中我试图做到这一点以便当有人输入一个选择在本例中为Choice13 时它会从密码列表中删除旧密码并添加新密码 passwords mrjoebblock mrjoefblock mrjoegblock m
获取运行云功能的运行时服务帐户

有没有办法以编程方式从云功能获取运行时服务帐户的电子邮件我知道我可以猜测默认的 App Engine 帐户因为它始终是 appspot gserviceaccount com 但这不是我想要的我本来期待有一些环境变量 https
Django - 缺少 1 个必需的位置参数：'request'

我收到错误 get indiceComercioVarejista 缺少 1 个必需的位置参数要求当尝试访问 get indiceComercioVarejista 方法时我不知道这是怎么回事 views from django ht
bool() 和operator.truth() 有什么区别？

bool https docs python org 3 library functions html bool and operator truth https docs python org 3 library operator htm
Python - 打印漂亮的 XML 为空标签文本创建开始和结束标签

我正在编写一个 python 应用程序它创建一个 ElementTree XML 然后使用 minidom 的 toprettyxml 将其写入文件 final tree minidom parseString ET tostring r

随机推荐

我应该如何使我的 VBA 代码与 64 位 Windows 兼容？

我有一个在 Excel 2007 中开发的 VBA 应用程序它包含以下代码以允许访问ShellExecute函数来自Shell32 dll Private Declare Function ShellExecute Lib shell32
AngularJs：通过服务传递 $scope 变量

我有两个控制器在其中一个控制器中我声明了一个 scope 变量我希望该变量在第二个控制器中可见第一控制器 app controller Ctrl1 function scope scope variable1 One 第二控制员 ap
函数参数包推导模板参数是否存在缺陷

template
无法在 Spring Batch 中序列化此事务的访问

我正在使用 Spring Batch 和 Spring Boot 来处理我的 Csv 文件当我运行该应用程序时我收到以下错误跟踪 2018 08 27 16 23 35 694 INFO 12016 nio 9004 exec 1 o
Android：除非添加意图过滤器，否则电子邮件意图 ACTION_SENDTO 不起作用

我想打开 Gmail 其中包含预先格式化的电子邮件我正在使用这段代码 public static void sendEmail Context context String receiverAddress String title Str
这些 git diff 命令之间有什么区别？

以下 git 命令之间有什么区别 git diff HEAD git diff HEAD git diff cached或同义词git diff staged git diff git diff HEAD 显示自上次提交以来发生的更改 gi
如何在expect脚本中查找文件是否存在

我的期望脚本中有这样的声明 send sed i e s oldport newport backup txt r expect 但是我希望首先检查文件 backup txt 是否存在如果存在然后编辑它我该如何实现这一目标 Thank
Symfony 2.1 Doctrine 过滤器（启用/禁用）

我目前正在实施 Doctrinefilters http docs doctrine project org en latest reference filters html在我的 Symfony2 1 项目中具有以下设置
小部件未在 NBViewer 中显示

我有一个带有交互式滑块小部件的 iPython Notebook 为了分享笔记本我想使用 NBViewer 提供的链接这将使我能够与不使用 Python 的人共享笔记本不幸的是当查看 NBViewer 链接时该小部件不会显示我需
对于一个 EDMX 文件，使用与多个数据库相关的多个连接字符串

我有一个程序它有一个 edmx 文件并且在 app config 中有三个连接字符串 edmx 表示的架构对于 3 个数据库是相同的生产 Staging 发展我想制作一个基本上可以完成此操作的方法警告伪代码传入 foreach
CSS 图像淡入淡出动画仅在第一次运行

我正在使用 CSS 制作背景图像淡入淡出动画第一次运行循环时它按预期工作但第二次它在整个持续时间内卡在最后一个图像上短暂跳转到第三个图像然后返回到最后一个我如何更新它以便它在每个无限循环期间顺利地运行动画 rotate widt
捕获 Objective C 类

我试图捕获覆盖在我无法访问的对象中调用的某些方法我希望能够对系统对象中实例化的对象进行子类化例如当我实例化 UIWebView 时它在内部实例化 UIScrollView 我希望能够子类化 UIScrollView 这样我就可以通
JavaScript 保存这个。 image.onLoad 内部的变量[重复]

这个问题在这里已经有答案了 function InfoImage path title this path path this title title this color undefined this maxPixels undefine
`$.ajax` 中的请求时间有时超过 1 秒，有时超过 30 毫秒

我在 Windows 7 上使用 xampp 版本 1 7 7 我试图这样做当您单击保存图像时它会将信息发送到后台的 save record php 我这样做与 ajax url save record php data value
R 正则表达式 - 括号之间的分割

假设我有一个字符串x我想像这样分割它 x lt A C T AG C T A C G T A C G T A C G T A C G T A C G T GCC C T A C G T A C G T A C G Desired outpu
如何模拟 HttpClientCertificate？

我正在尝试对我编写的操作过滤器进行单元测试我想模拟 HttpClient 证书但是当我使用 MOQ 时我得到了异常 HttpClient 证书没有公共默认构造函数 code Stub HttpClientCertificate var
有没有办法以编程方式在 Windows 中配对蓝牙设备

有一个问题有没有办法以编程方式在 Windows 中配对蓝牙设备 c c 感谢您的回复 Yes 参考文档可在 MSDN 上找到 http msdn microsoft com en us library windows desktop a
在一个非常非常大的网站上使用 Subversion

我是一个超级颠覆迷我即将接管一个大网站大约 200MB 我已经将主网站从 500MB 的原始大小削减了我即将将此站点签入新的颠覆存储库问题是我的 Subversion 存储库是远程托管的以便另一位同事也可以在该站点上工作我担心
从 plpgsql 函数返回行集。

我想从 plpgsql 函数返回表这是我的代码 CREATE FUNCTION test RETURNS my table AS BODY DECLARE q4 my table BEGIN q4 SELECT FROM my table
从 Scikit (Python) 中的管道检索中间特征

我使用的管道与给定的管道非常相似在这个例子中 http scikit learn org stable tutorial text analytics working with text data html building a pipel

从 Scikit (Python) 中的管道检索中间特征

从 Scikit (Python) 中的管道检索中间特征 的相关文章

随机推荐

热门标签

从 Scikit (Python) 中的管道检索中间特征的相关文章