AttributeError：“CountVectorizer”对象没有属性“get_feature_names”

2023-12-11

该代码之前可以运行，没有显示任何错误。这是一个情感分析机器学习项目。该代码基于字数统计的逻辑回归模型：

c = CountVectorizer(stop_words = 'english')

def text_fit(X, y, model,clf_model,coef_show=1):
    
    X_c = model.fit_transform(X)
    print('# features: {}'.format(X_c.shape[1]))
    X_train, X_test, y_train, y_test = train_test_split(X_c, y, random_state=0)
    print('# train records: {}'.format(X_train.shape[0]))
    print('# test records: {}'.format(X_test.shape[0]))
    clf = clf_model.fit(X_train, y_train)
    acc = clf.score(X_test, y_test)
    print ('Model Accuracy: {}'.format(acc))
    
    if coef_show == 1: 
        w = model.get_feature_names()
        coef = clf.coef_.tolist()[0]
        coeff_df = pd.DataFrame({'Word' : w, 'Coefficient' : coef})
        coeff_df = coeff_df.sort_values(['Coefficient', 'Word'], ascending=[0, 1])
        print('')
        print('-Top 20 positive-')
        print(coeff_df.head(20).to_string(index=False))
        print('')
        print('-Top 20 negative-')        
        print(coeff_df.tail(20).to_string(index=False))
    
text_fit(X, y, c, LogisticRegression())

我删除了该项目并创建了一个新项目，并且代码可以正常工作。但几天后，它再次开始显示相同的错误。

根据文档，该方法称为get_feature_names_out。尝试将问题行更改为：

w = model.get_feature_names_out()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

machinelearning

scikitlearn

AttributeError：“CountVectorizer”对象没有属性“get_feature_names” 的相关文章

如何使用 cython 编译扩展？

我正在尝试从示例页面编译一个简单的 cython 扩展here http docs cython org src userguide tutorial html在我安装了 Python 2 6 64 位版本的 Windows 7 64 位计
在 Pandas 中按日期获取有效合约

我在检测 pandas DataFrame 中的活动合约方面遇到了一些困难假设每一行都是一个协商对于每一行我有两列 initial date 和 end date 我想知道的是按日期划分的活跃合约数量到目前为止我做了一个非常低效的方
为什么 .setGeometry() 不改变 QWidget 实例的大小？

我想使用 QWidget 更改 QPushButton 的大小 setGeometry https doc qt io qtforpython 5 PySide2 QtWidgets QWidget html PySide2 QtWidge
在Python3.6中调用C#代码

由于完全不了解 C 编码我希望在我的 python 代码中调用 C 函数我知道有很多关于同一问题的问答但由于一些奇怪的原因我无法从示例 python 模块导入简单的 c 类库以下是我所做的事情 C 类库设置我使用的是 VS 20
如何在Python中循环并存储自变量中的值

我对 python 很陌生所以这听起来可能很愚蠢我进行了搜索但没有找到解决方案我在 python 中有一个名为 ExcRng 的函数我可以对该函数执行什么样的 for 循环以便将值存储在独立变量中我不想将它们存储在列表中而是
一次将Python dict的内容分配给多个变量？

我想做这样的事情 def f return a 1 b 2 c 3 a b f or a b f IE 这样 a 被分配为 1 b 被分配为 2 并且 c 是未定义的这与此类似 def f return 1 2 a b f 依赖于变量名称
python 中分割字符串以获得一个值？

需要帮助假设我在名为 input 的变量中有一个字符串 Sam Person name kind input split 通过执行上述操作我得到两个具有不同字符串 Sam 和 Person 的变量有没有办法只获取第一个值 name S
Paramiko - 使用私钥连接 - 不是有效的 OPENSSH 私钥/公钥文件

我正在尝试找到解决方案但无法理解我做错了什么在我的 Linux 服务器上我运行了以下命令 ssh keygen t rsa 这产生了一个id rsa and id rsa pub file 然后我将它们复制到本地并尝试运行以下代码 s
带图像的简单 GUI [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我试图在简单的 GUI 上显示一些卡
如何从 Dockerfile 安装 Python 3.7 和 Pip

我正在尝试构建基于 Ubuntu 18 04 的自定义 Docker 映像 Ubuntu 预装了 Python 3 6 但我想 1 安装 Python 3 7 2 将其设置为默认 Python 版本这样就可以使用python代替pytho
定义函数后对其进行修饰？

I think答案是否定的但我似乎找不到明确的说法我有以下情况 def decorated function function functools wraps function def my function print Hello s
无法打开 Python。错误 0xc000007b

我最近一直在学习 Python 3 我在我的上网本 32 位 Windows 7 上创建简单的小程序没有任何问题当我将它安装在我的上网本上时我没有遇到任何问题但现在我已经开始使用它了我想将它安装在我的台式机上并且我有一个我的桌面
如何使用Python的super()来更新父值？

我对继承很陌生之前所有关于继承和 Python 的 super 函数的讨论都有点超出我的理解我当前使用以下代码来更新父对象的值 usr bin env python test py class Master object mydata
如何在Python和Selenium中通过标签名称或id获取元素[重复]

这个问题在这里已经有答案了我正在尝试使用 Python 和 Selenium 获取输入但它向我显示错误我该如何解决这个错误 inputElement send keys getStock getStocklFunc 0 Error i
如何列出 python PDB 中的当前行？

在 perl 调试器中如果重复列出离开当前行的代码段可以通过输入命令返回到当前行点我无法使用 python PDB 模块找到任何类似的东西如果我list如果我自己离开当前行并想再次查看它似乎我必须记住当前正在执行的行号对我来说
Tensorflow 2.0 中的二阶导数

我正在尝试计算标量变量的简单向量函数的二阶导数f x x x 2 x 3 使用 TF 2 3 与tf GradientTape def f ab x return x x 2 x 3 import tensorflow as tf in1
Airflow Python 单元测试？

我想为我们的 DAG 添加一些单元测试但找不到任何单元测试有 DAG 单元测试框架吗有一个端到端的测试框架存在但我猜它已经死了 https issues apache org jira browse AIRFLOW 79 https
如何在与应用程序初始化文件不同的文件中迭代 api 路由

我有一个 apiroutes py 文件其中定义了许多路由例如 api route api read methods GET api route api write methods POST 其中 api 是导入 from import
Python 3.2 中 **kwargs 和 dict 有什么区别？

看起来Python的很多方面都只是功能的重复除了我在 Python 中的 kwargs 和 dict 中看到的冗余之外还有什么区别吗参数解包存在差异许多人使用kwargs 并通过dict作为论据之一使用参数解包 Prepare f
如何在sphinx中启用数学？

我在用sphinx http sphinx pocoo org index html与pngmath http sphinx pocoo org ext math html module sphinx ext pngmath扩展来记录我的代

随机推荐

Video.play 返回 DirectShowPlayerService::doSetUrlSource：未解决的错误代码 800c000d

使用 Qt 版本 5 4 2 返回的错误代码 DirectShowPlayerService doSetUrlSource 未解决的错误代码 800c000d 已使用视频 QML 类型编写了 QML 文件如下所示我在项目文件 pro 中
使用带有泛型的语句：using ISet<> = System.Collections.Generic.ISet<>

由于我使用两个不同的通用集合命名空间 System Collections Generic and Iesi Collections Generic 我有冲突在项目的其他部分我同时使用 nunit 和 mstest 框架但当我调用时限
为什么这个汇编程序会输出相同的字符串两次？

此凯撒密码程序生成解密字符串长度始终为 10 并输出为 output txt 文件例如下面的代码创建 txt 文件 ILIKEASSEM HOWAREYOUU 但是当我运行这段代码时该文件是 ILIKEASSEM ILIKEASSEM
除以零后的余数

我知道数学中不允许除以零但是我可以使用零模吗我应该得到什么答案例如 10 0 5 0 标准将其定义为未定义在几乎所有处理器中求模都是通过与除法相同的功能来执行的在现代较大的处理器中它是一条指令例如 x86 大多数情况下该
CSS 选择器中的空格

在选择器中空格可以指示后代不过我发现空格也可以忽略根据我的测试这就是我的think它的意思是周围可以使用空格和上下文字符例如 and gt 空格可能not用于伪类和元素字符 and 以及属性选择器空格可能not与类和 id
链接服务器 SQLNCLI 问题。 “没有活跃的交易”

我尝试执行存储过程并将其结果简单地插入到临时表中并且收到以下消息无法执行该操作因为 OLE DB 提供程序 SQLNCLI 对于链接服务器 MyServerName 无法开始分布式交易用于链接服务器的 OLE DB 提供程序 SQ
使用 CSS 无限移动多个背景

我有两个背景 body background image url img nemo png url img ocean png 我该如何制作nemo png background左右无限移动但不影响ocean png background
如何使用外部 CSS 覆盖内联样式？

我有使用内联样式的标记但我无权更改此标记如何仅使用 CSS 覆盖文档中的内联样式我不想使用 jQuery 或 JavaScript HTML div style font size 18px color red Hello World
报告长期运行的 Celery 任务的结果

Problem 我已将长时间运行的任务分割为逻辑子任务因此我可以在每个子任务完成时报告其结果然而我试图报告一项实际上永远不会完成的任务的结果而不是在进行过程中产生值并且正在努力使用我现有的解决方案来做到这一点背景我正在为我编写
如何在满足给定条件时终止Python中的多进程？ [复制]

这个问题在这里已经有答案了假设我有这个功能 def f while True x generate something if x condition return x if name main p Pool 4 我想在多进程中运行此函数
使用clone()和printf的段错误

我正在尝试如何clone 在 Linux 3 10 0 327 3 1 el7 x86 64 中为线程实现我正在运行这段代码偶尔会出现段错误我知道如果我使用CLONE THREAD那么就没有办法检查线程是否完成但是为什么printf
如何让列表视图只显示3个项目

我有一个列表视图其中正在加载 10 个项目我希望滚动时只显示 3 个项目我不想通过调整列表高度来做到这一点即使滚动很小意味着没有项目应该部分显示我也只想显示 3 个项目如何实现这一目标提前致谢我将发布一个代码我用它来填充
Android ListActivity行点击

我有一个显示有关玩家的信息的活动这部分工作正常我使用了适配器但是我应该将检测行何时被单击的代码放在哪里 PlayersActivity java package com democratandchronicle billstraini
保存自定义首选项的值

我创建了一个新的首选项它直接延伸自CheckboxPreference 在这个类中我添加了一个简单的新boolean价值我现在的问题是如何存储这个新值如果用户点击正常CheckboxPreference该值自动存储在首选项中我希望这
图例与饼图重叠

在 python 中使用 matplotlib 图例与我的饼图重叠尝试了 loc 的各种选项例如最佳 1 2 3 但无济于事关于如何准确提及图例位置例如从饼图边界给出填充或至少确保它不重叠有什么建议吗简短的回答是您可以使用p
firebase 从 firestore js sdk 缓存检索文档是否收费

我正在使用 firebase JS SDK 离线持久化已启用这会自动将我检索到的文档缓存在 JS SDK 中我执行这个查询 once firebase firestore doc path to doc get twice fireba
在快速路由文件中使用 socket.io

我正在尝试将 Socket io 与 Node js 结合使用并发送到路由逻辑内的套接字我有一个相当标准的 Express 3 设置其中有一个位于路由中的 server js 文件然后我有一个位于路由文件夹中的 index js 该
为什么打印功能没有在正确的时间运行？ [复制]

这个问题在这里已经有答案了这是我的代码 import time as t print hello end t sleep 1 print hello end t sleep 1 print hello end t sleep 1 我的问题
Imagemagick 去饱和黑/白？

想把它变成黑白的不知道该使用 imagick 的什么 handle data file get contents http www bungie net Stats Reach Nightmap ashx http www bungie
AttributeError：“CountVectorizer”对象没有属性“get_feature_names”

该代码之前可以运行没有显示任何错误这是一个情感分析机器学习项目该代码基于字数统计的逻辑回归模型 c CountVectorizer stop words english def text fit X y model clf model

AttributeError：“CountVectorizer”对象没有属性“get_feature_names”

AttributeError：“CountVectorizer”对象没有属性“get_feature_names” 的相关文章

随机推荐

热门标签