类型错误：get_params() 缺少 1 个必需的位置参数：'self'

2024-03-17

我试图使用scikit-learn与 python-3.4 一起打包以进行网格搜索，

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.linear_model.logistic import LogisticRegression
from sklearn.pipeline import Pipeline
from sklearn.grid_search import GridSearchCV
import pandas as pd
from sklearn.cross_validation import train_test_split
from sklearn.metrics import precision_score, recall_score, accuracy_score
from sklearn.preprocessing import LabelBinarizer
import numpy as np

pipeline = Pipeline([
    ('vect', TfidfVectorizer(stop_words='english')),
    ('clf', LogisticRegression)
])

parameters = {
    'vect__max_df': (0.25, 0.5, 0.75),
    'vect__stop_words': ('english', None),
    'vect__max_features': (2500, 5000, 10000, None),
    'vect__ngram_range': ((1, 1), (1, 2)),
    'vect__use_idf': (True, False),
    'vect__norm': ('l1', 'l2'),
    'clf__penalty': ('l1', 'l2'),
    'clf__C': (0.01, 0.1, 1, 10)
}

if __name__ == '__main__':
    grid_search = GridSearchCV(pipeline, parameters, n_jobs=-1, verbose=1, scoring='accuracy', cv = 3)
    df = pd.read_csv('SMS Spam Collection/SMSSpamCollection', delimiter='\t', header=None)
    lb = LabelBinarizer()
    X, y = df[1], np.array([number[0] for number in lb.fit_transform(df[0])])
    X_train, X_test, y_train, y_test = train_test_split(X, y)
    grid_search.fit(X_train, y_train)
    print('Best score: ', grid_search.best_score_)
    print('Best parameter set:')
    best_parameters = grid_search.best_estimator_.get_params()
    for param_name in sorted(best_parameters):
        print(param_name, best_parameters[param_name])

然而，它并没有运行成功，错误信息如下：

Fitting 3 folds for each of 1536 candidates, totalling 4608 fits
Traceback (most recent call last):
  File "/home/xiangru/PycharmProjects/machine_learning_note_with_sklearn/grid search.py", line 36, in <module>
    grid_search.fit(X_train, y_train)
  File "/usr/local/lib/python3.4/dist-packages/sklearn/grid_search.py", line 732, in fit
    return self._fit(X, y, ParameterGrid(self.param_grid))
  File "/usr/local/lib/python3.4/dist-packages/sklearn/grid_search.py", line 493, in _fit
    base_estimator = clone(self.estimator)
  File "/usr/local/lib/python3.4/dist-packages/sklearn/base.py", line 47, in clone
    new_object_params[name] = clone(param, safe=False)
  File "/usr/local/lib/python3.4/dist-packages/sklearn/base.py", line 35, in clone
    return estimator_type([clone(e, safe=safe) for e in estimator])
  File "/usr/local/lib/python3.4/dist-packages/sklearn/base.py", line 35, in <listcomp>
    return estimator_type([clone(e, safe=safe) for e in estimator])
  File "/usr/local/lib/python3.4/dist-packages/sklearn/base.py", line 35, in clone
    return estimator_type([clone(e, safe=safe) for e in estimator])
  File "/usr/local/lib/python3.4/dist-packages/sklearn/base.py", line 35, in <listcomp>
    return estimator_type([clone(e, safe=safe) for e in estimator])
  File "/usr/local/lib/python3.4/dist-packages/sklearn/base.py", line 45, in clone
    new_object_params = estimator.get_params(deep=False)
TypeError: get_params() missing 1 required positional argument: 'self'

我也尝试过只使用

if __name__ == '__main__':
    pipeline.get_params()

它给出了相同的错误消息。谁知道如何解决这个问题？

This error is almost always misleading, and actually means that you're calling an instance method on the class, rather than the instance (like calling dict.keys() instead of d.keys() on a dict named d).^*

这正是这里发生的事情。The docs http://scikit-learn.org/stable/modules/generated/sklearn.grid_search.GridSearchCV.html意味着best_estimator_属性，例如estimator初始化器的参数，不是估计器instance，这是一个估计器type，以及“为每个网格点实例化该类型的对象。”

因此，如果您想调用方法，则必须为某个特定的网格点构造该类型的对象。

然而，快速浏览一下文档，如果您试图获取用于返回最佳分数的最佳估计器的特定实例的参数，那不是就是这样吗？best_params_？（我很抱歉这部分有点猜测......）

For the Pipeline打电话，你肯定有一个实例。而唯一的文档 http://scikit-learn.org/stable/modules/generated/sklearn.pipeline.Pipeline.html该方法是一个参数规范，它表明它需要一个可选参数，deep。但在幕后，它可能正在转发get_params()调用其属性之一。与('clf', LogisticRegression)，看起来你正在用class LogisticRegression，而不是该类的实例，所以如果这就是它最终转发到的，那就可以解释问题了。

_{* The reason the error says "missing 1 required positional argument: 'self'" instead of "must be called on an instance" or something is that in Python, d.keys() is effectively turned into dict.keys(d), and it's perfectly legal (and sometimes useful) to call it that way explicitly, so Python can't really tell you that dict.keys() is illegal, just that it's missing the self argument.}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scikitlearn

类型错误：get_params() 缺少 1 个必需的位置参数：'self' 的相关文章

django_openid_auth TypeError openid.yadis.manager.YadisServiceManager 对象不是 JSON 可序列化

I used django openid auth在我的项目上一段时间以来它运行得很好但今天我测试了该应用程序并遇到了这个异常 Environment Request Method GET Request URL http local
如何在 AWS CDK 创建的 Python Lambda 函数中安装外部模块？

我在 Cloud9 中使用 Python AWS CDK 并且我部署简单的 Lambda 函数那应该是发送 API 请求到 Atlassian 的 API当对象上传到 S3 存储桶时也是由 CDK 创建的这是我的 CDK 堆栈代码 fr
使用 python 进行串行数据记录

Intro 我需要编写一个小程序来实时读取串行数据并将其写入文本文件我在读取数据方面取得了一些进展但尚未成功地将这些信息存储在新文件中这是我的代码 from future import print function import se
python future 和元组解包

实现像使用 future 进行元组解包这样的事情的优雅惯用的方法是什么我有这样的代码 a b c f x y g a b z h y c 我想将其转换为使用期货理想情况下我想写一些类似的东西 a b c ex submit f x y
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
将数据帧行转换为字典

我有像下面的示例数据这样的数据帧我正在尝试将数据帧中的一行转换为类似于下面所需输出的字典但是当我使用 to dict 时我得到了索引和列值有谁知道如何将行转换为像所需输出那样的字典任何提示都非常感激 Sample data pri
if 语句未命中中的 continue 断点

在下面的代码中两者a and b是生成器函数的输出并且可以评估为None或者有一个值 def testBehaviour self a None b 5 while True if not a or not b continue pri
填充两个函数之间的区域

import matplotlib pyplot as plt import numpy as np def domain x np arange 0 10 0 001 f1 lambda x 2 x x 2 0 5 plt plot x
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
奇怪的 MySQL Python mod_wsgi 无法连接到 'localhost' (49) 上的 MySQL 服务器问题

StackOverflow上也有类似的问题但我还没有发现完全相同的情况这是在使用 MySQL 的 OS X Leopard 机器上一些起始信息 MySQL Server version 5 1 30 Apache 2 2 13 Uni
按元组分隔符拆分列表

我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
在 pytube3 中获取 youtube 视频的标题？

我正在尝试构建一个应用程序来使用 python 下载 YouTube 视频pytube3 但我无法检索视频的标题这是我的代码 from pytube import YouTube yt YouTube link print yt titl
在 Pandas 中使用正则表达式的多种模式

我是Python编程的初学者我正在探索正则表达式我正在尝试从描述列中提取一个单词数据库名称我无法给出多个正则表达式模式请参阅下面的描述和代码描述 Summary AD1 Low free DATA space in data
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
使用 NumPy 将非均匀数据从文件读取到数组中

假设我有一个如下所示的文本文件 33 346 1223 10 23 11 23 12 23 13 23 14 23 15 23 16 24 10 24 11 24 12 24 13 24 14 24 15 24 16 25 14 25 15
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如

随机推荐

使用扩展 DefaultBatchConfiguration 的编程方式时未创建 Spring Batch 5 和 Spring Boot 3 元数据表

当使用编程方式扩展时DefaultBatchConfiguration 即使属性spring batch jdbc initialize schema被设定为always 有没有办法在扩展时启用自动模式初始化DefaultBatchConf
重新打开时 CSV 中的前导零[重复]

这个问题在这里已经有答案了我有 txt 文件如下所示我正在使用显示的方法在excel中导入txt文件here http www upenn edu computing da bo webi qna iv csvLeadingZeros
我们可以在基本 Clear Case 项目的配置规范中省略元素 * /main/LATEST 吗？

在我拥有的一个基本的透明案例项目中交给我的配置规范如下所示 element CHECKEDOUT element PROJ 1 5 0 LATEST element main LATEST mkbranch PROJ 1 5 0 elem
如何在Mule中创建独占队列消费者？

在 ActiveMQ 中您可以为队列配置独占消费者例如 Queue Name Here consumer exclusive true 如何在 Mule 中配置像上面这样的独占消费者您需要对队列名称进行 URL 编码因为 Mule
在 Go 中添加迄今为止的天数

我正在尝试向 Go 中的现有日期添加天数实际上是几周我努力了myDate Add time Hour 24 7 weeksToAdd 但是当我尝试构建时出现错误 invalid operation time Hour startAdd
Spring Boot在启动时使用构造函数参数初始化bean

我需要初始化以下内容PointQuadTree使用带有构造函数参数的 Spring Boot 在启动时使用类并使该对象在整个应用程序中可用构造函数参数 minX maxX 需要来自 application properties 文件点
Symfony2 表单：创建新表单或选择现有表单

我有一个实体 A 它将 oneToMany 与实体 B 相关联我希望用户可以选择从现有 B 实体中进行选择或者在 A 类型的表单上创建一个新实体到目前为止我的表单上有以下内容 gt add ExistingB entity arra
缩放 Windows 窗体

基本上我希望在通过拖动调整 WindowsForm 大小时所有内容控件等都能随 WindowsForm 一起缩放以便用户可以自己确定 UI 的大小图片并不完美但我希望它能解释这一点最简单的方法是使用 Flow Table L
从 PixelFormat 获取像素长度

我如何获取像素长度以字节为单位像素格式 http msdn microsoft com en us library system drawing imaging pixelformat aspx枚举我想使用本机方法处理图像像素但是如
类型错误：必须是 pygame.Surface，而不是元组。 Python/Pygame 菜鸟

堆栈溢出的用户您好我已经编写了这段代码它会在您单击 pygame 屏幕时绘制线条但是当我运行该程序时我收到一条错误消息 TypeError must be pygame Surface not tuple 我试图搞乱这个程序但我没
Python：从文件创建列表

因此我尝试创建一个函数来打开一个文本文件逐行读取它然后获取从中提取的数据来创建一个列表 def file open filename str input enter file name for perk py to sort thro
轮询和事件驱动编程是同一种技术的不同说法吗？

我研究了中断与循环轮询并了解了不必等待轮询的中断的优点在我看来轮询就像事件驱动的编程或者至少类似于侦听器而轮询的作用实际上很像侦听输入或输出您同意还是我误解了轮询循环监听和事件驱动编程也用所谓的监听器监听之间的任何关键区
C++ 变体访问重载函数

我想在变体上执行重载函数以下代码块可以工作并编译但是visit调用似乎过于复杂为什么我不能简单地写 std visit f something 工作版本和上下文 include
扩展内联汇编中的约束“Rah”和“Ral”意味着什么？

这个问题的灵感来自于另一个论坛上有人提出的问题在下面的代码中扩展内联汇编约束是什么Rah and Ral意思是我以前没见过这些 include
Android：获取基站和邻近小区的小区 ID 和 RSS

我正在尝试获取以下数据基站 CellID和RSS 识别哪个是基站对于所有邻近站点小区 ID 和 RSS 有各种 API 看起来我必须使用不同的 API telephonyManager 和 PhoneStateListener 我有点
如何使用 Composer 初始化 Symfony 控制台项目，以限制其坚持使用长期发行版本？

我的目标是经营作曲家require命令来初始化 Symfony Console 项目当运行作曲家的require命令我相信可以将所需的包限制为特定版本我正在考虑使用它来坚持 Symfony 的长期发行版本它将支持更长时间根据Sym
ExtJS 4：单击按钮后替换视口项目数组中的两个组件

下面是一些单击按钮后即可运行的代码当我在另一个按钮中再次设置视图变量对于不同的按钮并使用不同的网格和不同的表单运行这个确切的代码时这两个项目完全消失为什么它在第一次迭代时运行但在第二次迭代时不运行更重要的是我怎样才能正确
按元素有效比较 numpy 数组与其自身

我正在执行大量这些计算 A A np newaxis T 其中 A 是一个密集的 numpy 数组通常具有共同的值为了进行基准测试我们可以使用 n 30000 A np random randint 0 1000 n A A np n
Angular 2 服务 + RxJS BehaviourSubject 或 EventEmitter

我是 Angular 2 和 RXJS 的新手我有一个带有 2 个触发器按钮的自定义标头组件它应该在应用程序的不同部分激活 2 个不同的导航指令我创建了一个服务它注册了 2 个不同的导航指令并且标头组件订阅了该指令我想知道链
类型错误：get_params() 缺少 1 个必需的位置参数：'self'

我试图使用scikit learn与 python 3 4 一起打包以进行网格搜索 from sklearn feature extraction text import TfidfVectorizer from sklearn linea

类型错误：get_params() 缺少 1 个必需的位置参数：'self'

类型错误：get_params() 缺少 1 个必需的位置参数：'self' 的相关文章

随机推荐

热门标签