sci-kit learn：使用 X.reshape(-1, 1) 重塑数据

2023-11-30

我正在训练一个用于文本分类的 python (2.7.11) 分类器，在运行时我收到一条已弃用的警告消息，表明我不知道代码中的哪一行导致了它！错误/警告。但是，代码运行良好并给了我结果......

\AppData\Local\Enthought\Canopy\User\lib\site-packages\sklearn\utils\validation.py:386：DeprecationWarning：在 0.17 中不推荐将 1d 数组作为数据传递，并将在 0.19 中引发 ValueError。如果数据具有单个特征，则使用 X.reshape(-1, 1) 重塑数据；如果数据包含单个样本，则使用 X.reshape(1, -1) 重塑数据。

My code:

def main():
    data = []
    folds = 10
    ex = [ [] for x in range(0,10)]
    results = []
    for i,f in enumerate(sys.argv[1:]):
        data.append(csv.DictReader(open(f,'r'),delimiter='\t'))
    for f in data:       
        for i,datum in enumerate(f):
            ex[i % folds].append(datum)
    #print ex
    for held_out in range(0,folds):
        l = []
        cor = []
        l_test = []
        cor_test = []
        vec = []
        vec_test = []

        for i,fold in enumerate(ex):
            for line in fold:
                if i == held_out:
                    l_test.append(line['label'].rstrip("\n"))
                    cor_test.append(line['text'].rstrip("\n"))
                else:
                    l.append(line['label'].rstrip("\n"))
                    cor.append(line['text'].rstrip("\n"))

        vectorizer = CountVectorizer(ngram_range=(1,1),min_df=1)
        X = vectorizer.fit_transform(cor)
        for c in cor:        
            tmp = vectorizer.transform([c]).toarray()
            vec.append(tmp[0])
        for c in cor_test:        
            tmp = vectorizer.transform([c]).toarray()
            vec_test.append(tmp[0])

        clf = MultinomialNB()
        clf .fit(vec,l)
        result = accuracy(l_test,vec_test,clf)
        print result

if __name__ == "__main__":
    main()

知道哪一行发出此警告吗？另一个问题是，使用不同的数据集运行此代码可以提供相同的精确度，但我无法弄清楚是什么原因导致的？如果我想在另一个 python 进程中使用这个模型，我查看了文档，找到了一个使用 pickle 库的示例，但不适用于 joblib。因此，我尝试遵循相同的代码，但这给了我错误：

clf = joblib.load('model.pkl') 
pred = clf.predict(vec);

另外，如果我的数据是具有以下格式的 CSV 文件：“label \t text \n” 测试数据中的标签列应该包含什么？

提前致谢

您的“vec”输入到您的clf.fit(vec,l).fit需要是类型[[]]，不只是[]。这是我在拟合模型时总是忘记的一个怪癖。

只需添加一组额外的方括号就可以了！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scikitlearn

sci-kit learn：使用 X.reshape(-1, 1) 重塑数据的相关文章

Python - 将宽字符字符串从二进制文件转换为 Python unicode 字符串

这是漫长的一天我有点困惑我正在读取一个包含大量宽字符字符串的二进制文件我想将它们转储为 Python unicode 字符串为了解压非字符串数据我使用 struct 模块但我不知道如何对字符串执行相同的操作例如阅读系列一
python future 和元组解包

实现像使用 future 进行元组解包这样的事情的优雅惯用的方法是什么我有这样的代码 a b c f x y g a b z h y c 我想将其转换为使用期货理想情况下我想写一些类似的东西 a b c ex submit f x y
pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
Seaborn Pairplot 图例不显示颜色

我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常但由于某种原因图例不会显示相关的颜色我无法找到解决方案因此如果有人有任何建议请告诉我 x sns pairplot stats2 hue
将 2D NumPy 数组按元素相乘并求和

我想知道是否有一种更快的方法专用 NumPy 函数来执行 2D NumPy 数组的元素乘法然后对所有元素求和我目前使用np sum np multiply A B 其中 A B 是相同维度的 NumPy 数组m x n 您可以使用np
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
mac osx 10.8 上的初学者 python

我正在学习编程并且一直在使用 Ruby 和 ROR 但我觉得我更喜欢 Python 语言来学习编程虽然我看到了 Ruby 和 Rails 的优点但我觉得我需要一种更容易学习编程概念的语言因此是 Python 但是我似乎找不到适用于
使用yield 进行字典理解

作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
迭代 pandas 数据框的最快方法？

如何运行数据框并仅返回满足特定条件的行必须在之前的行和列上测试此条件例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

NSParagraphStyle iOS - 如何检测块和列表？

我有一个 NSParagraphStyle 对象当使用 NSLog 检查时它包含列表和块但是似乎完全没有办法访问它们我使用 OS X 创建文档并将其传输到 iOS 的文本视图中其中列表和表格可以成功重新创建并显示在 NSLog 中
JavaScript 正则表达式原型

为什么 Chrome 的控制台显示对于 RegExp 的原型 console log RegExp prototype console log a proto 这是特定于实现的吗 IE 正在显示这只是出于好奇而提出的问题当我遇到这个问
如何让 IBM DB2 提供程序与 Entity Framework 4.0 一起使用

有人可以告诉我如何让 DB2 提供程序显示在更改数据源对话框窗口中吗 Steps 右键单击 edmx 设计图面选择从数据库更新模型在更新向导中单击新连接在数据源文本框旁边单击更改在更改数据源窗口中我仅在列表中
没有主键可供引用的外键

我有以下两张表 CREATE TABLE parent c1 INTEGER CREATE TABLE child c1 INTEGER c2 INTEGER c3 INTEGER CONSTRAINT fk c3 FOREIGN KEY
读取VC++ CArchive二进制格式（或Java读取（CObArray））

是否有关于用于序列化各种 MFC 数据结构的二进制格式的明确文档我已经能够在十六进制编辑器中查看我自己的一些类并使用 Java 的 ByteBuffer 类来读取它们通过自动字节顺序转换等然而我目前在尝试引入 CObArray 数
OpenGL 离屏渲染

我有一个应用程序可以创建 3D 模型并从中导出图像我用这个例子来做到这一点 include
在 Glance Widget 中复制 Canvas 的最佳方式？

在 Compose 中我们有方法Canvas 画线等 Glance中有类似的功能吗如果没有复制 Canvas 功能的最佳方法是什么 None
为什么 sphinx 在同一行上格式化我的文档字符串参数

我对 sphinx 比较陌生想为我的项目生成文档我的函数之一的示例可以在 Predict py 中找到 def arima rolling forecast training set testing set order solver l
加载程序集和版本控制

我正在考虑通过提供一些预定义的接口来向现有应用程序添加一些可扩展性这些接口可以通过放置在特定位置并由应用程序拾取的插件来实现应用程序的核心很少更新而插件更新和部署则更加频繁基本上有这样的设置 in core assembly
带有线性渐变的CSS过渡[重复]

这个问题在这里已经有答案了我正在尝试向一个按钮添加一个过渡该按钮的背景是用 css 线性渐变制作的但它不起作用这是我的按钮的 CSS a button background webkit gradient linear left t
doctrine2 和 group_concat

我一直在浏览文档谷歌但没有找到任何解决方案有没有办法在没有本机mysql的情况下使用doctrine2 DQL 执行或模仿GROUP CONCAT eg SELECT u id u name GROUP CONCAT AS user
错误：您的 PHP 安装似乎缺少 WordPress 所需的 MySQL 扩展

我是 WordPress 新手上传网站后我遇到了这个错误该网站运行良好一段时间然后就发生了这种情况输入 URL 后此文本将显示您的 PHP 安装似乎缺少 WordPress 所需的 MySQL 扩展转到 php ini 但找不
使用自定义成员资格和角色提供程序在 MVC 中实现 IPrincipal 和 IIdentity

我一直坚持自定义 iprincpal 和 iidentity 对象的实现我现在花了一天的时间来搜索如何实施这些权利并用更多信息来扩展它我想扩展信息 Context User Identity Name使用全名或其他名称等自定义变量 ED
使用“if”语句检查后出现空指针异常

我遇到了一个非常烦人的错误说我遇到了空指针异常但有一个 if 语句来检查文本是否为空然后再继续 public String getFileData throws IOException String file name C Users
使用 Passport js failureRedirect 方法发回数据

我有一个 Passport js 本地注册策略它使用 successRedirect 和 failureRedirect 方法问题是如果注册过程出现错误 Passport 只会重定向回注册表单表单中没有任何数据 app post s
您可以通过其中的符号对齐文本吗？

我想显示这样的电子邮件地址列表 email protected email protected email protected email protected email protected hinxterpexterp email pro
VBA在循环期间在数组中存储多列然后返回值

我有一个宏它将用户定义的函数代码中的 R ajseasonX13 应用于工作表 NSA 中的多个列然后返回工作表 SA 中的值问题是我的代码一次仅将该函数应用于一个列一旦 VBA 不断在选项卡 NSA 和 SA 之间来回移动结果
如何在 Spring config.xml 中配置 Cron 时区？

我有一个带有 Cron 任务的 Spring 配置 xml 文件该任务在我的机器上定期执行如何在 xml 文件中配置此任务以使用莫斯科时区与我的时区不同
更改浏览器缩放级别

我需要在我的网站上创建 2 个按钮来更改浏览器缩放级别由于图像大小和布局问题我请求浏览器缩放而不是 css 缩放嗯这可能吗我听到了相互矛盾的报道尽管在 Firefox 中不起作用但在 IE 和 chrome 中可以使用 img
sci-kit learn：使用 X.reshape(-1, 1) 重塑数据

我正在训练一个用于文本分类的 python 2 7 11 分类器在运行时我收到一条已弃用的警告消息表明我不知道代码中的哪一行导致了它错误警告但是代码运行良好并给了我结果 AppData Local Enthought Canop

sci-kit learn：使用 X.reshape(-1, 1) 重塑数据

sci-kit learn：使用 X.reshape(-1, 1) 重塑数据 的相关文章

随机推荐

热门标签

sci-kit learn：使用 X.reshape(-1, 1) 重塑数据的相关文章