sklearn 维度问题“发现数组具有暗淡 3。预计估计器 <= 2”

2024-02-12

我正在尝试使用 KNN 将 .wav 文件正确分类为两组：组 0 和组 1。

我提取了数据，创建了模型，拟合了模型，但是当我尝试使用 .predict() 方法时，出现以下错误：

Traceback (most recent call last):   
File "/..../....../KNN.py", line 20, in <module>
    classifier.fit(X_train, y_train)   
File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/sklearn/neighbors/base.py", line 761, in fit
    X, y = check_X_y(X, y, "csr", multi_output=True)   
File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/sklearn/utils/validation.py", line 521, in check_X_y
    ensure_min_features, warn_on_dtype, estimator)   
File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/sklearn/utils/validation.py", line 405, in check_array
    % (array.ndim, estimator_name)) 
ValueError: Found array with dim 3. Estimator expected <= 2.

我发现这两个 stackoverflow 帖子描述了类似的问题：

sklearn Logistic 回归“ValueError：找到的数组暗淡为 3。预计估计器 https://stackoverflow.com/questions/34972142/sklearn-logistic-regression-valueerror-found-array-with-dim-3-estimator-expec

错误：找到暗淡 3 的数组。估计器预期 https://stackoverflow.com/questions/34866548/error-found-array-with-dim-3-estimator-expected-2

并且，如果我错了，请纠正我，但 scikit-learn 似乎只能接受二维数据。

我的训练数据的形状为 (3240, 20, 5255) 其中包括：

该数据集中有 3240 个 .wav 文件（这是训练数据的索引 0）为了
For each.wav 文件中有一个 (20, 5255) numpy 数组，它表示 MFCC 系数（MFCC 系数尝试以数字方式表示声音）。

我的测试数据的形状为 (3240,) #category 为 0 或 1

我可以使用什么代码来操作我的训练和测试数据，将其转换为 scikit-learn 可以使用的形式？另外，如何保证从3维降到2维时数据不丢失？

确实，sklearn 仅适用于 2D 数据。

您可以尝试做什么：

只需使用np.reshape在训练数据上将其转换为形状(3240, 20*5255)。它将保留所有原始信息。但 sklearn 将无法利用该数据中的隐式结构（例如，特征 1、21、41 等是同一变量的不同版本）。
在原始数据上构建卷积神经网络（例如，使用tensorflow+Keras堆）。 CNN 是专门为处理此类多维数据并利用其结构而设计的。但它们有很多超参数需要调整。
对数据进行降维（例如 PCA），将其重塑为(3240, 20*5255)。它会尝试保留尽可能多的信息，同时仍然保持较低的特征数量。
使用手动特征工程从数据结构中提取特定信息（例如沿每个维度的描述性统计），并根据这些特征训练模型。

如果您有更多数据（例如 100K 个示例），第一种方法可能效果最好。在您的情况下（3K 示例和 10K 特征），您需要大量正则化模型以避免过度拟合。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

machinelearning

scikitlearn

signalprocessing

sklearn 维度问题“发现数组具有暗淡 3。预计估计器 <= 2” 的相关文章

如何使用 Python 3 绕过 HTTP Error 403: Forbidden with urllib.request

您好不是每次都这样但有时在尝试访问 LSE 代码时我会收到每一个烦人的 HTTP 错误 403 禁止消息任何人都知道我如何仅使用标准 python 模块来克服这个问题遗憾的是没有漂亮的汤 import urllib request
从文本文件中删除特定字符

我对 Python 和编码都很陌生我当时正在做一个小项目但遇到了一个问题 44 1 6 23 2 7 49 2 3 53 2 1 68 1 6 71 2 7 我只需要从每行中删除第三个和第六个字符或者更具体地说从整个文件中删除字符
稀有对象的 python 类型注释，例如 psycopg2 对象

我了解内置类型但是我如何指定稀有对象例如数据库连接对象 def get connection and cursor gt tuple psycopg2 extensions cursor psycopg2 extensions conn
多处理中的动态池大小？

有没有办法动态调整multiprocessing Pool尺寸我正在编写一个简单的服务器进程它会产生工作人员来处理新任务使用multiprocessing Process对于这种情况可能更适合因为工作人员的数量不应该是固定的但我需
是否可以从 Julia 调用 Python 函数并返回其结果？

我正在使用 Python 从网络上抓取数据我想使用这些数据在 Julia 中运行计算是否可以在 Julia 中调用该函数并返回其结果或者我最好直接导出到 CSV 并以这种方式加载数据绝对地看PyCall jl https gith
无法在 selenium 和 requests 之间传递 cookie，以便使用后者进行抓取

我用 python 结合 selenium 编写了一个脚本来登录网站然后从driver to requests这样我就可以继续使用requests进行进一步的活动 I used item soup select one div class
Series.sort() 和 Series.order() 有什么区别？

s pd Series nr randint 0 10 5 index nr randint 0 10 5 s Output 1 3 7 6 2 0 9 7 1 6 order 按值排序并返回一个新系列 s order Output 2 0
如何过滤 Pandas GroupBy 对象并获取 GroupBy 对象？

当对 Pandas groupby 操作的结果执行过滤时它返回一个数据帧但假设我想执行进一步的分组计算我必须再次调用 groupby 这似乎有点绕有更惯用的方法吗 EDIT 为了说明我在说什么我们无耻地从 Pandas 文档中窃取
协程从未被等待

我正在使用一个简单的上下文管理器其中包含一个异步循环 class Runner def init self self loop asyncio get event loop def enter self return self def e
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
类型错误：需要二进制或 unicode 字符串，得到 618.0

I ve been trying to implement this ML Linear Model into my dataset https www tensorflow org tutorials estimator linear L
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
Spark 和 Python 使用自定义文件格式/生成器作为 RDD 的输入

我想问一下 Spark 中输入的可能性我可以看到从http spark apache org docs latest programming guide html http spark apache org docs latest pro
是否需要关闭没有引用它们的文件？

作为一个完全的编程初学者我试图理解打开和关闭文件的基本概念我正在做的一项练习是创建一个脚本允许我将内容从一个文件复制到另一个文件 in file open from file indata in file read out file
Airflow 1.9 - 无法将日志写入 s3

我在 aws 的 kubernetes 中运行气流 1 9 我希望将日志发送到 s3 因为气流容器本身的寿命并不长我已经阅读了描述该过程的各种线程和文档但我仍然无法让它工作首先是一个测试向我证明 s3 配置和权限是有效的这是在我们
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
使用 PIL 在 Tkinter 中显示动画 GIF

我正在尝试制作一个程序来使用 Tkinter 显示动画 GIF 这是我最初使用的代码 from future import division Just because division doesn t work right in 2 7 4
无法通过 Python 子进程进行 SSH

我需要通过堡垒 ssh 进入机器因此该命令相当长 ssh i
Django 管理器链接

我想知道是否有可能如果可以的话如何将多个管理器链接在一起以生成受两个单独管理器影响的查询集我将解释我正在研究的具体示例我有多个抽象模型类用于为其他模型提供小型的特定功能其中两个模型是DeleteMixin 和GlobalMix
如何获取pandas中groupby对象中的组数？

我想知道有多少个独特的组需要执行计算给定一个名为 groupby 的对象dfgroup 我们如何找到组的数量简单快速 Pandaic ngroups 较新版本的 groupby API pandas gt 0 23 提供了此未记录的

随机推荐

使用 CBC 模式使用 PyCrypto 进行 AES 256 加密 - 有什么弱点吗？

我有以下 python 脚本来使用 AES 256 加密解密数据您能告诉我代码中是否有任何内容可能会使加密变弱或者是否有任何我没有考虑到使用 CBC 的 AES 256 加密模式我已经测试了该脚本它工作正常它正在加密和解密数据
无法加载类“org.gradle.internal.logging.LoggingManagerInternal”。导致此意外错误的可能原因

我想在 Bintray 上发布我的库我试过here http code tutsplus com tutorials creating and publishing an android library cms 24582步骤但 grad
如何判断一个变量是类还是对象

我正在较低的水平上编写一个小框架用于用 Python 为我的项目创建测试装置在这里我想知道某个特定变量是某个类的实例还是类本身如果它是一个类我想知道它是否是我的框架定义的某个类的子类我该怎么做 class MyBase obje
在 PowerShell 中使用 PrintDocument 时出现问题

我正在尝试使用以下命令将 PowerShell 中的 PDF 文件打印到另一个 PDF 以删除某些属性较早的线程 https stackoverflow com questions 52785842 print a pdf to a fi
如何将 .XML 代码样式导入 IntelliJ Idea 15

我想在编辑器中使用 XML 文件中定义的特定代码样式如下所示
如何使 C# 命名空间像 Java 包一样工作，以便在移动它们时自动重命名？

我来自Java 发现Java中的包非常方便当您将一个类移动到另一个包时它会自动更改该包当然可以通过 Eclipse 或 Netbean 等 IDE 但 C 使用命名空间并且不会像 Java 那样自动重命名我的命名空间例如我有一个
纯C 中的Cocoa OpenGL 窗口？

我想在 MacOSX 中打开一个 OpenGL 窗口以显示和抓取击键鼠标事件我不想使用 Glut 因为它要求它是根线程我不想学习 Objective C 有没有办法用纯C语言访问OpenGL api Thanks 如果您想在 OS
如何查看我的 GitHub 拉取请求已被接受的数量？

有没有办法查明 GitHub PR 的接受率可能使用 API 与此同时了解所有存储库中我报告的问题有多少已经关闭以及仍然开放这将是很有趣的您还可以使用GraphQL API v4 https developer github com
无法更新生产服务器上的 gem

无法更新生产服务器上的 gem 我试过了bundle install deployment and bundle install without development test 但继续得到 You are trying to instal
如果使用 CGPointEqualToPoint 不起作用

我试图找出为什么当球位置与块位置完全相同并且锚点相同时该函数不执行 GameEnd 函数 if CGPointEqualToPoint ball position block position if CGPointEqualToPoint
如何在socket.io中删除房间

我想静态地从房间中删除所有用户从而有效地删除该房间这个想法是将来可能会再次创建另一个同名的房间但我希望它创建为空没有前一个房间的听众我对自己管理房间状态不感兴趣而是很好奇好像我可以利用 socket io 内部结构来做到这一
在 iPhone 上创建弹出窗口？

我想在 iPhone 上创建一个自定义样式的弹出框我希望它有一个向上的箭头关于如何实现这一目标有什么想法吗尝试这个FP 弹出窗口 https github com 50pixels FPPopover它会对你有所帮助
如何使用rails控制台进行调试并放入应用程序

我想在通过 Rails 控制台打开的 irb 中打印一些行我见过很多关于如何实现它的问题但我在 irb 中什么也没得到下面是代码 def show puts in show method post Feed find by id pa
如何同时使用 CGAffineTransformMakeScale 和 Rotation？

UIImageView dsry objectAtIndex 0 transform CGAffineTransformMakeRotation 1 57 2 UIImageView dsry objectAtIndex 0 transfo
最喜欢的内容未在 webview 上正确显示

我正在开发一个语言词典应用程序我将最喜欢的单词保存到首选项中 XML 文件中的收藏夹内容如下所示
伪代码的标准？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我需要将一些 python 和 java 例程翻译成我的硕士论文的伪代码但在想出语法风格时遇到了困难持续的容易明白不太详细不太接近自
嵌入随机命名的 MP3

这是我的代码我希望 mp3 的 src 考虑到存在许多随机命名的 mp3 文件 sound 目录并在每次打开页面时随机选择一个有什么线索给我吗我的服务器启用了 PHP 但我想让它尽可能简单这应该可以做到 files glob pa
Android 通知上的表情符号

我正在尝试在通知栏上显示表情符号这是我的字符串 ue057 getString R string notification sent hey 我已经尝试过使用 Softbank 以及每种可能的格式 U 1F601 xF0 x9F x98
在 Windows 上的 VSCode 中调试 Python C/C++ 扩展

问题总结我正在为 Python 开发一个自 C 扩展以提高特定代码段的性能我想调试这个扩展但到目前为止还没有成功我关注了几个链接例如这是纳迪亚的 https nadiah org 2020 03 01 example debug
sklearn 维度问题“发现数组具有暗淡 3。预计估计器 <= 2”

我正在尝试使用 KNN 将 wav 文件正确分类为两组组 0 和组 1 我提取了数据创建了模型拟合了模型但是当我尝试使用 predict 方法时出现以下错误 Traceback most recent call last File

sklearn 维度问题“发现数组具有暗淡 3。预计估计器 <= 2”

sklearn 维度问题“发现数组具有暗淡 3。预计估计器 <= 2” 的相关文章

随机推荐

热门标签