如何获取 .wav 文件格式的 numpy 数组输出

2024-02-29

我是 Python 新手,我正在尝试训练我的音频语音识别模型。我想读取 .wav 文件并将该 .wav 文件的输出放入 Numpy 数组中。我怎样才能做到这一点?


根据 @Marco 的评论,您可以查看 Scipy 库,特别是scipy.io.

from scipy.io import wavfile

要读取您的文件('filename.wav'),只需执行以下操作

output = wavfile.read('filename.wav')

这将输出一个元组(我将其命名为“输出”):

  • output[0],采样率
  • output[1],您要分析的样本数组
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何获取 .wav 文件格式的 numpy 数组输出 的相关文章

随机推荐

  • pip 如何删除带有前导破折号的错误安装的软件包:“-pkgname”

    运行后pip freeze我注意到列表顶部有以下警告 WARNING Could not parse requirement atplotlib 所以我使用检查了已安装的软件包pip list 并且实际上以下内容被视为一个包 Package
  • 如何反映可编码/可编码密钥协议的设计?

    我正在尝试实现类似于 Swift 如何利用CodableKeys在实现的类中定义的枚举上设置的协议Codable 就我而言 班级是CommandHandler枚举是CommandIds并且它不需要编译器的代码生成 因为枚举将始终被显式指定
  • 如何使用 HTML 敏捷包

    我该如何使用HTML 敏捷包 http html agility pack net z codeplex 我的 XHTML 文档不完全有效 这就是我想使用它的原因 我如何在我的项目中使用它 我的项目是用 C 编写的 首先 安装HTML敏捷包
  • 如何将多个 HTML 文件解析为单个 PDF?

    我想使用 iText 将一系列 html 文件转换为 PDF 例如 如果有这些文件 第1页 html page2 html page3 html 现在我想创建一个 PDF 文件 其中 page1 html 是第一页 page2 html 是
  • CSS - 悬停穿过元素以激活被覆盖元素上的悬停

    我的页面布局涉及大量绝对位置和 z 索引 因此有很多元素彼此重叠 其中一个元素仅包含文本 它悬停在许多其他内容之上 在该元素下方有几个应用了 CSS 悬停伪类的元素 当鼠标经过包含文本的元素时 我希望下面的元素以某种方式响应鼠标的存在并激活
  • Symfony2 Doctrine 实体未水合

    我得到一个实体Member从实体管理器中 做了一个 var dump 除了与的 ManyToOne 关系之外 一切正常Family 所以我尝试了var dump member gt getFamily 令人惊讶的是 唯一正确的值是家庭的 I
  • Pandas:FutureWarning:将列表喜欢传递给 .loc 或 [] [重复]

    这个问题在这里已经有答案了 当我运行脚本时 Pandas 给出以下内容 未来警告 FutureWarning Passing list likes to loc or with any missing label will raise Ke
  • 如何在没有小部件工厂的情况下为 Yii2 中的 GridView 设置默认配置?

    这是 Yii2 中 gridview 的样子 我想稍微改变我的网格 所以我添加了这一行 tableOptions gt class gt table table condensed 这很好用 但是 我希望这是我所有
  • 如何抓取foursquare签到数据?

    是否可以通过贪心的方式从foursquare中爬取签到数据 即使我与所有用户没有友谊 就像抓取公开的 Twitter 消息一样 如果您有什么经验或建议 请分享 谢谢 如果您有包含 foursquare 链接的公开推文 您可以通过发出 HEA
  • 测试嵌套结构中的 nil 值

    我在 go 中有一个深度嵌套的结构 它们是由 json 解组器构造的 然而 这个结构中的相当多的字段是 omitifempty 所以我用一个在不同地方可以有空的结构来结束操作 示例 真实的嵌套更深 而且很大 400 行结构 package
  • 视图主体中的 swiftui 三元运算符

    在 swiftyui 主体内部 基于 news urlToImage 值 我需要能够加载另一个视图 LOadRemoteImageView 这只是另一个接受可选 url 字符串来加载远程图像的视图 或者显示文本字符串 没有图像网址 按照下面
  • 原始类型是否被视为 JSON?

    大多数情况下 JSON 的格式如下 color red value f00 Or color red value f00 color red value f00 我想问 string bool int 等原始类型也是 JSON 吗 我找到了
  • Swagger-Net 显示控制器名称而不是端点方法

    我一直试图找出为什么 Swagger Net 不显示控制器中的端点方法 C 项目使用基于 Net Framework 4 6 1 的 Web API 模板 当我使用 SwashBuckler 时 我得到了相同的结果 所以这不是 Swagge
  • 当 HashMap 或 HashSet 达到最大容量时会发生什么?

    就在几分钟前 我回答了一个关于 Java中HashMap的最大可能大小 正如我一直读到的那样 HashMap 是一种可增长的数据结构 它的大小仅受 JVM 内存大小的限制 因此我认为它的大小没有硬性限制并做出了相应的回答 这同样适用于 Ha
  • 检查无向图中的奇数循环

    我带着另一个类似的问题回来了 我目前正在开发一个 Java 程序 该程序将检查图是否可 2 色 即它是否不包含奇数循环 奇数长度的循环 整个算法应该在 O V E 时间内运行 V 是图中的所有顶点 E 是图中的所有边 我当前的算法执行深度优
  • 根据 mongodb 中的正则表达式值从文档中查找匹配的项目

    我必须选择匹配的casts item m credits cast 使用正则表达式值从电影集合中获取 电影模态 var mongoose require mongoose var movieSchema new mongoose Schem
  • 如何通过电子邮件发送 HTML5 画布图像

    首先 我尝试使用 Pear 的 Mail mime 来完成此操作 但我无法从共享主机提供商和 cpanel 加载该类 接下来我按照指示这个帖子 https stackoverflow com questions 6150880 email
  • 调用 WebRequest GetSystemWebProxy()

    在 PowerShell 2 0 下 我知道您可以通过执行以下操作来设置您想要使用的代理 而无需知道确切的代理设置 proxy System Net WebRequest GetSystemWebproxy proxy Credential
  • 解析 JSON 以配置 Android 应用程序

    在我的 Android 应用程序中 我必须使用服务器中的 JSON 在应用程序中进行特定调整 我试图实现的目标是读取此 json 并将所有值存储到局部变量中以在应用程序内执行操作 来自服务器的 JSON sett glHdr sm scle
  • 如何获取 .wav 文件格式的 numpy 数组输出

    我是 Python 新手 我正在尝试训练我的音频语音识别模型 我想读取 wav 文件并将该 wav 文件的输出放入 Numpy 数组中 我怎样才能做到这一点 根据 Marco 的评论 您可以查看 Scipy 库 特别是scipy io fr