我们可以从 MFCC 系数中恢复音频吗？

2024-04-30

可以从 MFCC 系数中获取音频信号吗？另外，MFCC 系数是否有一个值范围（如果有的话）是什么？如果没有，如何将其归一化在 0 到 1 之间。

我尝试使用以下 MATLAB 代码：

http://labrosa.ee.columbia.edu/matlab/rastamat/ http://labrosa.ee.columbia.edu/matlab/rastamat/

但恢复的音频与原始信号并不相似。

这个问题比较适合DSP堆栈交换 https://dsp.stackexchange.com/search?q=mfcc.

您无法修复来自 MFCC 的精确信号，它会在途中丢失一些信息，因此信号必须相似但不完全相同。通常它的质量较低。您可以在以下位置找到示例：http://www.research.ibm.com/haifa/projects/multimedia/recovc/demo/index.html http://www.research.ibm.com/haifa/projects/multimedia/recovc/demo/index.html.

您始终可以将任何实值数据集标准化为 0..1 范围。一种方法是根据实验数据对标准/变异进行标准化。如果你的数据是x = {x1, x2, x3,....}那么你可以考虑(x_i - mean(x))/std(x)。第二种方法是应用任何映射函数，例如arctan。通常不需要这种标准化。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Audio

SpeechRecognition

我们可以从 MFCC 系数中恢复音频吗？的相关文章

TypeScript 中的语音识别和语音合成

我能够通过创建如下接口在 TypeScript 中运行 SpeechRecognition 并且工作正常 namespace CORE export interface IWindow extends Window webkitSpeech
使 PlaySound 非阻塞

我一直在测试声音我注意到PlaySound正在阻塞即它会等到声音播放完毕才返回 include
MATLAB：让audioplayer()在函数结束后继续播放

我正在使用使用以下子函数的代码 function playTone duration toneFreq Generate a tone samplesPerSecond 44100 the bit rate of the tone y si
从头开始创建 mp3 文件 C#

作为一些实验的一部分我想到了一些事情如何在 C 中从头开始创建一个 mp3 文件这实际上听起来像什么例如创建一个播放音符的 mp3 文件 C 或 B 降调我怎样才能实现这一点它必须是 mp3 文件而不是 wav 或其他任何文
本地播放 mp3 时 Android MediaPlayer 错误(1, -2147483648)

Android 4 4 发布后不久我的代码自 2 2 以来一直正常工作突然出现了错误我的代码将查询音乐数据库中给定的音乐文件该路径在查询中返回然后该路径被传递到 MediaPlayer Code String uri conten
如何从 JavaScript 使用 Opus 编解码器

我想看看是否可以使用直接访问 OpusgetUserMedia或最新浏览器中的任何类似内容我对此进行了很多研究但没有取得好的结果我知道 Opus 或 Speex 实际上用于webkitSpeechRecognitionAPI 我想做语
如何使用其他语言的语音识别 android

我有一个曾经有效的代码但由于某种原因它突然停止工作我正在尝试使用希伯来语语音识别但似乎从几天前开始它才开始英语语音识别这是我的代码 sr SpeechRecognizer createSpeechRecognizer getAppl
如何在Python中从声音中获取Pi-Phase以获得相消干涉

第一我不知道该把这个话题放在哪里因为它是一个编程和声音问题如果有错误的地方请评论但这是我的问题如何将声音加载到 Python 中并创建它的反向声音因此当我播放原始文件和 pi 偏移文件时它们会产生破坏性干扰并相互抵消因
NAudio 音调变换

我正在使用 NAudio DLL 并且正在寻找音调变换声音的示例代码有一个使用的例子NAudio https github com naudio NAudio用于开源中的音高变换Skype 变声器 https github com mar
如何在Delphi 7中监听麦克风并检测声音响度

我需要一个程序来捕获麦克风输入声音超过特定阈值时的事件那么我可能需要不断地听麦克风并以某种方式测量声音幅度 Delphi 7 中可以这样做吗我建议您使用低音音频库 http www un4seen com bass html http
使用音频单元录制我的 iPhone 应用程序播放的声音

我今天有很多有趣的事情iOS 和音频单元并发现了很多有用的资源包括在内首先我对某些事情感到困惑是否真的有必要创建一个音频图 with 混合器单元录制应用程序播放的声音或者播放声音就足够了ObjectAL https github
如何在Python程序中嵌入Google Speech to Text API？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个项目在其中创建了客户端和主机之间的聊天程序并且我必须在其中嵌入语音到文本有什么方法可以在
当通过音频采样的数据数量超过 AudioRecord 构造函数中设置的“bufferSizeInBytes”时会发生什么？

public AudioRecord int audioSource int sampleRateInHz int channelConfig int audioFormat int bufferSizeInBytes 这是公共构造函数Au
如何从 URL 流式传输音频而不在设备上下载 mp3 文件

如何在 Swift 中从 URL 流式传输音频而不在设备上下载 mp3 文件我需要导入什么我需要某些库吗添加任何内容到 info plist 中吗请评论你的代码您可以使用 iOS AVPLayer 从 url 传输音频 var p
python：如何改变音量？

I used winsound Beep frequency duration 因为我想以指定的频率播放声音现在我需要更改这些声音的音量我怎样才能做到这一点我试图寻求帮助pyaudio but 如果您对外部库开放您可以使用pydu
如何开始在 Ubuntu 20.04 上使用 Mozilla TTS 训练自定义语音模型？

我想使用我录制的音频样本在 Mozilla TTS 中创建自定义语音但不知道如何开始 Mozilla TTS 项目有文档和教程但我在将各个部分组合在一起时遇到了困难似乎缺少一些基本信息而初学者需要知道这些信息才能继续我有一些问题
元素存在之前的html5音频绑定时间更新

我试图从音频标签绑定 timeupdate 事件该标签尚不存在我习惯这样做 body on click selector function e 我用音频标签尝试了这个 body on timeupdate audioPlayerJS a
“初始化 MCI 时出现问题”播放声音问题

我正在尝试使用 Playsound 播放代码文件夹中的文件但是每次运行代码时它似乎都能够调用该文件但我总是收到以下输出 playsound PlaysoundException Error 277 for command open p
Android 从 C++ 端播放原始音频

我需要能够在 Android 系统的 C 端以自定义文件格式传输音频我正在致力于移植自定义媒体播放器并且需要能够打开自定义文件并从中传输音频这很重要因为我认为从性能角度来看将整个播放器移植到 JAVA 是不可行的并且通过 JNI
在 Qt 中播放通知（频率 x）声音 - 最简单的方法？

Qt 5 1 或更高版本我需要播放频率为 x 的通知声音 n 毫秒如果我能像这样组合音调那就太好了 1000Hz 持续 2 秒然后 3000Hz 持续 1 秒最简单的方法是使用文件 WAV MP3 例如如此处所述如何用Qt播放声音

随机推荐

使用 Mean Shift 进行图像分割的解释

谁能帮我理解 Mean Shift 分割的实际工作原理吗这是我刚刚制作的一个 8x8 矩阵 103 103 103 103 103 103 106 104 103 147 147 153 147 156 153 104 107 153 1
Bokeh：自动刷新散景图

我正在尝试一个例子散景应用 http bokeh pydata org en 0 12 0 docs user guide server html userguide server applications 以单模块格式用于从数据集生成
线程安全的缓存枚举器 - 带产量的锁

我有一个自定义的 CachedEnumerable 类灵感来自缓存 IEnumerable https stackoverflow com q 1537043 5683904 我需要确保我的 ASP NET Core Web 应用程序的线
Django：创建 webhook 接收器

我目前正在尝试实现网络钩子这个网站 https developer typeform com webhooks walkthroughs 我在文档中找不到太多有关创建 Webhook 的内容您是否有任何好的存储库或页面可供我查看以更好地
访问单个结构体成员是否会将整个结构体拉入缓存？

我一直在读乌尔里希德雷珀的书每个程序员都应该了解的内存知识 http lwn net Articles 250967 并在部分3 3 2 缓存效果的测量 http lwn net Articles 252125 页面中间它给我的印象是
在 TFS 构建过程中运行 WatiN 测试时出现超时问题

我已经在我的开发环境中运行了一个简单的 WatiN Web 测试并尝试让它在 TFS 构建服务器上运行尝试加载页面时失败但出现以下异常 WatiN Core Exceptions TimeoutException Internet E
在 spring mvc 环境中使用查询使用 ajax 调用的结果填充列表框选项。

目前我正在处理我的第一个 jquery ajax 调用并且在如何将服务器端结果填充到我的列表框中时遇到问题 spring 控制器正确地返回数据希望如此我只是在填充列表框时遇到了 jquery 部分的问题这是我的 ajax 调用 f
注销后重定向设备

在用户注销后使用 Devise 将用户重定向回当前所在页面的最佳做法是什么 The 设计文档 https github com plataformatec devise wiki How To 3a Change the redirect
使用 CSV 文件填充下拉列表 - d3

我想在 html 中填充简单的下拉列表使用 csv 文件中存在的值我尝试类似的方法但它不起作用
如何检查用户是否从“设置”返回

我正在向我的用户发送本地通知并且我想在通知设置按钮上显示相关标题如果本地通知关闭则此标题应为通知关闭如果本地通知打开则此标题应类似于首选项现在我正在 viewDidLoad 和 viewDidAppear 中检查它它有效
递归和迭代的速度性能 – 为什么它们对于不同的“小”数都以相同的速度运行？

我正在尝试优化我拥有的代码为了做到这一点我编写了这段代码来查看递归与迭代的效果该代码计数到 10 的 n 次方 public Form1 InitializeComponent Stopwatch sw new Stopwatch
设置 datetime-local 的默认时间值

我使用这个 html 标签作为日期时间选择器
Cocoa 自动布局约束 - 以编程方式填充可变数量的视图

我希望能够向超级视图添加新视图但使它们彼此之间保持恒定的垂直距离为此我尝试以编程方式为每个视图设置约束但我不知道如何做到这一点问题是我事先不知道视图的数量或相对位置有没有一种方法可以以编程方式为每个视图设置约束以便无论它们相邻
将 geom_path 和 geom_text 添加到同一 ggplot 会在 r 中生成错误

我正在同一个 ggplot 中绘制 geom path 对象和 geom text 对象但遇到以下问题 load the data frames df1 lt data frame x c 32 42 52 y c 15 20 25 gr
在 C# 中的 RESTfull/HTTP 请求中添加标头和发布数据

我在 C 中发送 POST 请求时遇到问题似乎我误解了一些 HTTP 基础知识所以基本上我正在实施 RESTfull 服务client 其工作原理如下使用用户名密码发出 POST 请求并获取令牌在发出其他 GET POST PUT
RemoteViews 支持的方法

我正在尝试将值转发到 Android RemoteView 某些值可以通过使用反射的 set 方法转发例如背景颜色的工作原理 rv setInt R id viewId setBackgroundColor 0xffff0000 尽管该机
如何在 JavaScript 中将随机对象文本插入到 DOM 中？

我正在为表单输入字段制作自定义类包装器这些字段内部包含 DOM 节点并通过额外的功能方法进行增强我的问题是是否有与 toString 类似的方法用于附加到 DOM 因为我想直接将对象插入到 DOM 而不是调用其他方法换句话说这是我
Django 可重用应用程序配置

我有一些连接到数据库的 Django 中间件代码我想将中间件变成可重用的应用程序 app 这样我就可以将其打包以分发到许多其他项目中而无需复制和粘贴我不明白可重用应用程序应该在哪里配置自身由于它是用于重新分发的所以我无法自己编写中
Python：从自定义域发送电子邮件

我正在尝试从 Python 中的自定义域发送电子邮件我已经弄清楚如何使用 smtplib 从其他域例如 gmail com 发送电子邮件示例代码 https stackoverflow com questions 57842922 c
我们可以从 MFCC 系数中恢复音频吗？

可以从 MFCC 系数中获取音频信号吗另外 MFCC 系数是否有一个值范围如果有的话是什么如果没有如何将其归一化在 0 到 1 之间我尝试使用以下 MATLAB 代码 http labrosa ee columbia edu m

我们可以从 MFCC 系数中恢复音频吗？

我们可以从 MFCC 系数中恢复音频吗？ 的相关文章

随机推荐

热门标签

我们可以从 MFCC 系数中恢复音频吗？的相关文章