如何降低 Sphinx4 应用程序中的噪音

2024-01-03

我对 sphinx4 和语音识别很陌生。我正在使用 sphinx4 创建语音应用程序。问题是噪声，即使用户没有语音输入，它也会导致程序识别，即即使用户没有语音输入，程序也会将语音转换为文本，从而影响准确性。

主要问题是如何实现降噪。这是因为即使我没有对着麦克风说话，系统也会检测到输入。所以我猜是因为噪音。

我在网上查了降噪，但几乎没有明确的信息。虽然互联网上有一些关于 sphinx4 附带的名为 Denoise.java 的文件的信息。但sphinx4-1.06中没有这个功能。

另一个文件是 WienerFilter.java，wienerfilter 是用于噪声信号的滤波器类型。但没有使用或实现该文件的说明。

我已经在 hello.gram（该程序的语法文件）中添加了更多单词。 Imtool 生成的这些额外单词的语音表示已添加到词典中。

我正在使用 eclipse 和 sphinx4-1.0beta6

虽然 SPHINX4 中的“HOW TO ACTIVATE NOISE CANCELATION”有一个关于堆栈溢出的问题，但尚未得到解答

在最新版本 sphinx4-5prealpha 中，默认启用具有频谱减法的静态噪声消除功能。您不需要做任何特殊的事情，只需使用最新版本即可。

按照教程操作：

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4 http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

如果您使用语法解码，而不是使用语言模型进行大词汇量解码，则在最新版本中会忽略额外的语音。如果您使用语法解码，它应该忽略语法中的所有单词。对于不在语法中的单词，它应该返回一个特殊的单词<unk>.

精度调试是一个复杂的过程，需要测试记录来重现精度问题。如果没有测试记录，很难建议您如何提高准确性。除了测试记录之外，您还需要提供用于解码的模型和其他信息以重现结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

SpeechRecognition

cmusphinx

sphinx4

noisereduction

如何降低 Sphinx4 应用程序中的噪音的相关文章

隐马尔可夫模型 (HMM) 中的三态电话模型

我想问一下HMM中3态电话模型的含义本案例基于语音识别系统中的HMM理论因此该示例基于 HMM 中语音的声学建模我从期刊论文中得到了这张示例图片 http www intechopen com source html 41188 m
在 iOS 中同时管理文本转语音和语音识别

我想要我的iOS我正在开发一个应用程序使用文本转语音功能向用户朗读从服务器接收到的一些信息并且我还想允许用户通过语音命令停止此类语音我尝试过 iOS 的语音识别框架例如OpenEars我发现问题在于它正在监听和检测应用程序本身说
Android 语音识别作为 Android 4.1 和 4.2 上的服务

我已经成功地让连续语音识别使用 SpeechRecognizer 类作为一项服务在所有 Android 版本最高 4 1 上运行我的问题是让它在版本 4 1 和 4 2 上工作因为众所周知存在一个问题即 API 没有按照记录进
CMUSphinx 实时语音识别太慢？

CMU Sphinx 识别实时语音太慢不知道你有什么办法增强它吗这是我的配置 configuration setAcousticModelPath WSJ 8gau 13dCep 16k 40mel 130Hz 6800Hz confi
语音识别引擎未在 Windows 服务中触发事件

所以我有一个使用 system speech 识别引擎实现语音识别的 Windows 服务当我启动服务时我的语音识别代码运行良好但没有语音识别火灾事件奇怪的是如果我运行完全相同的代码但在控制台或 WPF 应用程序中则语音识别的
离线语音识别时出现错误 ERROR_RECOGNIZER_BUSY

我对谷歌离线语音识别进行了研究但它在 google Nexus 5 操作系统 4 4 中工作正常但如果我在三星 Galaxy s5 操作系统 5 0 中实现相同的版本它无法识别并且显示此错误 8 ERROR RECOGNIZER BU
为什么 javascript 语音识别 api 在没有互联网的情况下无法工作？

我正在使用 javascript 语音识别 api new webkitSpeechRecognition 我很惊讶为什么它在没有互联网的情况下无法工作因为它是 javascript 代码所以它应该可以离线工作我检查了chrome开发
有没有办法强制 Google Speech api 仅返回单词作为响应？

我正在使用谷歌这个API language code key 我的密钥用于语音识别并且效果非常好问题在于数字即如果我说one two three four结果将是1234如果我说one thousand two hundred th
使用 Flash 或 Silverlight 进行语音识别

我正在开发一个网络用户界面来输入一些不是很复杂但需要实时加载的信息我认为该应用程序可以利用语音识别来促进任务该界面的核心是使用 Javascript 和 jQuery 构建的但可以轻松包含 flash 或 silverlight 组件
当用户结束讲话时停止语音识别

Siri 如何确定我何时说完我想知道的原因是我想在我的应用程序中使用 Apple 的语音识别 API 实现类似的功能这是可行的还是知道用户何时停止说话的唯一方法是通过用户输入你可以使用计时器我有同样的问题但我无法用优雅的方法解决
C/C++ 中的梅尔频率倒谱系数 (MFCC)

C C 中是否有 MFCC 的实现有源代码或库吗我已经找到了http code google com p libmfcc http code google com p libmfcc 这看起来不错 2016年回顾 libmfcc很简单
Android 中的噪音消除是如何工作的？

我碰到this http www talk3g co uk showthread php 7655 Google Nexus One Noise Cancellation Microphone win相对较旧的帖子描述了 Nexus On
使用 OpenCV 将光栅图像转换为矢量图形？

我正在寻找使用 OpenCV 将光栅图像转换为矢量数据的可能性在那里我发现了一个函数cv findContours 这似乎有点原始更可能是我没有完全理解它它似乎仅使用黑白图像没有灰度和彩色图像并且似乎不接受任何可能有助于噪声图像的
如何在Python中使用谷歌语音识别API？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个 mp3 文件我想使用 Google 的语音识别功能从该文件中获取文本任何我可以找到文档或
使用CamerX android进行视频录制时使用语音识别器API

我目前正在使用cameraX 来录制带有音频的视频并且工作得很好但是现在我必须在录制视频时使用SpeechRecognizer 并获取用户所说内容的转录 UPDATE 我尝试从视频中提取音频然后将其作为额外内容提供给意图但它不起作用
为什么我在此语音识别代码中缺少 an4-1-1.match 文件？

我在语音识别的解码部分遇到问题我按照步骤操作here http www speech cs cmu edu sphinx tutorial html 当我输入 perl scripts pl decode slave pl 我收到这些错误
如何使用其他语言的语音识别 android

我有一个曾经有效的代码但由于某种原因它突然停止工作我正在尝试使用希伯来语语音识别但似乎从几天前开始它才开始英语语音识别这是我的代码 sr SpeechRecognizer createSpeechRecognizer getAppl
python中的语音识别持续时间设置问题

我有一个 Wav 格式的音频文件我想转录我的代码是 import speech recognition as sr harvard sr AudioFile speech file wav with harvard as source
如何在iOS SDK中使用语音识别？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我知道 SIRI 服务没有公共 API 但是有没有简单的语音识别 API 因此如果我有一个文本字段并且
语音识别和声音与音乐的比较

我正在尝试制作一个具有语音识别功能的 Android 应用程序但不幸的是谷歌不支持我的语言马其顿语并且我正在尝试比较两个录音声音我在用着http code google com p musicg http code google c

随机推荐

(#210) 用户不可见的原因是什么

访问令牌必须有效并包含publish stream 已检查对于在朋友墙上发帖的用户我确实拥有有效的access token 用户 A 必须是用户 B 的好友勾选发帖用户与他要发帖的用户是好友发帖使用将应用程序隐私设置设置为朋友
User.IsInRole 在 ASP.NET Core 中不返回任何内容（实现了存储库模式）

我有一个具有以下配置的 ASP NET Core 完整 NET Framework 应用程序启动 cs public void ConfigureServices IServiceCollection services Add frame
C++动态库dlopen错误

我有两个文件骰子 cpp include RollDice h include IPlugins cpp include IPluginFunctions cpp include
MaybeT m 的应用实例假设 Monad m

我一直在使用Haxl单子此处描述 http www reddit com r haskell comments 1le4y5 the haxl project at facebook slides from my talk http ww
Javascript - 单击时，检查元素是否具有带值的属性

按钮我想让它与像这样的事件侦听器一起使用 document body addEventListener click function e console log e target if e target hasAttribute data
基于 ProcessWindowFunction 的 Flink 单元测试

如何为有状态流程函数创建单元测试我有这样的事情 private static SingleOutputStreamOperator
我可以在输入字段上使用 :before 或 :after 伪元素吗？

我正在尝试使用 afterCSS 伪元素input字段但它不起作用如果我将它与span 工作正常这有效将笑脸放在 buu 之后和更多之前 span class mystyle buuu span a some more 这是行不
JfreeChart：将动态日期时间值转换为 XY 图表

我正在使用 JfreeChart 创建动态图表目前我面临创建图表以显示数据库中的动态日期时间值的问题显示上图我想将 Y 轴固定为 JAN 到 Dec 的月份很久以来一直在尝试但我找不到任何解决方案请给我解决上述问题的解决方案
在struts 2中将可变数量的参数从表单传递到动作

我在应用程序中使用 struts2 并在 jsp 中有一个表单该表单提交给操作类表单中输入字段的数量在运行时可能会发生变化因此操作类不能具有固定的参数 setter 和 getter 我试图在单个操作类中捕获这些可变数量的输入我想知
Swing GUI 未更新

我有一个简单的 Java Swing 应用程序它使用 zip4j 来加密和解压 zip 文件这是通过这部分代码完成的 ZipFile zipFile new ZipFile dataStorage zip zipFile setPass
flutter中的底部导航栏设计在单击时展开图标

I need a navigation bar on which I can expand an icon when it s clicked in FlutterBottom Navigation bar design image htt
C# 3.0 (2009) 中的 C# 可选属性

我想知道 C 是否支持如下可选属性 public class Person public string Name get set public optional string NickName get set many more prope
如何使用 window.open() 显示窗口标题？

我想使用以下命令打开一个新窗口 window open
Java代理认证

我有一个在 Tomcat 6 中运行的 Java Web 应用程序它从远程 URL 加载 RSS 提要 I use Rome http java net projects rome 为我处理 RSS 提要和不同的格式连接部分如下所示 t
在 Blazor 页面内渲染 React 组件

是否可以在 Blazor 页面内呈现 React 组件我尝试向 Blazor 页面添加脚本标签但 Blazor 不允许添加脚本标签感谢你的回答是否可以在 Blazor 页面内呈现 React 组件是的这是可能的 React 是一
使用 JavaScript 处理刷新页面事件

是否可以使用JavaScript来处理刷新页面的事件我想要的是如果用户做出以下行为之一我会收到通知 refresh page by pressing F5 关闭选项卡或浏览器输入新网址然后按 Enter 键浏览器显示警告消息
clojure cons 与带有惰性序列的 conj

为什么 cons 在这种情况下可以与lazy seq配合使用但 conj 却不能这有效 defn compound interest p i cons p lazy seq compound interest p 1 i i 这不会它
如何将 HTML 字符串渲染为真正的 HTML？

这是我尝试过的以及它是如何出错的这有效 div Hi there gt 这不会 div div description 属性只是一个普通的 HTML 内容字符串然而由于某种原因它被呈现为字符串而不是 HTML 有什么建议么 Is
如何在Node.js中请求图像并输出图像

我尝试获取图像并显示在网址上我用request https github com request request module 例如我想获取图像https www google com images srpr logo11w png 并显
如何降低 Sphinx4 应用程序中的噪音

我对 sphinx4 和语音识别很陌生我正在使用 sphinx4 创建语音应用程序问题是噪声即使用户没有语音输入它也会导致程序识别即即使用户没有语音输入程序也会将语音转换为文本从而影响准确性主要问题是如何实现降噪这是因为即

如何降低 Sphinx4 应用程序中的噪音

如何降低 Sphinx4 应用程序中的噪音 的相关文章

随机推荐

热门标签

如何降低 Sphinx4 应用程序中的噪音的相关文章