如何降低 Sphinx4 应用程序中的噪音

2024-01-03

我对 sphinx4 和语音识别很陌生。我正在使用 sphinx4 创建语音应用程序。问题是噪声,即使用户没有语音输入,它也会导致程序识别,即即使用户没有语音输入,程序也会将语音转换为文本,从而影响准确性。

主要问题是如何实现降噪。这是因为即使我没有对着麦克风说话,系统也会检测到输入。所以我猜是因为噪音。

我在网上查了降噪,但几乎没有明确的信息。虽然互联网上有一些关于 sphinx4 附带的名为 Denoise.java 的文件的信息。但sphinx4-1.06中没有这个功能。

另一个文件是 WienerFilter.java,wienerfilter 是用于噪声信号的滤波器类型。但没有使用或实现该文件的说明。

我已经在 hello.gram(该程序的语法文件)中添加了更多单词。 Imtool 生成的这些额外单词的语音表示已添加到词典中。

我正在使用 eclipse 和 sphinx4-1.0beta6

虽然 SPHINX4 中的“HOW TO ACTIVATE NOISE CANCELATION”有一个关于堆栈溢出的问题,但尚未得到解答


在最新版本 sphinx4-5prealpha 中,默认启用具有频谱减法的静态噪声消除功能。您不需要做任何特殊的事情,只需使用最新版本即可。

按照教程操作:

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4 http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

如果您使用语法解码,而不是使用语言模型进行大词汇量解码,则在最新版本中会忽略额外的语音。如果您使用语法解码,它应该忽略语法中的所有单词。对于不在语法中的单词,它应该返回一个特殊的单词<unk>.

精度调试是一个复杂的过程,需要测试记录来重现精度问题。如果没有测试记录,很难建议您如何提高准确性。除了测试记录之外,您还需要提供用于解码的模型和其他信息以重现结果。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何降低 Sphinx4 应用程序中的噪音 的相关文章

  • 隐马尔可夫模型 (HMM) 中的三态电话模型

    我想问一下HMM中3态电话模型的含义 本案例基于语音识别系统中的HMM理论 因此 该示例基于 HMM 中语音的声学建模 我从期刊论文中得到了这张示例图片 http www intechopen com source html 41188 m
  • 在 iOS 中同时管理文本转语音和语音识别

    我想要我的iOS我正在开发一个应用程序 使用文本转语音功能向用户朗读从服务器接收到的一些信息 并且我还想允许用户通过语音命令停止此类语音 我尝试过 iOS 的语音识别框架 例如OpenEars我发现问题在于它正在监听和检测应用程序本身 说
  • Android 语音识别作为 Android 4.1 和 4.2 上的服务

    我已经成功地让连续语音识别 使用 SpeechRecognizer 类 作为一项服务在所有 Android 版本 最高 4 1 上运行 我的问题是让它在版本 4 1 和 4 2 上工作 因为众所周知 存在一个问题 即 API 没有按照记录进
  • CMUSphinx 实时语音识别太慢?

    CMU Sphinx 识别实时语音太慢 不知道你有什么办法增强它吗 这是我的配置 configuration setAcousticModelPath WSJ 8gau 13dCep 16k 40mel 130Hz 6800Hz confi
  • 语音识别引擎未在 Windows 服务中触发事件

    所以我有一个使用 system speech 识别引擎实现语音识别的 Windows 服务 当我启动服务时 我的语音识别代码运行良好 但没有语音识别火灾事件 奇怪的是 如果我运行完全相同的代码 但在控制台或 WPF 应用程序中 则语音识别的
  • 离线语音识别时出现错误 ERROR_RECOGNIZER_BUSY

    我对谷歌离线语音识别进行了研究 但它在 google Nexus 5 操作系统 4 4 中工作正常 但如果我在三星 Galaxy s5 操作系统 5 0 中实现相同的版本 它无法识别并且显示此错误 8 ERROR RECOGNIZER BU
  • 为什么 javascript 语音识别 api 在没有互联网的情况下无法工作?

    我正在使用 javascript 语音识别 api new webkitSpeechRecognition 我很惊讶为什么它在没有互联网的情况下无法工作 因为它是 javascript 代码 所以它应该可以离线工作 我检查了chrome开发
  • 有没有办法强制 Google Speech api 仅返回单词作为响应?

    我正在使用谷歌这个API language code key 我的密钥 用于语音识别 并且效果非常好 问题在于数字 即如果我说one two three four结果将是1234如果我说one thousand two hundred th
  • 使用 Flash 或 Silverlight 进行语音识别

    我正在开发一个网络用户界面来输入一些不是很复杂但需要实时加载的信息 我认为该应用程序可以利用语音识别来促进任务 该界面的核心是使用 Javascript 和 jQuery 构建的 但可以轻松包含 flash 或 silverlight 组件
  • 当用户结束讲话时停止语音识别

    Siri 如何确定我何时说完 我想知道的原因是我想在我的应用程序中使用 Apple 的语音识别 API 实现类似的功能 这是可行的 还是知道用户何时停止说话的唯一方法是通过用户输入 你可以使用计时器 我有同样的问题 但我无法用优雅的方法解决
  • C/C++ 中的梅尔频率倒谱系数 (MFCC)

    C C 中是否有 MFCC 的实现 有源代码或库吗 我已经找到了http code google com p libmfcc http code google com p libmfcc 这看起来不错 2016年回顾 libmfcc很简单
  • Android 中的噪音消除是如何工作的?

    我碰到this http www talk3g co uk showthread php 7655 Google Nexus One Noise Cancellation Microphone win相对较旧的帖子 描述了 Nexus On
  • 使用 OpenCV 将光栅图像转换为矢量图形?

    我正在寻找使用 OpenCV 将光栅图像转换为矢量数据的可能性 在那里我发现了一个函数cv findContours 这似乎有点原始 更可能是我没有完全理解它 它似乎仅使用黑白图像 没有灰度和彩色图像 并且似乎不接受任何可能有助于噪声图像的
  • 如何在Python中使用谷歌语音识别API? [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我有一个 mp3 文件 我想使用 Google 的语音识别功能从该文件中获取文本 任何我可以找到文档或
  • 使用CamerX android进行视频录制时使用语音识别器API

    我目前正在使用cameraX 来录制带有音频的视频 并且工作得很好 但是现在我必须在录制视频时使用SpeechRecognizer 并获取用户所说内容的转录 UPDATE 我尝试从视频中提取音频 然后将其作为额外内容提供给意图 但它不起作用
  • 为什么我在此语音识别代码中缺少 an4-1-1.match 文件?

    我在语音识别的解码部分遇到问题 我按照步骤操作here http www speech cs cmu edu sphinx tutorial html 当我输入 perl scripts pl decode slave pl 我收到这些错误
  • 如何使用其他语言的语音识别 android

    我有一个曾经有效的代码 但由于某种原因它突然停止工作 我正在尝试使用希伯来语语音识别 但似乎从几天前开始它才开始英语语音识别 这是我的代码 sr SpeechRecognizer createSpeechRecognizer getAppl
  • python中的语音识别持续时间设置问题

    我有一个 Wav 格式的音频文件 我想转录 我的代码是 import speech recognition as sr harvard sr AudioFile speech file wav with harvard as source
  • 如何在iOS SDK中使用语音识别? [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我知道 SIRI 服务没有公共 API 但是有没有简单的语音识别 API 因此 如果我有一个文本字段并且
  • 语音识别和声音与音乐的比较

    我正在尝试制作一个具有语音识别功能的 Android 应用程序 但不幸的是谷歌不支持我的语言 马其顿语 并且我正在尝试比较两个录音声音 我在用着http code google com p musicg http code google c

随机推荐