语音训练文件和注册表位置

2024-03-24

我有一个演讲项目,需要用代码完成声学训练。我能够使用 SAPI 在 Windows 7 下成功创建包含成绩单及其关联注册表项的培训文件。但是,我无法确定识别引擎是否成功使用这些文件并调整其模型。我的问题如下:

  1. 通过控制面板训练 UI 执行训练时,系统将训练文件存储在“{AppData}\Local\Microsoft\Speech\Files\TrainingAudio”中。音频训练文件是否必须存储在该位置,或者只要配置文件的注册表项反映正确的路径,我就可以将它们存储在其他位置吗?

    1. 语音控制面板在“HKCU\Software\Microsoft\Speech\RecoProfiles\Tokens{ProfileGUID}{00000000-0000-0000-0000-0000000000000000}\Files”项中为训练音频文件创建注册表项。

    a) 由我的训练代码创建的注册表项是否必须放置在“{00000000-0000-0000-0000-0000000000000000}\Files”中,或者我可以在 {ProfileGUID} 下创建一个新的随机 GUID 吗?

    b) 子项是否必须命名为“Files”?

    c) 注册表值是否必须遵循“TrainingAudio-xxxx-xxxxxxxx-xxxxxxxx”的形式,或者我可以使用其他值吗?

    d) 最后,注册表值数据的格式为“%1c%\Microsoft\Speech\Files\TrainingAudio\SP-xxx....xxx”。我可以指定绝对路径吗?

    e) 文件名是否必须遵循“SP-xxx....xxx.wav”的形式,或者我可以使用任何唯一的文件名吗?

Thanks.

Giri


None

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

语音训练文件和注册表位置 的相关文章

  • 语音识别的技术原理是什么?

    https www zhihu com question 20398418
  • JAVA使用google语音识别API

    我正在尝试使用谷歌语音识别 API 这是我写的代码 http pastebin com zJEhnJ74 有用 我从服务器得到答案 status 5 id 8803471b14a2310dfcf917754e8bd4a7 1 hypothe
  • 语音中的关键字识别[关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 目前不接受答案 有谁知道有一个免费的关键字识别系统 并且可能提供 API CMU Sphinx 4 和 MS Speech API 是语音识别引擎 不能用于 KWS
  • Microsoft 语音识别 setInputToDefaultAudioDevice 引发异常

    大家好 我在 MS 语音识别方面遇到了麻烦 我的代码很简单 static void init string enUsEngine string Empty foreach RecognizerInfo ri in SpeechRecogni
  • 如何将自定义 SR(语音识别)添加到 Microsoft SAPI

    我有一个针对 X 语言的语音识别应用程序 Microsoft SAPI 不支持此语言 如何将语言 X 的 SR 添加到 Microsoft SAPI 以便我可以通过 Microsoft SAPI 使用它 所以我想知道的是 我可以将自定义 S
  • 为什么 Application.Speech.Speak 单独读取一些数字而不是将它们放在一起?

    假设现在是 11 点 11 分 它读作 一一 小时 十一 分钟 如下所示 Sub TEST1 Application Speech Speak It is Hour Now hours and Minute Now minutes End
  • 可以在单词发音游戏中使用WIndows语音识别引擎吗?

    我用来创建一个使用 Windows 语音识别引擎或 SAPI 的应用程序 这就像一个游戏发音当你正确发音时它会给你分数 但是当我开始使用 SAPI 进行实验时 它的识别效果很差 除非您在其上加载语法 XML 否则它会给出最佳的识别结果 但现
  • 在代码中处理语音命令以执行命令的智能方法

    我想知道是否可以寻求更好的方法来处理和处理命令 而不是使用可能变得非常长且非常乏味的 Switch Case 或 IF 布尔检查 E G if settings getName Command Speak I am here if Get
  • Google 语音识别 API:每个单词的时间戳?

    可以使用 Google 的语音识别 API 通过发出请求来获取音频文件 WAV MP3 等 的转录http www google com speech api v2 recognize 示例 我说过 一二三五 在 WAV 文件中 Googl
  • 有没有办法将语法与 HTML 5 语音输入 API 结合使用?

    我正在使用 HTML 5 语音输入 API 我想让服务器知道它可以期望从语音输入返回哪些答案 有没有办法设置可能的输入列表 在 Google Chrome 中 您还不能使用语法 总的来说 他们决定仅使用自由形式识别 相关问题是Google
  • Windows Speech SAPI:如何列出语音属性?

    我用过这个堆栈溢出答案 https stackoverflow com questions 17675177 c and microsoft sapi 5 how to list all available voices and selec
  • 从 Windows 服务通过调制解调器播放语音

    我正在开发一个 VB NET Windows 服务 该服务持续检查 BMS 数据库是否有新警报 并拨打电话远程警告操作员 我目前正在使用 NET TAPI 包装器和 SAPI 5 3 互操作程序集 我通过电话交谈的步骤是 初始化TAPI接口
  • Android 连续语音识别 - 无间隙

    我有一个实施的活动RecognitionListener 为了使其每次都连续onEndOfSpeech 我再次启动监听器 speech startListening recognizerIntent 但是 它需要一些时间 大约半秒 才能开始
  • 什么是 SAPI?什么时候会使用它?

    我最近一直在学习 PHP 中的错误处理 并遇到了error log 功能 http docs php net manual en function error log php 在 PHP 手册中 它讨论了所有错误日志类型 我理解所有这些类型
  • 语音识别和语音合成入门

    我想开始语音识别和语音合成 在基于语音识别的原型 https stackoverflow com questions 3865351 prototype based on speech recognition有人告诉我使用微软语音服务器 s
  • 无需 Google 对话框的语音识别

    我将尝试使用带有 RecognitionListener 的语音识别 无需 Google 对话框 但不起作用 启动应用程序时只会发出蜂鸣声 我已将音频记录和互联网权限添加到清单文件中 我希望你告诉我并帮助我找到错误 我在 Log cat 上
  • 用于语音检测和辨别的开源代码

    我有 15 盘录音带 我相信其中一盘包含我祖母和我谈话的旧录音 快速尝试找到合适的地方并没有找到 我不想听20个小时的磁带才能找到它 该位置可能不在其中一盘磁带的开头 大多数内容似乎分为三类 按照总长度的顺序 最长的在前 沉默 语音广播和音
  • 将输入流式传输到 System.Speech.Recognition.SpeechRecognitionEngine

    我正在尝试从 TCP 套接字在 C 中进行 流式 语音识别 我遇到的问题是 SpeechRecognitionEngine SetInputToAudioStream 似乎需要一个可以查找的定义长度的流 现在 我能想到的实现这项工作的唯一方
  • 将另一个声音添加到 .NET Speech 中

    如何将其他声音添加到 NET Speech 中 我想使用捷克语语音 我找到了一些 sis files Eliska22k sis但我不知道如何使用它 SpeechSynthesizer synth new SpeechSynthesizer
  • Android:如何检测用户何时停止对着麦克风说话

    我有一个 Android 应用程序 在应用程序启动时开始从麦克风录音 在我当前的版本中 用户必须按 停止 按钮才能停止录制 如何检测用户已停止说话并使用它来触发录音机停止 类似于 Android 中语音识别功能的实现 用户停止说话 然后语音

随机推荐

  • 如何将字符串转换为 ifstream

    我正在尝试使用 ifstream 打开一个文件 并且想使用字符串作为路径 我的程序创建一个字符串路径 它会编译但保持空白 string path NameOfTheFile it would be something close to c
  • 谷歌地理编码 API 的计费问题

    计费已添加到我们的 gmaps api 项目中 而且该账单肯定会传播 因为它是在大约 4 周前添加的 在项目仪表板中 计费显示为可用 但是 当我们尝试调整配额时 它说我们需要激活计费 我们联系了 Google 的几乎所有渠道 并被告知完全没
  • CSS 多重文本装饰

    我想要拥有 h2 下划线同时闪烁 有没有办法只修改CSS样式来实现这一点 h2 例如 h2 text decoration underline blink or h2 text decoration underline text decor
  • 将 ereg_replace 替换为 preg_replace [重复]

    这个问题在这里已经有答案了 您好 需要更改功能ereg replace theData 到 preg replace To port ereg replace to preg replace你需要将正则表达式放在一对之间分隔符 你的正则表达
  • 特别分发:无法安装应用程序

    我正在开发一个ios应用程序 仅适用于iphone 并试图让其他人测试它 我通过临时分发在自己的设备上安装该应用程序没有问题 当我尝试在另一个人的设备上安装时 它总是失败 并显示消息 此时无法安装 xxxxx 我正在使用 xcode 5 以
  • Jython 不会将 PYTHONPATH 加载到 sys.path 中

    根据我读到的内容 sys path 应该由 PYTHONPATH 设置 在 Python 中 它是这样工作的 但在 Jython 中则不然 我可以绕过 Dpython path 但我想知道为什么 Jython 表现不佳 qa Scantro
  • 在 Visual Studio 2010 中使用正则表达式查找和替换来小写

    我正在使用 Visual Studio 2010 中的查找和替换功能来更改字段的编码样式 所有实例类似于 m MyField 应该 myField 但我只能设法得到 MyField using Find what m a zA Z Repl
  • 无法安装 sqlite3-ruby gem

    我已经安装了 xcode 3 0 我需要安装 sqlite3 ruby gem 用于 rhosync 当我跑步时 sudo gem install l sqlite3 ruby 我收到以下错误 Building native extensi
  • 重复的 typedef - 在 C 中无效但在 C++ 中有效?

    我想要一个标准参考 为什么以下代码会触发 C 中的合规性警告 使用gcc pedantic typedef 重新定义 但在 C 中没问题 g pedantic typedef struct Foo Foo typedef struct Fo
  • 如何判断文件是否为空?

    如何判断文件是否为空 该文件由运行在Windows平台上的C程序打开 我想以附加模式打开一个文件 如果为空 首先打印一个标题 Open CSV write header report csv fopen SNR csv a if repor
  • 在 Mac 上解压缩大型 ZIP 档案(例如最新的 Microsoft Edge VM)

    尝试在我的 Mac 上解压最新的 Microsoft Edge Vm zip 文件后 我最终得到一个 cpgz 文件 它应该为 virtualBox 生成一个 ova 文件 有人知道怎么修这个东西吗 http mattormeeple co
  • 何时使用 handler.post() 以及何时使用 new Thread()

    我想知道什么时候应该使用handler post runnable 我什么时候应该使用new Thread runnable start Handler 的开发人员文档中提到了这一点 导致 Runnable r 添加到消息队列中 可运行的
  • MS Word 在 python 中的读/写、Python-docx 问题和 win32com 参考?

    最近 我正在尝试使用不同的 API 进行 MS Word 文件管理 现在正在编写 此时我只需要一个简单的编写Python API 我尝试了 win32com 模块 事实证明该模块非常强大 但缺乏 python 在线示例 对 VB 和 C 的
  • nginx 位置正则表达式 - 字符类和匹配范围

    我正在尝试为路径设置正则表达式 s lt 4 6 character string here gt 我将 4 6 个字符串捕获为 1 我尝试使用以下两个条目 但都失败了 location s 0 9a zA Z 4 6 location s
  • 不同Y级别的UIButton无法在tvOS上聚焦

    我开始为 Apple TV 开发应用程序 但在按钮方面遇到了这个问题 我有一个屏幕 屏幕底部有几个按钮 中间有一个按钮 请参阅屏幕截图以了解 问题是我无法集中中间按钮 焦点仅位于底部的三个按钮上 问题显然是由Y位置 当我移动屏幕底部的按钮时
  • 命令未存储在命令历史记录中

    背景 https stackoverflow com questions 76566358 这个答案 https stackoverflow com a 47595405 2153235依赖于 readline 模块并且write hist
  • 在 MVC razor 视图中的 foreach 循环中对单选按钮进行分组?

    我尝试通过在 html 帮助中提供额外的 html 属性来对循环内的一组单选按钮进行分组 如下所示 ol class Opt foreach var opt in quest Options li class Opt Html RadioB
  • 从 git 包中恢复所有引用

    如何从备份恢复所有远程分支 git bundle Backup git bundle create tmp dp all git bundle list heads tmp dp head n5 f37c9fc7f0ce121568f42f
  • 改进低效的 jQuery 选择器

    在 IntelliJ 中 如果我使用 jQuery 选择器 例如 roleField option each function impl omitted 选择器突出显示 并建议我应该 以 ID 选择器开头的拆分后代选择器 IntelliJ
  • 语音训练文件和注册表位置

    我有一个演讲项目 需要用代码完成声学训练 我能够使用 SAPI 在 Windows 7 下成功创建包含成绩单及其关联注册表项的培训文件 但是 我无法确定识别引擎是否成功使用这些文件并调整其模型 我的问题如下 通过控制面板训练 UI 执行训练