如何将自定义 SR(语音识别)添加到 Microsoft SAPI

2023-12-02

我有一个针对 X 语言的语音识别应用程序。

Microsoft SAPI 不支持此语言。如何将语言 X 的 SR 添加到 Microsoft SAPI 以便我可以通过 Microsoft SAPI 使用它?

所以我想知道的是

  • 我可以将自定义 SR 添加到 Microsoft SAPI 吗?
  • 如果是这样怎么办?
  • 如果这是一个复杂的过程,哪里可以找到详细信息?

SAPI只是应用程序编程接口,它只为语音识别引擎提供连接器。同一接口可以有多种实现。

如果 Microsoft 的默认实现不包括 X 语言,您有多种选择。我认为致电 Microsoft 并要求他们以 100 万美元的价格添加语言的选择不适合您。

您可以使用软件工具包创建自己的 SAPI 实现,该工具包允许您将任何语言添加到语音识别系统中。这样的引擎就是CMUSphinx。您可以使用 CMUSphinx 轻松创建任何语言的语音识别系统。有关更多详细信息,请参阅tutorial.

一旦掌握了语音识别的核心功能,您就需要实现引擎功能。为此,请阅读Microsoft 的 SAPI 引擎开发人员文档。 本质上,您需要创建实现了某些接口的 DLL,并将其安装到您的系统中。之后,将可以通过 SAPI 进行识别。 SAPI 发行版中有一个示例引擎,您可以将其用作基础。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何将自定义 SR(语音识别)添加到 Microsoft SAPI 的相关文章

随机推荐

  • 以语义方式填充元组列表

    我正在编写一段代码 我必须处理元组列表 其中 键 的顺序和名称 fst元组的 s 匹配某个模板 我通过验证并 如果需要 根据输入生成有效列表来实现容错 这是我的意思的一个例子 给定密钥模板 hello world this is a tes
  • 如何在 Lotus Domino 上设置 CORS?

    我尝试通过跨域请求通过 REST 与 Domino 进行通信 但遇到了问题 我已经设置了一个 Internet 站点文档 其中包含 IP 地址 本地主机和作为主机名列出的服务器名称 该网站正在按照我在该网站上设置的重定向规则运行 我还使用以
  • 添加到 CodeBehind 的代码未执行

    我对 Umbraco 很陌生 我仍在摸索它的工作方式 所以我完全有可能错过了一些非常明显的东西 我被要求修改 MasterPage 上滑块的功能 我发现滑块的标记位于 MasterPage 的 cs 文件中 void CreateSlide
  • 检索音频 - 二进制文件 - 存储在我的 Mlab 中

    基本上 我已经使用 MediaDevices getUserMedia WebRTC API 设置了一个应用程序 我已经录制了音频 理论上一切都很好 但我现在必须检索音频来听他们的声音 我现在想知道如何在我的 MongoDB 数据库中下载音
  • “标题”视图和按钮:如何将侦听器附加到没有自己的 Activity 的“标题”中的按钮?

    我已经触及这个问题here 克里斯托弗对此给出了答案 但我不太明白 所以我认为是时候让它成为一个真正的问题 而不仅仅是 跟进 目前 我正在编写的应用程序有 4 个不同的屏幕 屏幕 1 节点列表 主屏幕 屏幕 2 选项菜单 带按钮的表格布局
  • 无法更新 Dart SDK。重试

    我正在尝试安装颤振 但是当我运行 cmd flutter doctor 时发生错误 正在检查 Dart SDK 版本 PowerShell exe 未被识别为内部或外部命令 可运行的程序或批处理文件 错误 无法更新 Dart SDK 正在重
  • 子类化 NSDrawer 的 contentView 以实现完全自定义的抽屉

    我想通过子类化 NSView 并在其中完成所有视图绘制来完全实现我自己的自定义抽屉 我创建了一个自定义 NSView 类 除了实现 initWithFrame 和 drawRect 之外几乎不做任何事情 我已经记录了 NSView 的框架
  • 在 Visual Studio 2012 中使用 EF Scaffolding 创建新的 Web API 控制器时,“对象引用未设置为对象的实例”

    我有一个 MVC4 Web API 项目 带有实体框架 Code First 数据模型 当我尝试使用数据上下文和模型创建具有读 写方法的新 API 控制器时 我收到一条警告 提示 对象引用未设置到对象的实例 我做了一些搜索 发现一些原因是
  • 导入 cx_Oracle 模块时出错 [Python]

    我使用 Windows 7 64 位和 Oracle 10g 我已经安装了 python 2 7 2 amd64 和 cx Oracle 5 1 10g win amd64 py2 7 当我导入 cx Oracle 模块时 出现此错误 回溯
  • PHP 中的 $_REQUEST

    我有这个代码 message if REQUEST msg new message New User has been added successfully else if REQUEST msg edit message User has
  • 我希望我的用户只能访问我的 php 文件,如果他们尝试访问我想要包含我的页面 404 文件的文件夹

    我有我的请求参数包括我的页面 在我的主页中 如下所示 它工作正常 我包括我的页面很好 但发生了一些问题 我找不到如何解决这个问题 我将尝试用一个例子来解释我的问题 我有一个文件夹 teachers 里面有两个pdf文档和一个页面 docum
  • 在 FCM 中单击通知时打开特定活动

    我正在开发需要显示通知的应用程序 对于通知 我正在使用 FireBase 云消息传递 FCM 当应用程序处于后台时 我能够收到通知 但是当我点击通知时 它重定向到主页 java页 我希望它重定向到通知 java page 那么 请告诉我如何
  • 最好的流量/性能/使用情况监控模块?

    是否有任何开源 或者我猜是商业 软件包可以插入您的站点以进行监控 我想要一些可以连接到我们的 ASP NET 站点并用于提供以下内容的报告的东西 随着时间的推移表现 电流负载 页面流量 SQL性能 PU时间监控 最好是用 C 加上一些性感的
  • 为什么一些包私有类没有被 Proguard 混淆?

    在 Android Studio 3 2 中处理 Android 项目 启用 Proguard 和一些特定规则后 我无法弄清楚以下内容 库模块中由客户端代码使用的特定包 及其子包 通过以下规则保留 keep public class com
  • opencv的waitKey()函数使用其他按键

    我正在开发一个程序 python opencv 其中我使用spacebar转到下一帧 并且Esc退出程序 这是我唯一能用的两把钥匙 我试图找出更多的钥匙 尝试了各种代码 但没有成功 特别是方向键 I found this about wai
  • 可以设计一个正则表达式来确定函数的返回类型吗?

    鉴于text的以下功能 function f3 return Math random gt 0 5 Promise resolve true naaah 是否可以编译正则表达式来确定返回类型f3 调用 而不实际调用该函数 给定代码 我们无法
  • 值更改时Javascript文本框调用事件

    我有一个文本框 每当该框的值发生变化时 我想检查是否输入了 20 位数字 我想我会用onChange事件 但这似乎被解释为onBlurIE 上的事件 所以我想我会用onKeyDown 但是如果用户想要将值粘贴到字段中 那么问题就出现了 那么
  • Ajax 请求返回 200 OK,但会触发错误事件而不是成功

    我已在我的网站上实现了 Ajax 请求 并且正在从网页调用端点 它总是会回来200 OK but jQuery执行错误事件 我尝试了很多东西 但我无法找出问题所在 我在下面添加我的代码 jQuery 代码 var row 1 var jso
  • 删除黑色背景并使Python open cv中的grabcut输出透明

    我一直在尝试使用 python opencv 从抓取输出中删除黑色背景 import numpy as np import cv2 img cv2 imread r myfile 1 png mask np zeros img shape
  • 如何将自定义 SR(语音识别)添加到 Microsoft SAPI

    我有一个针对 X 语言的语音识别应用程序 Microsoft SAPI 不支持此语言 如何将语言 X 的 SR 添加到 Microsoft SAPI 以便我可以通过 Microsoft SAPI 使用它 所以我想知道的是 我可以将自定义 S