语音中的关键字识别[关闭]

2023-11-27

有谁知道有一个免费的关键字识别系统，并且可能提供 API？

CMU Sphinx 4 和 MS Speech API 是语音识别引擎，不能用于 KWS。

SRI有关键字识别系统，但没有下载链接，甚至没有评估。（我什至找不到任何地方可以联系他们获取他们的软件的链接）

我找到了一个here但这是一个演示并且有限。

CMUSphinx在pocketsphinx引擎中实现了关键字识别，详细参见常见问题解答条目。

要识别单个关键词，您可以在“关键词搜索”模式下运行解码器。

从命令行尝试：

pocketsphinx_continuous -infile file.wav -keyphrase “oh mighty computer” -kws_threshold 1e-20

从代码来看：

 ps_set_keyphrase(ps, "keyphrase_search", "oh mighty computer");
 ps_set_search(ps, "keyphrase_search);
 ps_start_utt();
 /* process data */

您还可以在我们的源代码中找到 Python 和 Android/Java 的示例。 Python 代码如下所示，完整示例here:

# Process audio chunk by chunk. On keyphrase detected perform action and restart search
decoder = Decoder(config)
decoder.start_utt()
while True:
    buf = stream.read(1024)
    if buf:
         decoder.process_raw(buf, False, False)
    else:
         break
    if decoder.hyp() != None:
        print ([(seg.word, seg.prob, seg.start_frame, seg.end_frame) for seg in decoder.seg()])
        print ("Detected keyphrase, restarting search")
        decoder.end_utt()
        decoder.start_utt()

必须针对测试数据上的每个关键短语调整阈值，以获得漏检和误报之间的适当平衡。您可以尝试 1e-5 到 1e-50 等值。

为了获得最佳准确性，最好使用 3-4 个音节的关键短语。太短的短语很容易混淆。

您还可以搜索多个关键词，创建一个文件 keyphrase.list，如下所示：

  oh mighty computer /1e-40/
  hello world /1e-30/
  other_phrase /other_phrase_threshold/

并在带有 -kws 配置选项的解码器中使用它。

  pocketsphinx_continuous -inmic yes -kws keyphrase_list

sphinx4 解码器尚未实现此功能。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

API

keyword

speech

语音中的关键字识别[关闭] 的相关文章

Twitter APi“代码”：215，“消息”：“错误的身份验证数据

接收错误 code 215 message 错误的身份验证数据 in my page var dump page 我读到 Friends exist 不再适用于 1 1 版本因此我需要使用 Friends lookup 来比较一个 Twi
使用 Chrome TTS 的 SSML

我试图通过强调等方式让 TTS 句子更加清晰我正在使用Chrome TTS API http developer chrome com extensions tts html 这表明它接受SSML 格式的文档 http www w3 or
获取发送 cURL 请求的用户的 IP 地址

我想获取使用 php 中的 cURL POST 方法向我的服务器发送请求的用户的 IP 地址我正在开发一个 Flight API 我将使用 cURL POST 方法获取请求我必须获取客户端的 IP 地址并验证他的 IP 地址是否可用如
如何将 YouTube API 集成到我的 iPhone 应用程序中？

我想将 YouTube API 集成到我的应用程序中我该怎么做附注我正在为 YouTube 频道制作一个应用程序我尝试以webview 但这让一切变得更糟因为用户可以看到 YouTube 控件搜索等以及有关 YouTube i
使用 SAS EG 通过代理从 API 下载 JSON 文件

我正在尝试使用瑞士当局提供的 API 对公司网络内的地址进行地理编码我的公司使用带有用户名和密码的代理服务器我是 SAS EG 的新手这是我迄今为止拥有的代码我必须匿名一些内容才能被允许在此处发布 filename response
在 AtTask PUT 请求中发送多个更新

我想知道 AtTask 的 API 中是否有一种方法可以在单个 URL 请求中发布多个更新例如我需要更新 1 000 条记录的 extRefID 我是否可以对 API 进行 1 000 次调用就开销而言成本高昂或者我可以使用包含如下
使用 PHP 发布到 Blogger

我在使用 PHP 的 Blogger API 时遇到问题我需要的是能够将新的博客文章发布到我的博客帐户我使用的代码取自 Google API 页面 http code google com intl nl apis blogger do
useState 由于某种原因没有更新？

当我尝试使用 axios 从后端 API 获取一些数据并在由于某种原因获得结果后设置状态时状态不会更新当我尝试使用状态时它只会向我显示一个空数组但有趣的是当我console log res data 它会毫无问题地向我显示我的列表
C++标准API

我是一名学生也是 C 新手我正在寻找与 Java API 一样全面的标准 C API 到目前为止我一直在使用cplusplus com http www cplusplus com and cppreference com https
使用 Bloomberg .Net API 的每小时数据

我正在努力解决使用 Net API 3 0 从 Bloomberg 获取每小时开盘价最高价最低价和最后价格快照的逻辑我已经用谷歌搜索了很多次但没有运气对此的任何帮助将不胜感激我试图在 Bloomberg Net API C 中找
jQuery - 解析 JSON 数据 - 变量名称遇到问题

我第一次深入研究 JSON 数据的使用不过我有一些使用 jQuery 的经验我发布到此 URL tumblr api jyoseph com api read json 我想做的是输出返回的 json 到目前为止我所拥有的 docume
将 Django 模型映射到外部 API

上下文我有一个外部 API 提供数据并允许发布新数据或修补现有数据 API 响应示例 response requests get http api band 4 print response json id 4 name The Beat
从我自己的博客获取帖子[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有任何 API 通过它我可以从 wordpress com 上我自己的博客获取帖子并将它们放在我的
为什么 Kotlin 数据类对象有反引号？

这是我使用 Kotlin 数据类创建器插件创建的数据类 data class ResponseHealthInisghts val data List
如何在WCF Rest服务中从流上传图像

我正在尝试创建 wcf 服务该服务将上传 pdf doc xls 图像等文件但 pdf txt 文件正在上传并正确打开但是当我尝试上传图像文件时文件正在上传但是图像不可见 OperationContract WebInvoke M
Web Api - 不允许捕获 405 方法

截至目前 Web api 应用程序针对 405 方法不允许错误返回以下响应正文我正在尝试更改响应正文但我不知道如何使用委托处理程序 ApiControllerActionSelector 或过滤器谁能帮我捕获服务器端的 405 错误
如何将 Live API for Contacts 的响应中的哈希值转换为文本

我集成了 Live JS api 来获取用户的实时联系人它以哈希格式 email hash 返回电子邮件我如何使用 javascript 或 c net 转换为可读文本非常感谢我遇到了同样的问题并且找到了解决方案您所需要做的就是
使用 PRAW 帮助获取 Reddit 帖子链接到的 URL

我正在尝试使用 Praw 获取 Reddit 提交标题中链接的帖子例如提交 http www reddit com r AdviceAnimals comments 1adu71 apparently people still need
Google Sheets API v4 和 valueInputOption

我的电子表格中有三列第一个是日期第二个和第三个是简单字符串当我批量上传数据时valueInputOption RAW 我的日期列得到错误的结果所有日期前面都有一个看不见的撇号字符串列没问题当我使用valueInputOption
在Wordpress中通过API创建新用户时如何发送电子邮件密码？

可以使用以下行通过 API 创建新用户 user id wp insert user user data 我想知道如何向新创建的用户发送包含其密码的电子邮件 Wordpress API 中是否有任何函数可以处理这项工作还是我应该自己创建并

随机推荐

检查 Python 中是否存在某种*类型*的文件

我意识到这看起来与检查文件是否存在的其他问题类似但它是不同的我正在尝试找出如何检查type文件存在如果不存在则退出我最初尝试的代码是这样的 filenames os listdir os curdir for filename in
如何使用composer安装部分git存储库？

我只想需要 git 存储库的子部分而不是完整的东西我想这样做的原因是因为存储库很大就我而言存储库是 https github com pubnub pubnub api git我只想要 php 目录我在作曲家中定义了以下包 typ
OpenCV功能类似于matlab的“查找”

我正在寻找 openCV 中的一个函数来帮助我制作图像蒙版例如在 MATLAB 中 B A or B 零大小 A B A 10 c 有些功能可以让你通过mask向他们提出论据按照您描述的方式创建面具我认为您正在追求Cmp 或 Cmp
检查 Intent.ACTION_VIEW 上的用户操作

我有一个填充了一些文件的列表视图可以有多种类型如 pdf 或文档当用户单击一个文件时我会获取文件 mime 类型并启动一个意图让用户选择使用哪个应用程序来打开该文件什么我想知道用户是否选择了某些内容或者只是按回键而没有选择任何
在 python 中填充队列并管理多处理

我在 python 中遇到这个问题我有一个 URL 队列需要时不时地检查一下如果队列已满我需要处理队列中的每个项目队列中的每个项目必须由单个进程处理多处理到目前为止我设法手动实现这一点如下所示 while 1 self
带有组合 API 的 Vue 3 事件总线

我已经设置了mitt并尝试将事件分派到另一个组件但我遇到了困难因为在setup 它没有的方法this用于访问应用程序实例这是我尝试过的 import App from App vue const el document getElem
了解用于函数调用的 auipc+jalr 序列

我试图阅读RISC V生成的程序集gcc我发现gcc创建序列auipc jalr对于某些函数调用我不明白它是如何工作的这是一个简单的例子考虑以下C源文件 unsigned long id unsigned long x return
如何重命名数组中对象的键

如何用另一个元素替换数组元素值我有这样的数组不使用 jquery this products text prod1 value 1 text prod2 value 2 text prod3 value 3 我想将文本替换为标签
Qt。自动添加应用程序版本

In a pro文件我可以设置应用程序的版本例如 VERSION
如何在 Android 中使用一台相机创建多个镜头或预览

我想创建像上面这样的东西三个盒子就像相机预览一样关于做什么的任何想法或概念我尝试获取相机的实例并将其放置到三个相机预览对象中但我收到一条错误消息我想这是不允许的这是我的代码 private CameraPreview mPre
WCF 和多个命名空间的问题 - 跨多个服务引用共享对象类型

我有两个网络服务一种具有用户功能一种具有管理功能这两种服务都可以有效地使用相同的对象类型例如 AdminService 提供删除修改 Customer 对象的功能 UserService 提供列出读取 Customer 对象的功
如何在工具提示中自动换行文本

如何对需要出现在工具提示中的文本进行自动换行看起来不直接支持如何对显示的工具提示进行自动换行这是一种使用反射的方法实现这一点 DllImport user32 dll private extern static int SendMe
Java 中的“using”指令

当类型名称太长时在 C 中我可以创建如下别名 using Dict System Collections Generic Dictionary
编译jruby“Hello world”问题

我使用 Ruby 编程已经有一段时间了我真的很喜欢它最近我开始需要编译一些 ruby 代码由于多种原因使用 Ruby2exe 对我来说不是一个选择所以我决定尝试一下 Jruby 生成一个 jar 就足够了我使用的是 Window
Google Chrome 扩展程序中有多个后台脚本？

我的任务是创建一个 Google Chrome 扩展程序到目前为止一切正常但是我希望能够使用多个后台脚本我的意思是 background scripts background js 如果我所说的不清楚而不是创建多个扩展这可能吗
npm install 不安装任何依赖项

我正在尝试安装软件包package json文件不幸的是当我跑步时npm install 什么也没有发生没有安装任何东西我用过npm install在其他存储库上并且它可以成功运行这是我的路径 PATH Users me rben
Ruby 中使用 net-sftp 进行基于密钥的身份验证

我希望能够使用 SFTP 登录多个服务器并下载某些文件以帮助在问题出现时进行调试虽然我们可以使用客户端但我们希望开始自动化流程以简化一切我的第一次尝试看起来像这样 def download files to download des
通过比较行中的列来过滤 Pandas DataFrame

我的数据框中的每一行都有两个日期列如何过滤掉日期 A 在日期 B 之后的行例子 symbol reports at as of signal A 2012 02 15T21 00 00Z 2012 02 01T12 00 00Z 6
强制可选参数使用更广泛的类型，并具有更严格的默认值

有没有办法进行可选参数f足够灵活有类型 a gt b 但仍将其默认为identity 鉴于identity有类型 a gt a 之前的一个问题 begins通过准确地陈述我的问题我想定义一个接受可选参数的函数该参数是一个函数 a g
语音中的关键字识别[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案有谁知道有一个免费的关键字识别系统并且可能提供 API CMU Sphinx 4 和 MS Speech API 是语音识别引擎不能用于 KWS

语音中的关键字识别[关闭]

语音中的关键字识别[关闭] 的相关文章

随机推荐

热门标签