将语音输出解析为 JSON 以调用应用程序 API

2023-12-06

这是一个想法：

我们有带有公开的 Restful API 的 Web 应用程序，它接受 json。现在，如何使用 Google 语音 API 获取用户语音输入，将其转换为文本，然后以某种方式将该文本转换为 API 所需的 JSON，然后使用 JSON 调用这些应用程序 APIe？有没有。将文本翻译为指定的 JSon 格式的库？有人用过这种方法吗？

这称为“意图分析”。有这样的库，例如RASA

例如，您输入的是“显示中国餐馆”。输出将是

{
  "text": "show me chinese restaurants",
  "intent": "restaurant_search",
  "entities": [
    {
      "start": 8,
      "end": 15,
      "value": "chinese",
      "entity": "cuisine"
    }
  ]
}

总的来说，它是相当先进的 NLU。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

artificialintelligence

SpeechRecognition

将语音输出解析为 JSON 以调用应用程序 API 的相关文章

在微调 GPT-2 模型时如何处理堆栈期望每个张量具有相同大小的误差？

我尝试用我的个人信息微调模型所以我可以创建一个聊天框人们可以通过聊天 gpt 了解我但是我得到了错误 RuntimeError 堆栈期望每个张量大小相等但在条目 0 处得到 47 在条目 1 处得到 36 因为我有不同的输入长度
用于转录音频文件中的语音的开源软件[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案谁能推荐可靠的开源软件来在 wav 文件中转录英语语音我研究过的两个主要程序是Sphinx http
自动同义词检测方法

我目前正在研究一种基于神经网络的短文档分类方法由于我正在使用的语料库通常在十个单词左右因此标准统计文档分类方法的用途有限因此我正在尝试对训练中提供的匹配实施某种形式的自动同义词检测更具体地说我的问题是关于解决以下情况假设我有
学习游戏开发，有什么书推荐吗？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
使用 Librosa 生成的频谱图看起来与 Kaldi 不一致？

我使用 Kaldi 的 egs tidigits 代码生成了七话语的声谱图使用 23 个 bin 20kHz 采样率 25ms 窗口和 10ms 偏移通过 MATLAB imagesc 函数可视化的频谱图如下所示我正在尝试使用 L
word2vec gensim 多种语言

这个问题完全超出了我的想象我正在使用 gensim 训练 Word2Vec 模型我提供了多种语言的数据即英语和印地语当我试图找到最接近人的词时我得到的是 model wv most similar positive man O
TypeScript 中的语音识别和语音合成

我能够通过创建如下接口在 TypeScript 中运行 SpeechRecognition 并且工作正常 namespace CORE export interface IWindow extends Window webkitSpeech
帮助--LibSVM 的准确率达到 100%？

名义上这是一个好问题但我很确定这是因为发生了一些有趣的事情作为上下文我正在研究面部表情识别空间中的一个问题因此获得 100 的准确度似乎令人难以置信并不是说在大多数应用程序中这是合理的我猜测数据集中存在一些一致的偏差这使得
为什么A*的复杂度在内存中是指数级的？

维基百科关于 A 复杂度的说法如下链接在这里 http en wikipedia org wiki A search algorithm 比当时更成问题复杂度是A 的内存使用量在最坏的情况也必须记住指数数量的节点我不认为这是正
使用 MinMax 和 Alpha-Beta 剪枝找到最佳移动

我正在为游戏开发 AI 我想使用MinMax算法与Alpha Beta 修剪我对它的工作原理有一个粗略的了解但我仍然无法从头开始编写代码所以我花了两天的时间在网上寻找某种伪代码我的问题是我在网上找到的每个伪代码似乎都是基于寻找最佳
语音识别和语调检测

我想做一个 iOS 应用来计算疑问句我会寻找 WH 问题以及我会吗格式化问题我对语音或音频技术领域不太了解但我Google了一下发现语音识别SDK很少但仍然不知道如何检测和绘制语调是否有支持语调或情感语音识别的 SDK 据我
检查输入时出错：预期 conv2d_1_input 有 4 个维度，但得到形状为 (800, 1000) 的数组

我正在尝试使用 CNN 进行情感分析我的代码我的数据具有 1000 1000 形状当我将数据传递给 convolution2D 时它会抛出一个错误我无法解决我尝试了以下解决方案但仍然面临问题在构建 CNN 时我收到 Kera
我们可以从 MFCC 系数中恢复音频吗？

可以从 MFCC 系数中获取音频信号吗另外 MFCC 系数是否有一个值范围如果有的话是什么如果没有如何将其归一化在 0 到 1 之间我尝试使用以下 MATLAB 代码 http labrosa ee columbia edu m
Encog - 如何加载神经网络的训练数据

The NeuralDataSet我在实际中看到的对象除了 XOR 之外什么都没有它只是两个小数据数组我无法从文档中找出任何内容MLDataSet 似乎所有内容都必须立即加载但是我想循环遍历训练数据直到到达 EOF 然后将其算作
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
机器人探索算法

我正在尝试为机器人设计一种算法试图找到位于未知位置的旗帜该旗帜位于一个包含障碍物的世界中机器人的任务是夺取旗帜并将其带到他的基地代表他的起始位置机器人在每一步只能看到有限的邻域他事先不知道世界是什么样子但他有无限的内存来存储已
使用神经网络包进行多项分类

这个问题应该很简单但文档没有帮助我正在使用 R 我必须使用neuralnet多项式分类问题的包所有示例均针对二项式或线性输出我可以使用二项式输出进行一些一对一的实现但我相信我应该能够通过使用 3 个单元作为输出层来做到这一点其中
深度学习和传统的人工神经网络机器学习有什么区别？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案您能否简要解释一下两者之间的差异深度学习 https developer nvidia com deep learning和利用神经网
在 Android 上使用 pocketsphinx 未检测到关键字

谁能解释一下如何使用 pocketsphinx 将语音转换为文本我试试这个 import com example speechtutor SpeechRecognizerRecorder import com example speech
DPLL算法定义

我在理解 DPLL 算法时遇到一些问题我想知道是否有人可以向我解释它因为我认为我的理解是不正确的我理解的方式是我采用一些文字集如果每个子句都为真则模型为真但如果某些子句为假则模型为假我通过查找单元子句递归地检查模型如果有

随机推荐

如何自动将合约程序集包含在 nupkg 中？

我刚刚开始使用 nuget 为我们公司的内部库创建一些包该库由许多程序集组成其中许多具有从代码合同生成的合同引用程序集我用的是最简单的nuget pack方法就是传入csproj文件路径让它解析项目之间的所有依赖关系问题是它不包
WPF：“ApplicationCommands.New”在 MenuItem 的情况下显示不正确的源

我是 WPF 新手正在查看 net 4 5 中的 Professional WPF 示例在命令章节中有一个示例多个控件可以发送相同的命令我使用按钮复选框和菜单项来触发新建命令我面临的问题是如果第一次按下 MenuItem
从 javascript 对象数组中删除一些属性

我想从 javascript 对象数组中删除一些属性这是对象数组 obj array DATA ID 1 DATA NAME Jim DATA BB TYP 2 DATA MAC 5474 DATA ID 3 DATA NAME Fro
如何使用默认 R 安装通过 conda 安装 rpy2

我在 Ubuntu Linux 上使用 Anaconda Python 发行版并希望在 IPython 笔记本中使用 R 魔法有没有办法使用 conda 发行版安装 rpy2 并使用我当前在 usr bin R 的默认 R 安装我的目
codeigniter 在 find_in_set 中添加 IS NULL

通过生成查询时代码点火器框架 this gt db gt select id memo sent to sent by read by date gt from memos gt where FIND IN SET 1 sent to gt
Zxing有时会从条形码中获取错误的数据

我知道这可能是一个相当简单的问题我们还可以设置 Zxing 扫描的条形码格式如下所示 1 intent putExtra SCAN MODE QR CODE MODE or any other format 如果我们这样做 2 inte
什么时候优化为时过早？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心以获得指导我看到这个词用得很多但我
Xcode 5：代码签名权利错误

我已经构建了一个支持 IOS 7 的新应用程序我获得了新的 XCode 5 GM 并尝试使用我的新配置文件和分发证书来签署我的应用程序但我在分发时遇到了问题我不断收到以下错误无效的代码签名权利您的应用程序中的权利包签名与包含在包
拆分一列字符向量并返回一个列表

我有以下内容数据框 df lt data frame Sl No c 1 6 Variable c a a b a b c b c b c Sl No Variable 1 a 2 a b 3 a b c 4 b 5 c 6 b c 我想将
os/exec StdoutPipe 带颜色

我正在制作一个包装纸我的世界使用 Go 的服务器控制台它使用 os exec 运行服务器和 process StdoutPipe 以获取子进程的实时输出但是由于某种原因我无法让它显示颜色当我直接从终端运行服务器时颜色可以工作但当
如何忽略包含在我的yarn.lock 文件中的包？

因此在我的 package json 中我有一堆 npm 库以及一个从 git ssh url 拉入的私有存储库该存储库需要始终是最新版本该yarn lock添加了git sha和yarn升级等不会获取最新的基本上鉴于此 de
如何通过 Socket 连接接收大数据流 - 没有 TCPClient

我有一个问题我想通过 SocketConnection 发送一个大字符串但我无法立即接收该字符串因为网络限制为 1500 字节那么如何在不使用 TCPClient 的情况下通过 Socket 接收所有字节或者这是不可能的 publ
如何在类路径中使用嵌入表达式

我试图将文件的绝对值传递给类路径的读取函数如果我传递绝对路径和类路径它就可以正常工作但是当我传递嵌入表达式时它不起作用我的代码如下 Scenario create swagger first RAD 给定 url 应用服务器给定参
在 PrintDialog 中以编程方式选择打印机

我在 Windows 窗体中有一个 Web 浏览器控件它加载一个 HTML 文件我希望能够为用户提供将其另存为 PDF 文件的选项如果用户安装了 CutePDF Writer 那么我想我可以通过编程方式从打印对话框中选择它并将其另存为
jQuery 中的 this 和 $(this) 有什么区别？

jQuery 中的 this 和 this 有什么区别我什么时候应该使用哪个 p each function this id this attr id 如果您考虑上面的函数 jQuery 将循环访问页面上的每个段落元素并通过将 this
如何可靠地猜测 MacRoman、CP1252、Latin1、UTF-8 和 ASCII 之间的编码 [重复]

这个问题在这里已经有答案了在工作中似乎每周都会遇到一些与编码相关的忧虑灾难或灾难该问题通常源于程序员认为他们可以在不指定编码的情况下可靠地处理文本文件但你不能因此决定从今以后禁止文件名以以下结尾 txt or text 人们
错误“‘git’未被识别为内部或外部命令”

我安装了 Windows 版 Git 但是当我尝试使用git命令提示符中的命令我收到以下错误 git is not recognized as an internal or external command operable progra
是否可以从列表中的项目获取索引？

我的意思是我有一个列表框我将列表放入 itemsSource 属性中我还想显示它的绑定中的索引我不知道这在 WPF 中是否可行谢谢有几种方法可以做到这一点包括使用 AlternationIndex 的一些解决方法但是由于我
iOS，将文件从收件箱文件夹复制到文档路径

我启用了文档类型以将文件从其他应用程序导入或复制到我的应用程序我有一些疑问 1 应该在哪里创建将文件从收件箱移动到文档目录的方法这是正确的地方吗 func applicationWillEnterForeground applicati
将语音输出解析为 JSON 以调用应用程序 API

这是一个想法我们有带有公开的 Restful API 的 Web 应用程序它接受 json 现在如何使用 Google 语音 API 获取用户语音输入将其转换为文本然后以某种方式将该文本转换为 API 所需的 JSON 然后使用

将语音输出解析为 JSON 以调用应用程序 API

将语音输出解析为 JSON 以调用应用程序 API 的相关文章

随机推荐

热门标签