如何从 Google Assistant 接收答案作为字符串，而不是音频流

2024-03-09

我正在使用 Assistant SDK 中的 python 库通过 gRPC 进行语音识别。我已识别语音并以调用该方法的字符串形式返回resp.result.spoken_request_text from \googlesamples\assistant\__main__.py我通过助理 API 得到了答案作为音频流，方法如下resp.audio_out.audio_data也来自\googlesamples\assistant\__main__.py

我想知道是否也可以从服务中获得字符串形式的答案（希望它在服务定义中可用或可以包含在内），以及如何访问/请求字符串形式的答案。

提前致谢。

目前（Assistant SDK Developer Preview 1），没有直接的方法可以做到这一点。您可能可以将音频流输入语音转文本系统，但这确实开始变得愚蠢。

在 Google I/O 大会上与工程师谈论这个主题时，他们表示这样做会遇到一些技术上的复杂性，但他们了解用例。他们需要看到这样的问题才能知道人们想要该功能。

希望它将进入即将到来的开发者预览版。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

googleassistantsdk

googleassistapi

如何从 Google Assistant 接收答案作为字符串，而不是音频流的相关文章

python：查找围绕某个 GPS 位置的圆的 GPS 坐标的优雅方法

我有一组以十进制表示的 GPS 坐标并且我正在寻找一种方法来查找每个位置周围半径可变的圆中的坐标这是一个例子 http green and energy com downloads test circle html我需要什么这是一个圆
是否有解决方法可以通过 CoinGecko API 安全检查？

我在工作中运行我的代码一切都很顺利但在不同的网络家庭 WiFi 上我不断收到403访问时出错CoinGecko V3 API https www coingecko com api documentations v3 可以观察到在
如何手动计算分类交叉熵？

当我手动计算二元交叉熵时我应用 sigmoid 来获取概率然后使用交叉熵公式并平均结果 logits tf constant 1 1 0 1 2 labels tf constant 0 0 1 1 1 probs tf nn sigm
使用 python requests 模块时出现 HTTP 503 错误

我正在尝试发出 HTTP 请求但当前可以从 Firefox 浏览器访问的网站响应 503 错误代码本身非常简单在网上搜索一番后我添加了user Agent请求参数但也没有帮助有人能解释一下如何消除这个 503 错误吗顺便说一句
为什么从 Pandas 1.0 中删除了日期时间？

我在 pandas 中处理大量数据分析并每天使用 pandas datetime 最近我收到警告 FutureWarning pandas datetime 类已弃用并将在未来版本中从 pandas 中删除改为从 datetime 模块
如何用python脚本控制TP LINK路由器

我想知道是否有一个工具可以让我连接到路由器并关闭它然后从 python 脚本重新启动它我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器但是
删除flask中的一对一关系

我目前正在使用 Flask 开发一个应用程序并且在删除一对一关系中的项目时遇到了一个大问题我的模型中有以下结构 class User db Model tablename user user id db Column db String
Python zmq SUB 套接字未接收 MQL5 Zmq PUB 套接字

我正在尝试在 MQL5 中设置一个 PUB 套接字并在 Python 中设置一个 SUB 套接字来接收消息我在 MQL5 中有这个 include
使用 xlrd 打开 BytesIO (xlsx)

我正在使用 Django 需要读取上传的 xlsx 文件的工作表和单元格使用 xlrd 应该可以但因为文件必须保留在内存中并且可能不会保存到我不知道如何继续的位置本例中的起点是一个带有上传输入和提交按钮的网页提交后文件被捕获req
Docker 中的 Python 日志记录

我正在 Ubuntu Web 服务器上的 Docker 容器中测试运行 python 脚本我正在尝试查找由 Python Logger 模块生成的日志文件下面是我的Python脚本 import time import logging
javascript 是否有等效的 __repr__ ？

我最接近Python的东西repr这是 function User name password this name name this password password User prototype toString function r
Jupyter Notebook 找不到 Python 模块

不知道发生了什么但每当我使用 ipython 氢原子或 jupyter 笔记本时都找不到任何已安装的模块我知道我安装了 pandas 但笔记本说找不到我应该补充一点当我正常运行脚本时 python script py 它确实导入
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
如何使用原始 SQL 查询实现搜索功能

我正在创建一个由 CS50 的网络系列指导的应用程序这要求我仅使用原始 SQL 查询而不是 ORM 我正在尝试创建一个搜索功能用户可以在其中查找存储在数据库中的书籍列表我希望他们能够查询书籍表中的 ISBN 标题作者列目前它
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
Scipy Sparse：SciPy/NumPy 更新后出现奇异矩阵警告

我的问题是由大型电阻器系统的节点分析产生的我基本上是在设置一个大的稀疏矩阵A 我的解向量b 我正在尝试求解线性方程A x b 为了做到这一点我正在使用scipy sparse linalg spsolve method 直到最近一切都
Django-tables2 列总计

我正在尝试使用此总结列中的所有值文档 https github com bradleyayers django tables2 blob master docs pages column headers and footers rst 但页
更改 Tk 标签小部件中单个单词的颜色

我想更改 Tkinter 标签小部件中单个单词的字体颜色我知道可以使用文本小部件来实现与我想要完成的类似的事情例如使单词 YELLOW 显示为黄色 self text tag config tag yel fg clr yellow s
Kivy - 单击按钮时编辑标签

我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo

随机推荐

在执行过程中停止 Rhino 引擎

Rhino 引擎是否有一个 api 可以停止执行脚本fie在中间例如我有一个脚本文件其中有一个无限循环怎样才能中途停止执行呢当然我可以停止启动Rhino引擎的jvm 执行脚本但我不想因为这个原因终止整个 jvm 会话因为
Javascript 排序以匹配 SQL Server 排序

任何人都可以向我指出 JavaScript 中的排序算法该算法的排序方式与 SQL Server 的排序方式相同对于 nvarchar unicode 列作为参考我之前关于此行为的问题可以在这里找到 SQL Server 2008
像 RStudio 这样的 Python 工作流程？

我使用 Python 作为主要编程语言有时会切换到 R 来执行快速数据分析任务因为它具有用于统计编程目的的庞大库尽管pandas http pandas pydata org 对于 python 来说太棒了我猜大多数 R 用户都会选
无法在 Android 模拟器中模拟位置数据

我正在尝试测试我的应用程序它使用模拟器使用地理定位介绍了几种方法here https stackoverflow com questions 2279647 how to emulate gps location in the andr
如何在数字数组中找到最佳匹配元素？

我需要帮助解决一些看似简单但让我困惑的事情尝试编写一些模糊匹配方法来处理根据需要计算的值与选择列表中实际可用的值之间的格式差异价值期权执行价格始终是计算出的 Float 例如85 0 or Int 该数组包含字符串形式的数字无论是
Jackson deearlization：根上有两个键。我如何打开其中一个并忽略另一个？

使用杰克逊 2 x json 响应如下所示 flag true important id 123 email email protected cdn cgi l email protection flag 键不提供任何有用的信息我想忽略
为什么 C++ 编译器在创建机器代码之前将源代码翻译成汇编？ [复制]

这个问题在这里已经有答案了我开始学习C 了解到编译器通过编译将源代码从程序变成机器代码然而我了解到 C 编译器实际上将源代码转换为汇编代码作为将汇编代码转换为机器代码之前的中间步骤这一步的目的是什么他们为什么不直接将其翻译成机器
Reactjs/Apollo/AppSync 突变触发两次

我遇到了 React Apollo AppSync 的问题突变触发了两次或多次我有一个 React 应用程序它有一个由通常的 UI 按钮 onClick 触发的更新突变
VS2012 发布网站 dll 而不是 cs 文件

我有一个想要发布的简单 ASP NET 项目我右键单击该项目并按发布网站但这会将我的所有 cs 文件生成到所选文件夹中之前我一直在 bin 文件夹中获取 dll 文件而不是 cs 文件我究竟做错了什么问题可能出在发布设置中请检
Javascript：检测 OS X“自然滚动”设置

我面临一个问题对于我正在做的项目我正在检测滚轮位置并根据该位置是否导航到下一张幻灯片然而一个问题是一些 Mac 用户使用自然滚动反转页面上的滚动这意味着对于这些用户我应该使用另一个方向的滚动作为触发器我的问题是有没
在 VB.NET 中将 ArrayList 数据绑定到 ListBox？

我在 VB NET 工作我有一个名为 Invoices 的 ArrayList 其中填充了 Invoice 类的对象我想将其数据绑定到 ListBox 以便随着 ArrayList 的内容更新并更改 ListBox 的更新我已经在 I
如何使用shell脚本访问mysql数据库？

有没有办法使用 shell 脚本访问 MySQL 数据库想要对多个表进行一些选择和插入如果您能提供一些示例代码那就太好了因为我是脚本编写新手这个链接似乎有你想要的信息 http www cyberciti biz faq usin
Android SQLite 中的多线程怎么样？

在我的应用程序中我必须实现一些 UI 和同步服务它在后台运行并更新数据同步服务并不是很简单它使用了多线程所以这是我的故事当我开始开发这个应用程序时我对sqlite一无所知所以我只是没有在Java中使用任何线程同步结果我
Qt 我可以在构造函数中将信号/槽连接到自身吗？

编辑与信号插槽连接无关问题是构造函数调用构造函数可能有更好的方法来做到这一点我有兴趣听到这些我有从 QLabel 派生的 MyClass 我想在信号中传递更多有关派生类的数据而不是基本信号的数据因此我创建了一个插槽来拦截
元音计数顺序

这不是一个家庭作业问题而是一个考试准备问题我应该定义一个函数syllables word 计算音节数一句话如下元音的最大序列是一个音节最终e在一个单词中不是一个音节或者它是元音序列的一部分的我不必处理任何特殊情况例如最终的
SQL - 将每个单词的第一个字母大写

我知道这个线程到处都存在但是这是一个略有不同的情况在我公司使用的套件中我对 SQL 的访问权限有限无法运行具有函数等的复杂代码我有一个 SQL 查询将多个列上的数据编译为一列并使用 group by 子句来消除多重性然而
TSQL RIGHT 字符串函数不起作用

我无法理解为什么正确的功能不适合我我试图在这里容纳尽可能多的输出如果阅读起来令人困惑我深表歉意 DECLARE Nbr VARCHAR 27 SELECT Nbr xmz nbr FROM xml temp AS xmz SELECT
要显示此页面，Firefox 必须发送将重复之前执行的任何操作（例如搜索或订单确认）的信息

嘿我收到了 Firefox 的确认 To display this page Firefox must send information that will repeat any action such as a search or or
Cargo 是否可以在不构建应用程序的情况下下载并构建依赖项？

有没有办法告诉Cargo http doc crates io guide html安装和构建我的所有依赖项但不尝试构建我的应用程序我想cargo install会这样做但实际上它也一直用于构建我的应用程序我想要达到一个状态carg
如何从 Google Assistant 接收答案作为字符串，而不是音频流

我正在使用 Assistant SDK 中的 python 库通过 gRPC 进行语音识别我已识别语音并以调用该方法的字符串形式返回resp result spoken request text from googlesamples as

如何从 Google Assistant 接收答案作为字符串，而不是音频流

如何从 Google Assistant 接收答案作为字符串，而不是音频流 的相关文章

随机推荐

热门标签

如何从 Google Assistant 接收答案作为字符串，而不是音频流的相关文章