我正在使用 Assistant SDK 中的 python 库通过 gRPC 进行语音识别。我已识别语音并以调用该方法的字符串形式返回resp.result.spoken_request_text
from \googlesamples\assistant\__main__.py
我通过助理 API 得到了答案作为音频流,方法如下resp.audio_out.audio_data
也来自\googlesamples\assistant\__main__.py
我想知道是否也可以从服务中获得字符串形式的答案(希望它在服务定义中可用或可以包含在内),以及如何访问/请求字符串形式的答案。
提前致谢。
目前(Assistant SDK Developer Preview 1),没有直接的方法可以做到这一点。您可能可以将音频流输入语音转文本系统,但这确实开始变得愚蠢。
在 Google I/O 大会上与工程师谈论这个主题时,他们表示这样做会遇到一些技术上的复杂性,但他们了解用例。他们需要看到这样的问题才能知道人们想要该功能。
希望它将进入即将到来的开发者预览版。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)