语音识别和 getUserMedia

2023-11-24

我正在构建一个 Web 应用程序并计划同时使用这两个应用程序语音识别 and navigator.getUserMedia用于音频输入。

我注意到我的桌面浏览器(Mac 上的 Chrome,v. 31.0.1650.63)两次请求使用麦克风的权限。虽然这对用户来说可能有点烦人,但语音识别和音频输入似乎都可以工作。

但是,如果我在 Android(Nexus 7、Android v4.4.2;Chrome v31.0.1650.59)上打开同一页面,它会两次请求使用我的麦克风的权限,但我只能使用两者之一(以启动时为准)第一的)。有时,我也会得到语音识别error: "not-allowed"错误,即使我授予了访问麦克风的权限。

我在这里做了一个 jsFiddle:http://jsfiddle.net/5xBpW/

我的问题是:有没有办法对输入流执行语音识别?或者有没有其他方法可以让这两种功能在 Android 版 Chrome 上运行?


您考虑过其他工具吗? Nuance(由 Ray K 创建,现为 Google 工程部负责人)推出了一款令人兴奋的新工具/产品,它使用专有学习算法(例如机器智能)将语音数据转换为动作。

该工具可以理解上下文并可以将其应用于特定操作,因此用户不必使用确切的短语:

https://developer.nuance.com/public/index.php?task=mix

Tour: https://developer.nuance.com/views/templates/mix/howDoesMixWork/phone/index.html

缺点是您依赖第三方,但由于您正在查看的 API 也是实验性的,这可能会很有趣。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

语音识别和 getUserMedia 的相关文章

随机推荐