我正在构建一个 Web 应用程序并计划同时使用这两个应用程序语音识别 and navigator.getUserMedia用于音频输入。
我注意到我的桌面浏览器(Mac 上的 Chrome,v. 31.0.1650.63)两次请求使用麦克风的权限。虽然这对用户来说可能有点烦人,但语音识别和音频输入似乎都可以工作。
但是,如果我在 Android(Nexus 7、Android v4.4.2;Chrome v31.0.1650.59)上打开同一页面,它会两次请求使用我的麦克风的权限,但我只能使用两者之一(以启动时为准)第一的)。有时,我也会得到语音识别error: "not-allowed"
错误,即使我授予了访问麦克风的权限。
我在这里做了一个 jsFiddle:http://jsfiddle.net/5xBpW/
我的问题是:有没有办法对输入流执行语音识别?或者有没有其他方法可以让这两种功能在 Android 版 Chrome 上运行?
您考虑过其他工具吗? Nuance(由 Ray K 创建,现为 Google 工程部负责人)推出了一款令人兴奋的新工具/产品,它使用专有学习算法(例如机器智能)将语音数据转换为动作。
该工具可以理解上下文并可以将其应用于特定操作,因此用户不必使用确切的短语:
https://developer.nuance.com/public/index.php?task=mix
Tour: https://developer.nuance.com/views/templates/mix/howDoesMixWork/phone/index.html
缺点是您依赖第三方,但由于您正在查看的 API 也是实验性的,这可能会很有趣。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)