服务器端语音识别[关闭]

2023-11-25

有人知道已经托管的任何好的服务器端语音识别引擎吗? IE。我希望能够调用一个简单的 Web API 来发布一些声音数据并获取文本。不一定是免费的——但希望可以自由地进行实验。


有多种 IVR 服务将整个 VOIP 会话(电话呼叫)作为一个完整的应用程序托管,而不是“按菜单点菜”提供单独的服务交易。如果您想让您的程序看起来像 VOIP 呼叫,您也许可以使用其中一些服务来完成它。

Voxeo发表了免费(且低成本)IVR 托管提供商列表面向有限使用的开发人员。毫不奇怪,所有这些都需要注册。

  • VoiceGenie Developer Workshop (absorbed into Genesys)
  • Loquendo C@fé status unknown
  • Nuance Café (Bevocal) now Nuance On-Demand
  • Plum Voice Hosting now Plum DEV
  • VOICE社区的VOICE测试中心

另一种可能性是直接询问Vlingo, Twilio, or Tropo因为他们可能会卖给你你所需要的东西。

更新:2012 年 7 月 25 日

AT&T 宣布推出语音API在 。您向其发送音频 – 它会返回 XML 或 JSON 数据格式的文本。也可以看看开发者网站.

更新:2012 年 8 月 27 日

另一种可能性是龙移动SDK来自 Nuance,它的目标客户是寻求 API 的个人开发人员,该 API 可为消费者应用程序提供语音和/或文本转语音功能。

更新:2012 年 9 月 21 日

似乎有几个新的提供商提供exactly您正在寻找什么:语音样本输入,文本输出。以下列出了可编程网络:

  • iSpeech
  • 语音API
  • OneTok
  • 思语API
  • NexiWave

另请注意Loquendo现在是 Nuance 的一部分。

更新:2013 年 6 月 27 日

AT&T 的语音 API 有一个一些有针对性的 SDK (Android、iOS、PhoneGap、Titanium、Windows) - 其中一些托管在GitHub。甚至还有Unity 3D 演示的源代码.

更新:2014 年 1 月 23 日

OneTok已将其产品重新设计为 SDKiOS and Android.

显然是声音精灵产品已被彻底消化Genesys以至于几乎找不到它的踪迹。鉴于 Genesys 面向大型企业的定位,很难知道他们是否有任何小批量或商品产品。

梅花之声似乎扩大了他们的产品范围。

和之前的许多人一样,Vlingo现在是 Nuance 的一部分。

(我尝试更新原始答案中任何损坏的链接。)

更新:2015 年 10 月 31 日

保持这个答案是最新的是一项西西弗斯式的任务。

免费(且低成本)IVR 托管提供商的 Voxeo 列表现在重定向至,完全披露,我现在在其中有实质性参与,因此,我无法在不质疑我的可信度的情况下提供几乎任何内容的链接。

也就是说,语音/NLP 市场上有很多参与者。尽职尽责。

更新:2016 年 4 月 8 日

So now 谷歌彻底颠覆了苹果购物车.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

服务器端语音识别[关闭] 的相关文章

  • 语音识别引擎未在 Windows 服务中触发事件

    所以我有一个使用 system speech 识别引擎实现语音识别的 Windows 服务 当我启动服务时 我的语音识别代码运行良好 但没有语音识别火灾事件 奇怪的是 如果我运行完全相同的代码 但在控制台或 WPF 应用程序中 则语音识别的
  • 离线语音识别时出现错误 ERROR_RECOGNIZER_BUSY

    我对谷歌离线语音识别进行了研究 但它在 google Nexus 5 操作系统 4 4 中工作正常 但如果我在三星 Galaxy s5 操作系统 5 0 中实现相同的版本 它无法识别并且显示此错误 8 ERROR RECOGNIZER BU
  • 在 iOS 上通过 上传存储在云服务上的文件 0 字节

    我无法弄清楚为什么某些从 iOS 上传到我们服务器的内容会导致空文件 上传页面是一个简单的表单 使用 POST 和 enctype 作为 multipart form data 该问题似乎仅在用户执行以下操作时才会出现 正在使用 iOS 尝
  • 使用 Phonegap 在 Android 上启动语音识别器

    目前我正在制作一个 Phonegap 应用程序 我想将增强现实与语音输入结合起来 Phonegap 有一个名为 SpeechRecognizer 的插件 但我无法让它工作 我的标题
  • 当 DHT 中的节点死亡时,数据会发生什么?

    问题取自这里 https groups google com forum topic byu cs 460 computer networking hpESI0NapmY https groups google com forum topi
  • 将输入流式传输到 System.Speech.Recognition.SpeechRecognitionEngine

    我正在尝试从 TCP 套接字在 C 中进行 流式 语音识别 我遇到的问题是 SpeechRecognitionEngine SetInputToAudioStream 似乎需要一个可以查找的定义长度的流 现在 我能想到的实现这项工作的唯一方
  • AWS Cloudformation:将环境变量作为参数传递给 lambda 函数

    我正在为 lambda 创建云层 我想要一个创建 lambda 的通用 lambda 脚本 我从外部注入 环境 参数时遇到问题 我想将键值对对象作为参数传递 有人可以告诉我该怎么做吗 我在下面突出显示了它 Variables String
  • 混合 http/https 站点

    到目前为止 我的 https 部署通常涉及使用 https 对整个站点进行简单锁定 并在 Web 服务器上提供 http 到 https 的重定向 我现在计划拥有一个 ASP NET MVC 站点 在云上 其中包含 http 和 https
  • 为什么 SpeechRecognizer 突然停止工作?

    我的 Android 应用程序 Xamarin 使用语音识别 这在 Android 8 11 和 12 的智能手机上运行良好 几周以来 我的应用程序的语音识别已停止在 Android 11 上运行 测试了 2 种不同的智能手机 在Andro
  • 多个环境中的 Azure 云服务项目配置(.csdef 和 .cscfg)

    目前我们有一个开发云服务 acme dev service 和一个生产云服务 acme prod service 我们解决方案中当前的设置有一个名为 acme application 的云服务项目 它使用 cscfg 和 csdef 文件的
  • 是否可以使用Dropbox、Google Drive、Skydrive等作为服务器空间?

    我正在创建一个在线连接到服务器以收集信息的应用程序 为了节省从大公司租用服务器空间的费用 我想知道这些免费服务 Dropbox Google Drive Microsoft Skydrive Amazon Cloud 等 是否可以用作服务器
  • 如何使 cloud-init 启动脚本在每次 EC2 实例启动时运行?

    我有一个运行基于 Amazon Linux AMI 的 AMI 的 EC2 实例 与所有此类 AMI 一样 它支持云初始化 https help ubuntu com community CloudInit用于根据传递到每个实例的用户数据运
  • 如何在 Windows Azure 上部署 Java 应用程序

    您好 我是一名计算机科学专业三年级学生 我已经在 netbeans 上用 java 创建了一个三年级项目 现在我想将其部署到带有 windows azure 的虚拟机上 重点是 我希望能够在任何连接到互联网的计算机上使用这个应用程序 只需访
  • Amazon s3 putObject 标记不起作用

    我正在尝试使用 putObject 方法上传到 Amazon s3 时添加标签 根据文档 我已将标签创建为字符串类型 我的文件已上传到 Amazon s3 但我无法使用提供的标签数据查看文件对象的对象级别标签 根据文档遵循以下代码示例 va
  • 浏览器上的连续语音识别,例如“ok google”或“hey siri”

    我正在做一个 POC 我的要求是我想实现这样的功能OK google or Hey Siri在浏览器上 我正在使用 Chrome 浏览器Web speech api 我注意到我无法继续识别 因为它会在一段时间后自动终止 而且我知道出于安全考
  • 如何从 JavaScript 使用 Opus 编解码器

    我想看看是否可以使用直接访问 OpusgetUserMedia或最新浏览器中的任何类似内容 我对此进行了很多研究 但没有取得好的结果 我知道 Opus 或 Speex 实际上用于webkitSpeechRecognitionAPI 我想做语
  • 使用 get/post 的免费云数据存储? [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我知道还有其他类似的键 值存储http openkeyval org http openkeyval o
  • 为什么使用 no-op 来填补 paxos 事件之间的空白是合法的?

    我正在学习Paxos算法 http research microsoft com en us um people lamport pubs paxos simple pdf http research microsoft com en us
  • java中的语音识别

    我想在我的项目中使用语音识别 我找到了这段代码 但是当我运行它时 我收到一个错误 run java lang NullPointerException at newpackage HelloWorld main HelloWorld jav
  • 语音识别编程问题入门

    所以 你们可能都看过 钢铁侠 其中托尼与一个名为贾维斯的人工智能系统进行交互 演示剪辑here http www youtube com watch v Go8zsh1Ev6Y 抱歉 这是广告 我非常熟悉 C C 和 Visual Basi

随机推荐

  • Reflection API 是否破坏了数据封装的初衷?

    最近我遇到了 Reflection API 令我惊讶的是我们可以访问甚至更改私有变量 我尝试了以下代码 import java lang reflect Field public class SomeClass private String
  • 常见的 Lisp 错误:“应该是 lambda 表达式”

    几天前我刚刚开始学习 Common Lisp 我正在尝试构建一个将数字插入树中的函数 我收到一个错误 SYSTEM EXPAND FORM CONS NIL LST 应该是 lambda 表达式 通过谷歌搜索 似乎当你有太多括号时就会发生这
  • 如何为应用程序图标提供没有数字的通知徽章?

    Apple 的本地和推送通知编程指南第 7 页上有一张 iPhone 桌面的屏幕截图 其中一个应用程序图标有一个不包含数字的徽章 它只是纯红色 怎么可能做到这一点呢 我认为当前的通知 API 无法实现您想要做的事情 如果要在应用程序图标上显
  • WebAPI StreamContent 与 PushStreamContent

    我正在实施一个MVC4 WebAPI 版本的 BluImp jQuery 文件上传在我最初的尝试中 一切都运行良好 但我试图确保在下载非常大的文件 2GB 时充分利用内存 我读了Filip Woj 关于 PushStreamContent
  • 在android studio中打开和导入项目的区别

    在android studio中打开和导入项目有什么区别 有没有一种方法可以从命令行导入项目或进行导入项目时完成的所有设置 OPEN是打开已经在Android Studio中运行的现有项目 IMPORT用于将项目从其他环境迁移到 Andro
  • 允许 hgsubversion SVN 克隆推迟所需的步骤

    我所在的团队主要使用 SVN 而我更喜欢在可能的情况下使用 Mercurial 我使用 hgsubversion 设置了 SVN 存储库的 hg 克隆 并且几个基本的拉取 提交 推送似乎运行良好 现在 经过 2 周的本地开发 在此期间 我合
  • javascript中的继承,“父”中的变量

    我是第一次做 OO javascript 我读过有关继承和原型的内容 并认为我已经破解了它 直到我发现了这个小例子 function TestObject data this test array this clone array this
  • 在 Liquid/Jekyll 中对日期格式进行排序(例如“1st”、“3rd”和“4th”)

    是否可以在 Liquid 或 Jekyll 中的日期格式中添加月份后缀 例如 1 月 23 日或 5 月 18 日 我已经提到了Shopify 维基 但我很惊讶地发现那里没有格式 当然应该有这么简单的事情吗 Liquid 模板引擎Jekyl
  • Sql Server 2008 的更改通知

    我有一个由数据库和多个服务组成的应用程序 其中一项服务将信息添加到数据库 由用户触发 另一项服务定期查询数据库以了解更改 并使用新数据作为处理的输入 到目前为止 我使用了一个可配置的计时器 每 30 秒左右查询一次数据库 我读到了有关 Sq
  • 如何将多模块maven项目组装成一个WAR?

    类似问题here 我想从 3 个不同的 Maven 模块中部署一个生成的 WAR 战争模块绝对不冲突 第一个包含 Java 类和一些 WEB INF artifacts 第二个只是 API 接口 必须已经存在于容器中或者是由此产生的战争的一
  • 大约一天后,Service Broker 消息开始挂起

    我有一个使用 Service Broker 的应用程序是 SQL 2008 大约每天一次 数据库的性能开始受到明显的影响 我确定这是由 Service Broker 造成的 如果我使用以下命令硬重置所有代理连接 ALTER DATABASE
  • 获取可排序 jQuery 中拖动列表项的 ID

    我有这个html ul li First li li Second li li Third li ul 和这个 sortable jQuery function listofpages sortable 如何获取被拖动元素的id 在 的里面
  • 从 IEnumerable 转换为列表 [重复]

    这个问题在这里已经有答案了 我想转换自IEnumerable
  • 如何设置 eclipse.ini -vm 选项?

    我安装了Maven插件Eclipse 然后我收到如下错误 请确保 eclipse ini 中的 vm 选项指向 JDK 我该如何使用 vm在 eclipse ini 中选择指向我的 JDK 我的解决方案是 vm D work Java jd
  • 使用 PHP 将 jpg 图像转换为 gif、png 和 bmp 格式

    如何使用 PHP 将单个 jpg 图像转换为 3 种不同的图像格式 gif png 和 bmp 您首先从文件中创建一个图像对象imagecreatefromjpeg 然后 您将该对象转储为不同的格式 使用图像gif 例如 imageObje
  • 使用 ng-repeat 进行 Angularjs 表排序

    我有一个 HTML 表格 想要对我的记录进行排序 scope records在 ctrl 中 通过单击表标题 scope headers在 ctrl 中 任何人都可以解释为什么它有效 th a headers 0 a th th a hea
  • git 预提交钩子代码格式化与部分提交?

    有没有办法有一个预提交钩子来自动格式化代码 对于 示例与astyle 但是确实not销毁部分提交 工作流程 edit a file txt git add p file txt add one chunk but not another g
  • 如何在 Swift 中获得 Bool 的相反值?

    我的具体情况是我正在尝试切换导航栏的隐藏和显示 let navHidden self navigationController navigationBarHidden self navigationController setNavigat
  • iOS - 如何发出 SOAP 请求并接收关注响应

    我知道网络上有很多关于 如何在 iOS 中使用 SOAP 的内容 但我仍然未能遵循 SOAP 请求和响应 非常感谢帮助 我用的是简单的NSURLConnection用于请求和响应 SOAP 请求 POST asmx HTTP 1 1 Hos
  • 服务器端语音识别[关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 目前不接受答案 有人知道已经托管的任何好的服务器端语音识别引擎吗 IE 我希望能够调用一个简单的 Web API 来发布一些声音数据并获取文本 不一定是免费的 但希