有没有办法将音频文件发送到语音转文本识别

2023-11-25

我想要 Android 语音识别系统分析音频文件,而不是来自麦克风的默认传入语音。

有什么办法可以做到这一点吗?

谢谢。


cmusphinx.sourceforge.net/wiki/tutorialandroid 刚刚发现该链接听起来像是有人创建了 Android 版本的 Sphinx。

查看 Android api 似乎不支持这样做。 (http://developer.android.com/reference/android/speech/package-summary.html)

您也许可以使用其他 API。

我知道 Microsoft 的 C# api 允许这样做,但为了使其有用,您可能需要使用您编写的程序设置服务器,在手机上录制声音文件,然后将其发送到服务器。

CMUSphinx(http://cmusphinx.sourceforge.net/wiki/)是用 Java 编写的,因此可能可以在 Android 设备上运行。在该 api 上,您创建一个 StreamSpeechReconizer。

StreamSpeechRecognizer recognizer = new StreamSpeechRecognizer(configuration);
recognizer.startRecognition(new File("speech.wav").toURI().toURL());
SpeechResult result = recognizer.getResult();
recognizer.stopRecognition();

我找到了这个https://gist.github.com/alotaiba/1730160通过快速网络搜索(谷歌“语音识别 API 接受文件”),因此网络上可能有其他可用的服务可以接受发送给他们的文件。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

有没有办法将音频文件发送到语音转文本识别 的相关文章

随机推荐

  • 查询字符串反应路由器路径

    我正在使用react router 3 0 2并尝试使用查询字符串配置路由器路径 这就是我配置路由器的方式
  • 如何在 java 上更新 JSONArray 值

    谁能帮助我 我是java编程新手 假设我有 JSONArray 其中包含以下数据 STATUSUPDATE 0 IDSERV 2 STATUSUPDATE 0 IDSERV 3 STATUSUPDATE 0 IDSERV 1 如何更新STA
  • 在 jquery.ready 之后加载 javascript 文件

    我想在 jquery ready 末尾加载一个 javascript 文件 以便我的就绪处理程序中的代码不必等到加载这个大的 javascript 文件后才执行 我的 jquery ready 代码根本不依赖于这个 javascript 文
  • Google Maps API V3:如何获取区域边界坐标(折线)数据? [复制]

    这个问题在这里已经有答案了 我试图从 Google 地图获取 指定的 区域边界作为 GMaps 坐标 以形成折线 这在某种程度上可能吗 来自maps google com或我自己域中的我自己的GMap Note 我知道您可以使用专用工具手动
  • 制作半色调图像的算法?

    什么是制作半色调图像的好算法 例如this 快速谷歌搜索会带来一堆关于这个主题的论文 但很难判断哪些是好的 有效的等 有没有最好的选择来做这种事情 过滤至您想要的分辨率 想要将 点 分开 获取平均强度 该区域中的像素组 绘制点 使得曲面 点
  • C++ 类中对象计数的静态变量?

    我希望有一个静态成员变量来跟踪已创建的对象的数量 就像这样 class test static int count 0 public test count 这是行不通的 因为根据 VC 的说法 a member with an in cla
  • python 3.5 asyncio和aiohttp Errno 101网络无法访问

    我在 Ubuntu 16 上使用 python 3 5 我正在尝试使用 aiohttp 编写一个简单的客户端 这是我的代码 我把它从here 这是第一个代码示例 禁用了 ssl 检查 import aiohttp import asynci
  • 如何使单词边界 \b 与破折号不匹配

    我将代码简化为我遇到的具体问题 import re pattern re compile r bword b result pattern sub lambda x match word word 我正进入 状态 match match 但
  • 从屏幕中心获取位置 Swift MapKit

    我是 Swift 编程新手 我正在尝试构建一个应用程序 我可以使用 MapKit 和 Swift 2 获取视图中心的坐标 我已经可以获得当前位置 但如果我在地图上移动 我需要将位置设置为新点 该点将成为屏幕的中心 你能帮我解决这个问题吗 R
  • Swift 将每隔一个项目追加到数组中

    我有一个快速数组 Monthdata 我想将每个第二个值附加到我的月份数组中 var monthData let months Jul 12 Aug 12 Sep 12 Oct 12 for month in months self mon
  • 离开作用域时调用函数

    离开作用域时自动调用函数的最优雅的解决方案是什么 我目前的方法 见下文 works但我想应该有一些更通用的东西 比如为此编写一个自定义类 include
  • 为什么函数需要在定义或使用之前声明?

    在 C 中它是可选的 在C 中一 MUST 在使用 定义函数之前声明它 为什么会这样呢 有什么需要吗 我们不会在 C 或 Java 中这样做 有趣的是当我们在的时候defining一个函数 即使定义本身有一个声明 我们也需要声明 天知道为什
  • ActionScript 中的语法突出显示库

    我让用户在我的 Flex3 Flash 10 应用程序中输入一些代码 我想进行语法突出显示 有没有开源库可以帮助我 我需要 Lua 语法支持 但如果库有一个合理的接口来执行此操作 我可以自己添加它 2009 年 1 月 21 日更新 查看A
  • 如何本地化 Django 应用程序的内容

    嘿 我目前正在为我的学习开发一个 django 应用程序 并且已经到了 l18n 的地步 本地化网站本身非常容易 但现在我必须允许用户翻译应用程序的动态内容 用户可以将 产品 保存在数据库中并为其提供名称和描述 但由于整个站点应该本地化 因
  • R 在 Mac OS X Yosemite 中冻结

    我遇到了这个问题 并且没有关于如何解决这个错误的明确解释 每当我尝试保存使用 R 内部编辑器编写的文件时 OS X Mavericks 的最新版本 R v 3 1 2 就会在 Yosemite 中冻结 当您尝试时它也会冻结source一个函
  • 将 URL 解码为数组而不是字符串

    我目前正在使用 PayPals API 并希望将其响应之一从名称 值对转换为数组 到目前为止我已经用过urldecode 将响应解码为以下内容 email protected email protected MOREINFO lots mo
  • 如何跟踪和检查捆绑的 Ruby gem 中的依赖关系

    Bundler 将自动安装指定 gem 的任何依赖项 但它不会在标准输出中输出哪些依赖项映射到哪些 gem 当依赖项之一安装失败时 该信息非常有用 有没有办法将 Bundler 设置得更详细并在安装时告知依赖项 我正在使用 Bundler
  • DTE.执行命令并等待

    我想使用宏来发布我的网络应用程序项目 小问题是 DTE ExecuteCommand 异步运行 我需要等待命令完成 Example DTE Windows Item Constants vsWindowKindSolutionExplore
  • T-SQL Case 语句以 newid() 作为随机源的奇怪行为

    我正在使用 SQL Server 2012 如果我执行以下操作来获取 1 3 范围内的随机数字列表 则效果很好 SELECT TOP 100 ABS CHECKSUM NEWID 3 1 value of rand FROM sys obj
  • 有没有办法将音频文件发送到语音转文本识别

    我想要 Android 语音识别系统分析音频文件 而不是来自麦克风的默认传入语音 有什么办法可以做到这一点吗 谢谢 cmusphinx sourceforge net wiki tutorialandroid 刚刚发现该链接听起来像是有人创