有没有办法将音频文件发送到语音转文本识别

2023-11-25

我想要 Android 语音识别系统分析音频文件，而不是来自麦克风的默认传入语音。

有什么办法可以做到这一点吗？

谢谢。

cmusphinx.sourceforge.net/wiki/tutorialandroid 刚刚发现该链接听起来像是有人创建了 Android 版本的 Sphinx。

查看 Android api 似乎不支持这样做。 (http://developer.android.com/reference/android/speech/package-summary.html)

您也许可以使用其他 API。

我知道 Microsoft 的 C# api 允许这样做，但为了使其有用，您可能需要使用您编写的程序设置服务器，在手机上录制声音文件，然后将其发送到服务器。

CMUSphinx（http://cmusphinx.sourceforge.net/wiki/）是用 Java 编写的，因此可能可以在 Android 设备上运行。在该 api 上，您创建一个 StreamSpeechReconizer。

StreamSpeechRecognizer recognizer = new StreamSpeechRecognizer(configuration);
recognizer.startRecognition(new File("speech.wav").toURI().toURL());
SpeechResult result = recognizer.getResult();
recognizer.stopRecognition();

我找到了这个https://gist.github.com/alotaiba/1730160通过快速网络搜索（谷歌“语音识别 API 接受文件”），因此网络上可能有其他可用的服务可以接受发送给他们的文件。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

有没有办法将音频文件发送到语音转文本识别的相关文章

两个 ListView 和 ScrollView

我离这里很近我已经尝试了很多东西但无法让它发挥作用我这里有两个列表视图我想要的是每个列表视图显示其全部内容我不希望列表视图可滚动我想要保持列表视图可滚动的滚动视图我能得到的最接近的结果这是错误的是每个列表视图都是可滚动的
将 HTML5 转换为独立的 Android 应用

我有一个动态HTML5不包含任何外部资源的文档文档内没有编码图像 CSS 和脚本这个 HTML5 应用程序在互联网浏览器上运行良好我想知道是否有可能convert this HTML5 应用程序转换成独立的 Android 应用程序
为什么我可以使用 Application 作为 ViewModelComponent 和 Hilt 中的默认绑定？

来自article https developer android com training dependency injection hilt android component default 我知道每个 Hilt 组件都带有一组默认绑
如何以编程方式检查应用程序是否在调试模式下运行？

我必须在应用程序中的某个位置确定我的应用程序是在调试模式还是实时模式下运行是否有任何函数或代码可用于检查在开关两种情况下都会返回 true false 如果是这样请帮助我提前致谢从问题中尚不清楚调试模式是否指的是应用程序是否可
Android 上的 setTimeOut() 相当于什么？

我需要等效的代码setTimeOut call function milliseconds 对于安卓 setTimeOut call function milliseconds 您可能想查看定时任务 http developer andro
如何突出显示2个html文件之间的差异

我的网络应用程序有职位描述某些用户可以修改这些职位描述每次修改都会产生新版本的职位描述职位描述的内容由用户使用tinymce 编辑器直接在textarea 中以html 形式进行编辑我希望能够向用户展示内容从一个版本到另一个版本所做
Android：使用 ActivityResultLauncher 时如何区分多个意图

我正在创建一个意图选择器来在手机相机应用程序和图库文件管理器之间进行选择 Intent chooserIntent Intent createChooser clickPhoto Set Image Using chooserIntent
Audiomanager 扬声器不工作

我正在尝试在通话时启用扬声器 final AudioManager audioManager AudioManager context getSystemService Context AUDIO SERVICE audioManager
如何动态设置每个 Gridview 图像项的边框

我想显示每个 gridview 项目的不同边框我如何动态地为每个项目设置边框
当选择edittext时，主题/样式不会改变

我的注册表单中有 Edittext 当用户触摸编辑文本时编辑文本框变为绿色表示选择了编辑文本我不希望这样当用户选择任何编辑文本时行吹编辑文本保持白色请检查此图片以获取更多说明 https i stack imgur com sl
BroadcastReceiver：以编程方式设置 android:process

我希望我的应用程序能够检测外部存储的状态何时发生变化首先在我的AndroidManifest xml中定义了一个BroadcastReceiver 这里我可以设置android process and android exported像这
如何在 Android 中将 EditText 绘制到画布上？

我想画画 EditText username new EditText context 到我画布上的特定位置 protected void onDraw Canvas canvas 是否可以在基础上画出x y在我的 Java 文件中协调而不
使用 Robotium 缓慢或快速向上拖动（滚动）

这是我用于拖动当前屏幕的代码 int screenWidth getActivity getWindowManager getDefaultDisplay getWidth int screenHeight getActivity getW
Android AsyncTask onPreExecute 未不确定地调用

我有一个 AsyncTask 它应该在通过互联网上传一些内容时显示进度条有时它就像一个魅力有时它不显示任何进度条这是代码 public class Upload extends AsyncTask
如何停止和重新启动 Android 仪器测试中的活动？

我正在尝试编写一个停止的 Android 活动仪器测试 onPause then onStop 并重新启动当前活动我试过 activity finish activity getActivity 但这似乎不能正常工作测试的目的是断言表单
配置为“ ”的资源“attr/pivotX”的值重复

一个月后启动 Android studio 并与 Gradle 同步时弹出此错误重建清理项目不起作用并再次显示相同的错误我尝试过重建清理和无效重新启动项目但似乎没有任何效果我已经在这个网站上搜索过这个问题但似乎仍然没有任
手势检测器不工作

我有以下手势监听器 public class BookListener extends SimpleOnGestureListener implements OnTouchListener private LibraryActivity m
如何使用 Retrofit 从异步回调返回 String 或 JSONObject？

例如调用 api getUserName userId new Callback
为什么Android模拟器这么慢？我们怎样才能加快Android模拟器的速度呢？

想要改进这篇文章吗提供此问题的详细答案包括引用和解释为什么你的答案是正确的不够详细的答案可能会被编辑或删除我有一个2 67GHz 赛扬处理器以及1 21GB RAM 上x86视窗XP专业机器我的理解是安卓模拟器在这样的机器上应该
尝试访问从资产复制到数据\数据\的数据库中的DatabaseHelper时出现空指针异常

我有一个数据库助手类代码如下这个助手的类任务是将数据库从应用程序附带的资产文件夹复制到我的应用程序的 data data 中以便我可以使用它一旦我将数据库放入 data data 我能够我想添加它并执行 CRUD 操作并且该数据

随机推荐

查询字符串反应路由器路径

我正在使用react router 3 0 2并尝试使用查询字符串配置路由器路径这就是我配置路由器的方式
如何在 java 上更新 JSONArray 值

谁能帮助我我是java编程新手假设我有 JSONArray 其中包含以下数据 STATUSUPDATE 0 IDSERV 2 STATUSUPDATE 0 IDSERV 3 STATUSUPDATE 0 IDSERV 1 如何更新STA
在 jquery.ready 之后加载 javascript 文件

我想在 jquery ready 末尾加载一个 javascript 文件以便我的就绪处理程序中的代码不必等到加载这个大的 javascript 文件后才执行我的 jquery ready 代码根本不依赖于这个 javascript 文
Google Maps API V3：如何获取区域边界坐标（折线）数据？ [复制]

这个问题在这里已经有答案了我试图从 Google 地图获取指定的区域边界作为 GMaps 坐标以形成折线这在某种程度上可能吗来自maps google com或我自己域中的我自己的GMap Note 我知道您可以使用专用工具手动
制作半色调图像的算法？

什么是制作半色调图像的好算法例如this 快速谷歌搜索会带来一堆关于这个主题的论文但很难判断哪些是好的有效的等有没有最好的选择来做这种事情过滤至您想要的分辨率想要将点分开获取平均强度该区域中的像素组绘制点使得曲面点
C++ 类中对象计数的静态变量？

我希望有一个静态成员变量来跟踪已创建的对象的数量就像这样 class test static int count 0 public test count 这是行不通的因为根据 VC 的说法 a member with an in cla
python 3.5 asyncio和aiohttp Errno 101网络无法访问

我在 Ubuntu 16 上使用 python 3 5 我正在尝试使用 aiohttp 编写一个简单的客户端这是我的代码我把它从here 这是第一个代码示例禁用了 ssl 检查 import aiohttp import asynci
如何使单词边界 \b 与破折号不匹配

我将代码简化为我遇到的具体问题 import re pattern re compile r bword b result pattern sub lambda x match word word 我正进入状态 match match 但
从屏幕中心获取位置 Swift MapKit

我是 Swift 编程新手我正在尝试构建一个应用程序我可以使用 MapKit 和 Swift 2 获取视图中心的坐标我已经可以获得当前位置但如果我在地图上移动我需要将位置设置为新点该点将成为屏幕的中心你能帮我解决这个问题吗 R
Swift 将每隔一个项目追加到数组中

我有一个快速数组 Monthdata 我想将每个第二个值附加到我的月份数组中 var monthData let months Jul 12 Aug 12 Sep 12 Oct 12 for month in months self mon
离开作用域时调用函数

离开作用域时自动调用函数的最优雅的解决方案是什么我目前的方法见下文 works但我想应该有一些更通用的东西比如为此编写一个自定义类 include
为什么函数需要在定义或使用之前声明？

在 C 中它是可选的在C 中一 MUST 在使用定义函数之前声明它为什么会这样呢有什么需要吗我们不会在 C 或 Java 中这样做有趣的是当我们在的时候defining一个函数即使定义本身有一个声明我们也需要声明天知道为什
ActionScript 中的语法突出显示库

我让用户在我的 Flex3 Flash 10 应用程序中输入一些代码我想进行语法突出显示有没有开源库可以帮助我我需要 Lua 语法支持但如果库有一个合理的接口来执行此操作我可以自己添加它 2009 年 1 月 21 日更新查看A
如何本地化 Django 应用程序的内容

嘿我目前正在为我的学习开发一个 django 应用程序并且已经到了 l18n 的地步本地化网站本身非常容易但现在我必须允许用户翻译应用程序的动态内容用户可以将产品保存在数据库中并为其提供名称和描述但由于整个站点应该本地化因
R 在 Mac OS X Yosemite 中冻结

我遇到了这个问题并且没有关于如何解决这个错误的明确解释每当我尝试保存使用 R 内部编辑器编写的文件时 OS X Mavericks 的最新版本 R v 3 1 2 就会在 Yosemite 中冻结当您尝试时它也会冻结source一个函
将 URL 解码为数组而不是字符串

我目前正在使用 PayPals API 并希望将其响应之一从名称值对转换为数组到目前为止我已经用过urldecode 将响应解码为以下内容 email protected email protected MOREINFO lots mo
如何跟踪和检查捆绑的 Ruby gem 中的依赖关系

Bundler 将自动安装指定 gem 的任何依赖项但它不会在标准输出中输出哪些依赖项映射到哪些 gem 当依赖项之一安装失败时该信息非常有用有没有办法将 Bundler 设置得更详细并在安装时告知依赖项我正在使用 Bundler
DTE.执行命令并等待

我想使用宏来发布我的网络应用程序项目小问题是 DTE ExecuteCommand 异步运行我需要等待命令完成 Example DTE Windows Item Constants vsWindowKindSolutionExplore
T-SQL Case 语句以 newid() 作为随机源的奇怪行为

我正在使用 SQL Server 2012 如果我执行以下操作来获取 1 3 范围内的随机数字列表则效果很好 SELECT TOP 100 ABS CHECKSUM NEWID 3 1 value of rand FROM sys obj
有没有办法将音频文件发送到语音转文本识别

我想要 Android 语音识别系统分析音频文件而不是来自麦克风的默认传入语音有什么办法可以做到这一点吗谢谢 cmusphinx sourceforge net wiki tutorialandroid 刚刚发现该链接听起来像是有人创

有没有办法将音频文件发送到语音转文本识别

有没有办法将音频文件发送到语音转文本识别 的相关文章

随机推荐

热门标签

有没有办法将音频文件发送到语音转文本识别的相关文章