SpeechRecognition

使用CamerX android进行视频录制时使用语音识别器API

我目前正在使用cameraX 来录制带有音频的视频并且工作得很好但是现在我必须在录制视频时使用SpeechRecognizer 并获取用户所说内容的转录 UPDATE 我尝试从视频中提取音频然后将其作为额外内容提供给意图但它不起作用

Android SpeechRecognition androidcamerax androidspeechapi

如何隐藏 toast 消息“您的音频将发送到谷歌以提供语音识别服务。”在安卓中？

我正在使用谷歌语音识别器在 Android 中集成语音服务但是当按下麦克风按钮时会显示这条烦人的 toast 消息请建议我一种隐藏此 toast 消息的方法这是我的java代码 public class FormActivity e

Android SpeechRecognition speechtotext

如何在Python中使用谷歌语音识别API？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个 mp3 文件我想使用 Google 的语音识别功能从该文件中获取文本任何我可以找到文档或

python googleapi SpeechRecognition googlespeechapi

如何跟踪语速

我正在开发一个跟踪语速的 iPhone 应用程序并希望使用 Nuance Speechkit https developer nuance com public Help DragonMobileSDKReference iOS Spee

ios iphone SpeechRecognition voicerecognition speechtotext

用于转录音频文件中的语音的开源软件[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案谁能推荐可靠的开源软件来在 wav 文件中转录英语语音我研究过的两个主要程序是Sphinx http

Java python SpeechRecognition speechtotext cmusphinx

如何将人声转换为数字格式？

我正在开展一个使用生物识别系统来保护系统的项目我们计划使用人声来保护系统想法是让人们说出一些单词或句子系统将以数字格式存储该语音下次人们想要进入系统时他她必须说出一些单词这些单词可能与之前使用的单词不同也可能没有不同我们不

security SpeechRecognition speechtotext analogdigitalconverter

使用c++调用和使用Windows语音识别[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在制作一个涉及使用 Windows 语音识别的应用程序我正在考虑使用 C 来做到这一点因为我对这种语言有一些经验我想要使用语音

c Windows SpeechRecognition speech speechtotext

x-webkit-speech，如何自动点击麦克风图标自动录制多个单词？

I am working on chrome browser The code

javascript Googlechrome SpeechRecognition

为什么 SpeechRecognizer 突然停止工作？

我的 Android 应用程序 Xamarin 使用语音识别这在 Android 8 11 和 12 的智能手机上运行良好几周以来我的应用程序的语音识别已停止在 Android 11 上运行测试了 2 种不同的智能手机在Andro

Android XamarinAndroid SpeechRecognition speechtotext

（Android Studio 语音识别器）即使我给了它 RECORD_AUDIO 和 INTERNET，我还是收到错误 9（权限不足）

package blessupboys speechtest import android app Activity import android content Context import android content Intent

同时进行语音转文本和文本转语音

介绍我正在开发一个应用程序我需要在其中使用 Booth SpeechRecognizer 和 TTS 但我在尝试这个时遇到了一些问题主要的一个问题是如果我初始化 TTS SpeechRecgonizer 似乎无法工作而如果我禁用

如何从音频文件中分离男声和女声（C++或Java）

我想区分音频文件中的男声和女声并将它们分开作为输出我希望将两个声音分开你能帮我一下吗编码可以用java还是c 完成这可能是一个非常复杂的问题它类似于编写自己的语音识别或识别算法您首先可以将音频转换为频域这是使用快速傅立叶

Audio SpeechRecognition speech

在android语音识别中，如何增加考虑输入完成的时间？

在android语音识别中任何人都可以知道如何增加我们停止听到语音后考虑输入可能完成所需的时间我需要防止端点在语音识别时在非常短的语音中间停顿期间中断如果有人知道解决办法请回复任何回应将不胜感激提前致谢你好我也遇到这个问题

Android SpeechRecognition

如何在通话过程中将语音转换为文本，并为呼叫者和呼叫接收者提供不同的文本颜色？

我想在通话期间将语音转换为文本我还希望文本以不同的颜色显示呼叫发起者为红色呼叫接收者为绿色在测试期间我在通话期间将语音转换为文本但无法区分呼叫发起者的声音和呼叫接收者的声音提前致谢请帮帮我 None

Android SpeechRecognition speech speechtotext

USB 麦克风无法与 Windows IOT Core 配合使用

我尝试了 2015 年 11 月版本版本 10586 和 2016 年 2 月 Insider Preview 版本版本 14262 但是我的USB 麦克风无法与 Windows 10 IOT 核心配合使用设想我正在使用 Windo

SpeechRecognition raspberrypi2 windowsiot

C/C++ 中的梅尔频率倒谱系数 (MFCC)

C C 中是否有 MFCC 的实现有源代码或库吗我已经找到了http code google com p libmfcc http code google com p libmfcc 这看起来不错 2016年回顾 libmfcc很简单

SpeechRecognition windowing MFCC

当用户结束讲话时停止语音识别

Siri 如何确定我何时说完我想知道的原因是我想在我的应用程序中使用 Apple 的语音识别 API 实现类似的功能这是可行的还是知道用户何时停止说话的唯一方法是通过用户输入你可以使用计时器我有同样的问题但我无法用优雅的方法解决

ios swift SpeechRecognition

CTC：空格和空白有什么区别？

2006年article https www cs toronto edu graves icml 2006 pdf关于联结主义时间分类 Alex Graves co 引入了一种解码语音的模型27标签 26 个用于字母表字母 1 个用于bl

SpeechRecognition speechtotext speech labeling ctc

将输入流式传输到 System.Speech.Recognition.SpeechRecognitionEngine

我正在尝试从 TCP 套接字在 C 中进行流式语音识别我遇到的问题是 SpeechRecognitionEngine SetInputToAudioStream 似乎需要一个可以查找的定义长度的流现在我能想到的实现这项工作的唯一方

c Sockets Streaming SpeechRecognition sapi

语音转文本在 apk 中包含语音引擎

我的应用程序中需要为真正的非极客提供语音转文本功能有没有办法在编译时为各种平板电脑包含语音引擎您可以包含自己的引擎例如 CMU Sphinx 引擎这还具有无需数据连接即可工作的优点看到这个post http cmusphinx s

Android SpeechRecognition