Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
使用CamerX android进行视频录制时使用语音识别器API
我目前正在使用cameraX 来录制带有音频的视频 并且工作得很好 但是现在我必须在录制视频时使用SpeechRecognizer 并获取用户所说内容的转录 UPDATE 我尝试从视频中提取音频 然后将其作为额外内容提供给意图 但它不起作用
Android
SpeechRecognition
androidcamerax
androidspeechapi
如何隐藏 toast 消息“您的音频将发送到谷歌以提供语音识别服务。”在安卓中?
我正在使用谷歌语音识别器在 Android 中集成语音服务 但是当按下麦克风按钮时 会显示这条烦人的 toast 消息 请建议我一种隐藏此 toast 消息的方法 这是我的java代码 public class FormActivity e
Android
SpeechRecognition
speechtotext
如何在Python中使用谷歌语音识别API? [关闭]
Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我有一个 mp3 文件 我想使用 Google 的语音识别功能从该文件中获取文本 任何我可以找到文档或
python
googleapi
SpeechRecognition
googlespeechapi
如何跟踪语速
我正在开发一个跟踪语速的 iPhone 应用程序 并希望使用 Nuance Speechkit https developer nuance com public Help DragonMobileSDKReference iOS Spee
ios
iphone
SpeechRecognition
voicerecognition
speechtotext
用于转录音频文件中的语音的开源软件[关闭]
Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 谁能推荐可靠的开源软件来在 wav 文件中转录英语语音 我研究过的两个主要程序是Sphinx http
Java
python
SpeechRecognition
speechtotext
cmusphinx
如何将人声转换为数字格式?
我正在开展一个使用生物识别系统来保护系统的项目 我们计划使用人声来保护系统 想法是让人们说出一些单词或句子 系统将以数字格式存储该语音 下次人们想要进入系统时 他 她必须说出一些单词 这些单词可能与之前使用的单词不同 也可能没有不同 我们不
security
SpeechRecognition
speechtotext
analogdigitalconverter
使用c++调用和使用Windows语音识别[关闭]
Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我正在制作一个涉及使用 Windows 语音识别的应用程序 我正在考虑使用 C 来做到这一点 因为我对这种语言有一些经验 我想要使 用语音
c
Windows
SpeechRecognition
speech
speechtotext
x-webkit-speech,如何自动点击麦克风图标自动录制多个单词?
I am working on chrome browser The code
javascript
Googlechrome
SpeechRecognition
为什么 SpeechRecognizer 突然停止工作?
我的 Android 应用程序 Xamarin 使用语音识别 这在 Android 8 11 和 12 的智能手机上运行良好 几周以来 我的应用程序的语音识别已停止在 Android 11 上运行 测试了 2 种不同的智能手机 在Andro
Android
XamarinAndroid
SpeechRecognition
speechtotext
(Android Studio 语音识别器)即使我给了它 RECORD_AUDIO 和 INTERNET,我还是收到错误 9(权限不足)
package blessupboys speechtest import android app Activity import android content Context import android content Intent
同时进行语音转文本和文本转语音
介绍 我正在开发一个应用程序 我需要在其中使用 Booth SpeechRecognizer 和 TTS 但我在尝试这个时遇到了一些问题 主要的一个问题是 如果我初始化 TTS SpeechRecgonizer 似乎无法工作 而如果我禁用
如何从音频文件中分离男声和女声(C++或Java)
我想区分音频文件中的男声和女声并将它们分开 作为输出 我希望将两个声音分开 你能帮我一下吗 编码可以用java还是c 完成 这可能是一个非常复杂的问题 它类似于编写自己的语音识别 或识别 算法 您首先可以将音频转换为频域 这是使用快速傅立叶
Audio
SpeechRecognition
speech
在android语音识别中,如何增加考虑输入完成的时间?
在android语音识别中 任何人都可以知道如何增加我们停止听到语音后考虑输入可能完成所需的时间 我需要防止端点在语音识别时在非常短的语音中间停顿期间中断 如果有人知道解决办法 请回复 任何回应将不胜感激 提前致谢 你好 我也遇到这个问题
Android
SpeechRecognition
如何在通话过程中将语音转换为文本,并为呼叫者和呼叫接收者提供不同的文本颜色?
我想在通话期间将语音转换为文本 我还希望文本以不同的颜色显示 呼叫发起者为红色 呼叫接收者为绿色 在测试期间 我在通话期间将语音转换为文本 但无法区分呼叫发起者的声音和呼叫接收者的声音 提前致谢 请帮帮我 None
Android
SpeechRecognition
speech
speechtotext
USB 麦克风无法与 Windows IOT Core 配合使用
我尝试了 2015 年 11 月版本 版本 10586 和 2016 年 2 月 Insider Preview 版本 版本 14262 但是我的USB 麦克风无法与 Windows 10 IOT 核心配合使用 设想 我正在使用 Windo
SpeechRecognition
raspberrypi2
windowsiot
C/C++ 中的梅尔频率倒谱系数 (MFCC)
C C 中是否有 MFCC 的实现 有源代码或库吗 我已经找到了http code google com p libmfcc http code google com p libmfcc 这看起来不错 2016年回顾 libmfcc很简单
SpeechRecognition
windowing
MFCC
当用户结束讲话时停止语音识别
Siri 如何确定我何时说完 我想知道的原因是我想在我的应用程序中使用 Apple 的语音识别 API 实现类似的功能 这是可行的 还是知道用户何时停止说话的唯一方法是通过用户输入 你可以使用计时器 我有同样的问题 但我无法用优雅的方法解决
ios
swift
SpeechRecognition
CTC:空格和空白有什么区别?
2006年article https www cs toronto edu graves icml 2006 pdf关于联结主义时间分类 Alex Graves co 引入了一种解码语音的模型27标签 26 个用于字母表字母 1 个用于bl
SpeechRecognition
speechtotext
speech
labeling
ctc
将输入流式传输到 System.Speech.Recognition.SpeechRecognitionEngine
我正在尝试从 TCP 套接字在 C 中进行 流式 语音识别 我遇到的问题是 SpeechRecognitionEngine SetInputToAudioStream 似乎需要一个可以查找的定义长度的流 现在 我能想到的实现这项工作的唯一方
c
Sockets
Streaming
SpeechRecognition
sapi
语音转文本 在 apk 中包含语音引擎
我的应用程序中需要为真正的非极客提供语音转文本功能 有没有办法在编译时为各种平板电脑包含语音引擎 您可以包含自己的引擎 例如 CMU Sphinx 引擎 这还具有无需数据连接即可工作的优点 看到这个post http cmusphinx s
Android
SpeechRecognition
«
1
2
3
4
5
6
...9
»