Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
如何在iOS SDK中使用语音识别? [关闭]
Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我知道 SIRI 服务没有公共 API 但是有没有简单的语音识别 API 因此 如果我有一个文本字段并且
ios
Objectivec
SpeechRecognition
Siri
python中的语音识别持续时间设置问题
我有一个 Wav 格式的音频文件 我想转录 我的代码是 import speech recognition as sr harvard sr AudioFile speech file wav with harvard as source
python
NLP
SpeechRecognition
pyaudio
如何在Python程序中嵌入Google Speech to Text API? [关闭]
Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我有一个项目 在其中创建了客户端和主机之间的聊天程序 并且我必须在其中嵌入语音到文本 有什么方法可以在
python
googleapi
SpeechRecognition
语音识别中如何处理同音词?
对于那些不熟悉什么是同音字 https en wikipedia org wiki Homophone是的 我提供以下示例 我们的 是 嗨和高 到 太 二 在使用时语音API https developer apple com docume
ios
swift
string
NLP
SpeechRecognition
我们可以从 MFCC 系数中恢复音频吗?
可以从 MFCC 系数中获取音频信号吗 另外 MFCC 系数是否有一个值范围 如果有的话 是什么 如果没有 如何将其归一化在 0 到 1 之间 我尝试使用以下 MATLAB 代码 http labrosa ee columbia edu m
Audio
SpeechRecognition
从 Google 语音识别中删除脏话审查
我正在尝试使用 Google 的语音到文本 API 在 iOS 应用程序中将语音转换为文本 我只是将一些音频数据发送到 URL 并且它返回了我所说的 大部分 正确的单词 但是 它用 替换了任何脏话 我如何用实际的咒语替换 只是一些附加信息
ios
xcode
SpeechRecognition
profanity
Glass 的 SpeechRecognizer 权限不足错误
我正在使用 GDK 先睹为快构建一个应用程序 但在沉浸式应用程序中无法进行语音识别 这是我的第一个安卓项目 我试着遵循这个 如何在 Android 手机中使用语音识别而不出现烦人的对话框 https stackoverflow com qu
Android
SpeechRecognition
googleglass
googlegdk
如何使用其他语言的语音识别 android
我有一个曾经有效的代码 但由于某种原因它突然停止工作 我正在尝试使用希伯来语语音识别 但似乎从几天前开始它才开始英语语音识别 这是我的代码 sr SpeechRecognizer createSpeechRecognizer getAppl
Android
SpeechRecognition
voicerecognition
recognizerintent
如何从 JavaScript 使用 Opus 编解码器
我想看看是否可以使用直接访问 OpusgetUserMedia或最新浏览器中的任何类似内容 我对此进行了很多研究 但没有取得好的结果 我知道 Opus 或 Speex 实际上用于webkitSpeechRecognitionAPI 我想做语
javascript
html
SpeechRecognition
getusermedia
opus
语音识别和语调检测
我想做一个 iOS 应用来计算疑问句 我会寻找 WH 问题以及 我会吗 格式化问题 我对语音或音频技术领域不太了解 但我Google了一下 发现语音识别SDK很少 但仍然不知道如何检测和绘制语调 是否有支持语调或情感语音识别的 SDK 据我
ios
coreaudio
SpeechRecognition
为 google-cloud-speech 、Java 桌面应用程序定义 GOOGLE_APPLICATION_CREDENTIALS
我是全新使用的谷歌云java https github com GoogleCloudPlatform google cloud java 尝试做一些Speech Recognition使用谷歌云语音 https github com Go
Java
googlecloudplatform
SpeechRecognition
javaaudio
TypeScript 中的语音识别和语音合成
我能够通过创建如下接口在 TypeScript 中运行 SpeechRecognition 并且工作正常 namespace CORE export interface IWindow extends Window webkitSpeech
typescript
SpeechRecognition
speechSynthesis
浏览器上的连续语音识别,例如“ok google”或“hey siri”
我正在做一个 POC 我的要求是我想实现这样的功能OK google or Hey Siri在浏览器上 我正在使用 Chrome 浏览器Web speech api 我注意到我无法继续识别 因为它会在一段时间后自动终止 而且我知道出于安全考
javascript
html
Googlechrome
SpeechRecognition
webspeechapi
为什么我在此语音识别代码中缺少 an4-1-1.match 文件?
我在语音识别的解码部分遇到问题 我按照步骤操作here http www speech cs cmu edu sphinx tutorial html 当我输入 perl scripts pl decode slave pl 我收到这些错误
SpeechRecognition
cmusphinx
使用 Librosa 生成的频谱图看起来与 Kaldi 不一致?
我使用 Kaldi 的 egs tidigits 代码生成了 七 话语的声谱图 使用 23 个 bin 20kHz 采样率 25ms 窗口和 10ms 偏移 通过 MATLAB imagesc 函数可视化的频谱图如下所示 我正在尝试使用 L
SpeechRecognition
spectrogram
MFCC
librosa
Kaldi
Google 语音转文本:额外语言设置为“打开”但不起作用
我正在尝试使用卡纳达语的 Google Speech to Text API 并且我将 EXTRA LANGUAGE 设置为 kn 但它不起作用 下面是我正在使用的代码 Locale locale new Locale kn Locale
Android
Localization
SpeechRecognition
speechtotext
Android 语音识别服务在 <= Ice Cream Sandwich 上速度慢得多
我有一个正在实现 RecognitionListener 的服务 如下所示 Android 语音识别作为 Android 4 1 和 4 2 上的服务 https stackoverflow com questions 14940657 a
Android
performance
service
SpeechRecognition
使用CamerX android进行视频录制时使用语音识别器API
我目前正在使用cameraX 来录制带有音频的视频 并且工作得很好 但是现在我必须在录制视频时使用SpeechRecognizer 并获取用户所说内容的转录 UPDATE 我尝试从视频中提取音频 然后将其作为额外内容提供给意图 但它不起作用
Android
SpeechRecognition
androidcamerax
androidspeechapi
如何隐藏 toast 消息“您的音频将发送到谷歌以提供语音识别服务。”在安卓中?
我正在使用谷歌语音识别器在 Android 中集成语音服务 但是当按下麦克风按钮时 会显示这条烦人的 toast 消息 请建议我一种隐藏此 toast 消息的方法 这是我的java代码 public class FormActivity e
Android
SpeechRecognition
speechtotext
如何在Python中使用谷歌语音识别API? [关闭]
Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我有一个 mp3 文件 我想使用 Google 的语音识别功能从该文件中获取文本 任何我可以找到文档或
python
googleapi
SpeechRecognition
googlespeechapi
1
2
3
4
5
6
...9
»