Google 云语音同步识别“INVALID_ARGUMENT”

2024-02-29

我已经管理了“概述教程”：https://cloud.google.com/speech/docs/getting-started https://cloud.google.com/speech/docs/getting-started然后我尝试使用我自己的音频文件。我上传了一个采样率为 16000Hz 的 .flac 文件。

我只改变了sync-request.json下面的文件包含我自己托管在谷歌云存储上的音频文件（gs://my-bucket/test4.flac)

{
  "config": {
      "encoding":"flac",
      "sample_rate": 16000
  },
  "audio": {
      "uri":"gs://my-bucket/test4.flac"
  }
}

该文件已被很好地识别，但请求返回“INVALID_ARGUMENT”错误

{
  "error": {
    "code": 400,
    "message": "Unable to recognize speech, code=-73541, possible error in recognition config. Please correct the config and retry the request.",
    "status": "INVALID_ARGUMENT"
  }
}

As per this https://cloud.google.com/speech/docs/basics答案，所有编码仅支持 1 个通道（单声道） audio

我使用以下命令创建 FLAC 文件：

ffmpeg -i test.mp3 test.flac

请求中的采样率与 FLAC 标头不匹配

但添加-ac 1（将音频通道数设置为 1）修复了此问题。

ffmpeg -i test.mp3 -ac 1 test.flac

这是我的完整版Node.js code

const Speech = require('@google-cloud/speech');
const projectId = 'EnterProjectIdGeneratedByGoogle';

const speechClient = Speech({
    projectId: projectId
});

// The name of the audio file to transcribe
var fileName = '/home/user/Documents/test/test.flac';


// The audio file's encoding and sample rate
const options = {
    encoding: 'FLAC',
    sampleRate: 44100
};

// Detects speech in the audio file
speechClient.recognize(fileName, options)
    .then((results) => {
        const transcription = results[0];
        console.log(`Transcription: ${transcription}`);
    }, function(err) {
        console.log(err);
    });

采样率可以是 16000 或 44100 或其他有效值，编码可以是 FLAC 或 LINEAR16。云语音文档 https://cloud.google.com/speech/docs/basics

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

flac

googlecloudspeech

Google 云语音同步识别“INVALID_ARGUMENT” 的相关文章

python 检查音频文件类型，MP3 或 FLAC

我想检查音频文件是 MP3 还是 FLAC 检查只需进行基本检查但我想要的不仅仅是检查文件扩展名 os path splitext 工作正常但如果文件没有写入扩展名或有人传递了带有假扩展名的文件则效果不佳我已经尝试过但它只返回 N
如何在android中播放.opus音频文件？

我正在开发一个应用程序用于使用谷歌云语音 APi 识别语音并同时录制音频 git link https github com rowntreerob Google speech Opus Recorder我尝试播放录制的 opus 音频文
Google Speech-to-text API，InvalidArgument：400 必须使用单通道（单声道）

我不断收到此错误InvalidArgument 400在 google Speech to text 中问题似乎是我使用 2 通道音频立体声并且 API 正在等待单声道中的 wav 如果我在音频编辑器中转换文件它可能会起作用但
使用替代语言代码的异步语音识别响应没有语言代码

我正在尝试使用新的测试版替代语言功能 https cloud google com speech to text docs multiple languages允许在创建转录作业时提供一组语言并返回检测到的语言以及该语言的转录结果当我从
从 Web 服务器的 HTML 资源中播放 FLAC

我正在运行一个 apache2 网站您可以在其中上传无损文件包括 wav 和 flac wav 文件可以立即使用但不支持 flac 所以我想知道是否有什么方法可以在 JavaScript 的帮助下播放这些 flac 文件发生的情况如
无法在 Android 中导入 com.google.cloud.speech.v1.SpeechGrpc

我正在尝试使用谷歌的语音API https github com GoogleCloudPlatform android docs samples tree master speech Speech在Android项目中示例项目有效我在
如何在 Android 中将音频 raw 转换为 flac

我用 audoiRecord 类录制音频现在我想将音频原始文件转换为 flac 格式我接下来将 raw 文件转换为 wav private void copyWaveFile String inFilename String outFi
为什么 FLAC Streaming over HTTP 采用 Ogg 封装而不是原生封装？

当前所有 FLAC 流媒体实现例如 Edcast 和 Icecast 似乎都在流媒体时使用 Ogg 作为 FLAC 的容器这是什么原因呢有什么缺点not使用 Ogg 并改为流式传输本机 FLAC 流我已经做了一些通过 HTTP 传
在多个音乐文件上运行命令行

我正在使用一个名为 metaflac 的 CLI 程序 http flac sourceforge net documentation tools metaflac html http flac sourceforge net docume
无法加载库：[netty_tcnative_linux_arm_32、netty_tcnative_linux_arm_32_fedora、netty_tcnative_arm_32、netty_tcnative]

我正在尝试在 raspberry pi modal 3 上使用 jar 运行 java 应用程序我无法解决此问题有人可以建议我如何在树莓派上进行这项工作吗在 pom 中我包含了 google cloud speech 依赖项 0 5
使用 API 密钥通过 Android 上的 GRPC 验证 Google Cloud Speech

我已经成功地通过 GRPC 使用流模式下的服务帐户让 Google Cloud Speech 适用于我的 Android 应用程序但是根据我所读到的内容出于安全原因我不应该部署包含这些凭据当前作为 JSON 文件存储在资源中的
Google 云语音同步识别“INVALID_ARGUMENT”

我已经管理了概述教程 https cloud google com speech docs getting started https cloud google com speech docs getting started然后我尝试使用
如何在 C# 中从 MP4 文件中提取音频并将其转换为 FLAC 文件？

我的目标是编写 C 将 Microsoft LYNC 会议音频转换为文本 Here https www dropbox com s lsopm8izs7j36ej WaveConverter zip dl 0到目前为止是我的项目最初我尝试
将音频文件拆分为多个文件，每个文件都低于大小阈值

我有一个 FLAC 文件需要将其拆分为几个不同的 FLAC 文件每个文件的大小必须低于 100 MB 有没有任何 UNIX 工具可以帮我做到这一点我可以自己实现这个逻辑吗旁注由于 FLAC 是压缩的我认为最简单的解决方案需要首先
保存 Google Cloud Speech API 操作（作业）对象以便稍后检索结果

我正在努力将 Google Cloud Speech Api 与 ruby 客户端 v0 22 2 一起使用我可以执行长时间运行的作业并且如果使用的话可以获得结果 job wait until done 但这会导致服务器锁定很长一段时间
ffmpeg FLAC 24 位 96khz 至 16 位 48khz

试图弄清楚 ffmpeg 目前正在努力将 24bit 96khz FLAC 文件转换为 16bit 48khz 基本示例 ffmpeg i input flac sample fmt s16 ar 48000 output flac 列出示
在谷歌云语音API中使用增强模型

我正在尝试使用 Google Speech API 上的增强模型例如 gcs uri gs mybucket averylongaudiofile ogg client speech SpeechClient audio types Re
使用 FFMPEG 的 HLS FLAC 流

我使用以下命令从 FLAC 文件创建了一个 HLS 流并输出 FLAC ffmpeg i 10 brass in pocket flac map 0 a c a 0 flac f hls hls playlist type vod mas
在 Android 的 Exoplayer 中使用 flac 扩展

我正在尝试使用 ExoPlayer 库FLAC 扩展 https github com google ExoPlayer tree release v2 extensions flac在我的安卓应用程序中我面临以下问题并非所有文件都可以
Google Cloud Speech API 使用的端点/端口是什么

通过流 API 使用 Google Cloud Speech API 对音频流执行流式语音识别 https cloud google com speech to text docs streaming recognize performin

随机推荐

kops - 获取错误的 kubectl 上下文

I use kops在aws中创建kubernetes集群我想使用以下命令验证集群 kops validate cluster 标准输出给我 Using cluster from kubectl context minikube 我认为问
为地图分配值的最有效方法

哪种方式为地图分配值最有效或者它们都针对相同的代码进行了优化在大多数现代编译器上 1 Assignment using array index notation Foo Bar 12345 2 Assignment using memb
使用 Rhino 在 Eclipse 中调试 Javascript

我已经安装了适用于 Eclipse 的 JavaScript 开发工具插件但无法运行或调试 JavaScript 项目我想使用内置的 Rhino 解释器进行调试而不是使用网络浏览器我创建了一个 JavaScript 项目当我尝试创
PostgreSQL：将lo_import中的内容保存到表中

主要问题 https stackoverflow com questions 22074987 using pg read file read file in desktop postgresql 我想在 PostgreSQL 中使用 lo
如何使用javascript在jsp中对从数据库生成的html表的列进行求和？

我正在我的网站上工作我想通过 jsp 使用 javascript 对 html 表的一列中的值进行求和我发现了各种可以添加已放入的静态数据的代码但是当我在代码中使用相同的东西时它不起作用 JavaScript 如下
Python（足球比赛算法烦恼）

我正在尝试编写足球小组赛的算法例如我在舞台上有4支球队 teams team1 team2 team3 team4 然后我得到了一对独一无二的 import itertools team pairs list itertools com
将对象传递给 UITypeEditor

我目前希望使用 PropertyGrid 来允许用户编辑我的一些类但是我在将对象传递给他们使用的 UITypeEditor 时遇到了困难当用户按下下拉菜单时我想显示一个已加载纹理的列表框以供选择如果他们想使用应用程序尚未加载的纹理
从SVN迁移后断开GIT分支

尝试查看几十个帖子但仍然没有得到我想要的 Preface 我们最初有一个非常大的 SVN 存储库没有主干标准结构等所以我正在工作的项目也没有结构在子文件夹内我在这个项目上工作了大约几个月然后遇到了一个情况我需要一个分支来
仅将变量向下传递到子目录

如何将项目特定变量传递到子目录我想知道是否有一种官方方式可以做到这一点 CMAKE BUILD TYPE is one of None Debug Release RelWithDebInfo set specific build t
如何使用键盘快捷键移动 Eclipse 选项卡？

我想在 Eclipse 中移动我的选项卡如下所示 From this To this 但是使用键盘快捷键因为每次只是为了重新排序选项卡而使用鼠标执行此操作非常烦人任何想法 There is no such a shortcut Tab
jQuery .on() 方法看不到新元素

我正在获取一个 JSON 元素并从其项目构建一个列表如下所示 getTitles function data data data var list getJSON titles data function data each data d
应用程序安装失败：无法写入设备

在 Xcode 6 3 中当我尝试在真实设备上运行用 Swift 编写的 iOS 项目时出现此错误应用程序安装失败无法写入设备我尝试清理项目并再次运行但出现相同的错误我该如何修复这个错误删除设备上的应用程序并再次运行该项目对
如何为 kubernetes 部署提供静态 ELB 端点

每次我在 kubernates 中部署新版本时我得到不同的 EXTERNAL IP 在下面的情况下是 afea383cbf72c11e8924c0a19b12bce4 xxxxx us east 1 elb amazonaws com k
无法使用新门户在 Azure AD 中添加 Microsoft 帐户

我们的一些客户正在使用外部 Microsoft 帐户来访问 AAD 服务由于我们未与他们的域关联并且其中一些人使用 Gmail 帐户因此几乎不可能将他们的整个域添加到我们的 AAD 中旧门户 manage windowsazure
如何在 Clojure 中按部分生成惰性序列？

我有一个数据库服务器我从中获取数据有时数据有数百万行甚至更多所以我使用惰性下载我使用 clojure jdbc 库中的服务器端游标https funcool github io clojure jdbc latest cursor
引起原因：java.lang.IllegalArgumentException：无法在 Spring Batch 中反序列化执行上下文

我正在开发Spring Boot Batch XML基于的方法在此示例中我创建了以下类当我只是加载或分类 Spring Batch 作业时我收到以下错误我网络搜索链接如下迁移到 Spring Boot 2 并使用 Spring
单元测试测试顺序

我如何确定单元测试方法的顺序字母或数字前缀是正确的方法吗 class TestFoo TestCase def test 1 self def test 2 self or class TestFoo TestCase def test
多个应用程序使用相同的内容提供商

我正在开发一组应用程序这些应用程序仅在某些品牌上有所区别想想不同的运动队但是我遇到了一个问题我为所有特定品牌的应用程序使用一个库项目并希望为所有这些应用程序使用相同的 ContentProvider 当我创建 ContentPr
使用 awk 将一个文件中的列替换为另一个文件中的列？

我有两个文件 f1 111 aaa 444 222 bbb 555 333 ccc 666 f2 111 333 000 444 222 444 111 555 333 555 555 666 如何使用 awk 将 f1 中的第二列替换为
Google 云语音同步识别“INVALID_ARGUMENT”

我已经管理了概述教程 https cloud google com speech docs getting started https cloud google com speech docs getting started然后我尝试使用

Google 云语音同步识别“INVALID_ARGUMENT”

Google 云语音同步识别“INVALID_ARGUMENT” 的相关文章

随机推荐

热门标签