使用 Google Speech 时从 Google Cloud Storage 访问音频文件

2024-05-10

我使用下面的这段代码使用 Google Speech 成功解析了包含语音的 .wav 文件，并将其转换为文本。

但我想访问另一个 .wav 文件，该文件已放置在 Google Cloud Storage（公开）上，而不是本地硬盘上。为什么不简单地改变

speech_file = 'my/local/system/sample.wav'

to
speech_file = 'https://console.cloud.google.com/storage/browser/speech_proj_files/sample.wav'

工作可以接受吗？

这是我的代码：

speech_file = 'https://console.cloud.google.com/storage/browser/speech_proj_files/sample.wav'

DISCOVERY_URL = ('https://{api}.googleapis.com/$discovery/rest?'
                 'version={apiVersion}')


def get_speech_service():
    credentials = GoogleCredentials.get_application_default().create_scoped(
        ['https://www.googleapis.com/auth/cloud-platform'])
    http = htt|plib2.Http()
    credentials.authorize(http)

    return discovery.build(
        'speech', 'v1beta1', http=http, discoveryServiceUrl=DISCOVERY_URL)

def main(speech_file):
    """Transcribe the given audio file.

    Args:
        speech_file: the name of the audio file.
    """
    with open(speech_file, 'rb') as speech:
        speech_content = base64.b64encode(speech.read())

    service = get_speech_service()
    service_request = service.speech().syncrecognize(
        body={
            'config': {
                'encoding': 'LINEAR16',  # raw 16-bit signed LE samples
                'sampleRate': 44100,  # 16 khz
                'languageCode': 'en-US',  # a BCP-47 language tag
            },
            'audio': {
                'content': speech_content.decode('UTF-8')
                }
            })
    response = service_request.execute()
    return response

我不确定为什么你的方法不起作用，但我想提供一个快速建议。

Google Cloud Speech API 本身支持 Google Cloud Storage 对象。不必下载整个对象然后将其上传回 Cloud Speech API，只需通过交换此行来指定对象即可：

        'audio': {
            # Remove this: 'content': speech_content.decode('UTF-8')
            'uri': 'gs://speech_proj_files/sample.wav'  # Do this!
            }

另一项建议。您可能会发现谷歌云 https://googlecloudplatform.github.io/google-cloud-python/Python 库更易于使用。尝试这个：

from google.cloud import speech
speech_client = speech.Client()

audio_sample = speech_client.sample(
    content=None,
    source_uri='gs://speech_proj_files/sample.wav',
    encoding='LINEAR16',
    sample_rate_hertz= 44100)
results_list = audio_sample.sync_recognize(language_code='en-US')

这里有一些很好的例子：https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/cloud-client https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/cloud-client

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Audio

googlecloudstorage

googlespeechapi

使用 Google Speech 时从 Google Cloud Storage 访问音频文件的相关文章

为什么我的音频不倒带？

我在 Javascript 中倒带音频时遇到了一些问题我基本上有一个倒计时当倒计时接近结束时每秒都会发出蜂鸣声我尝试使用 var bip new Audio http www soundjay com button beep 7 w
在导入 BigQuery 时添加文件名作为列？

这是一个有关将数据文件从 Google Cloud Storage 导入到 BigQuery 的问题我有许多遵循严格命名约定的 JSON 文件以包含 JSON 数据本身中未包含的一些关键数据例如 xxx US 20170101 jso
使用音频单元录制我的 iPhone 应用程序播放的声音

我今天有很多有趣的事情iOS 和音频单元并发现了很多有用的资源包括在内首先我对某些事情感到困惑是否真的有必要创建一个音频图 with 混合器单元录制应用程序播放的声音或者播放声音就足够了ObjectAL https github
如何在android中播放音频文件

我的 Android 手机中有一个 mp3 文件让它在我的 SD 卡中的某个位置成为 xyz mp3 如何通过我的应用程序播放它只需您就可以使用MediaPlayer并播放音频文件查看这个很好的例子 http www helloand
ffmpeg 用于屏幕捕获？

所以我有一个小程序来捕获屏幕和计算机麦克风的声音然后屏幕截图被编码为 ScreenVideo2 声音被编码为 AAC 如何使用 ffmpeg 逐帧混合然后将混合输出发送到 wowza 媒体服务器如果用ffmpeg无法完成您能提供一些
无法在 GAE 应用程序中使用 google-cloud

我的 Google App Engine 应用程序中的以下行 webapp py 无法导入谷歌云 https googlecloudplatform github io google cloud python 图书馆 from google
使用python同时播放两个正弦音

我正在使用 python 来播放正弦音音调基于计算机的内部时间以分钟为单位但我想根据秒同时播放一个音调以获得和谐或双重的声音这就是我到目前为止所拥有的有人能指出我正确的方向吗 from struct import pack fr
使用javascript批量上传请求到Google Cloud Storage

我正在尝试使用 javascript 在批量请求中将多个图像上传到谷歌云存储我在用着https developers google com storage docs json api v1 how tos batch example ht
检查系统是否有声音 C#

我们目前正在使用 XNA 开发一款游戏但我们偶然发现了一个小声音问题当系统没有插入声音设备扬声器等当 Win7 在扬声器图标上显示红十字时它在尝试播放加载声音时崩溃因此我们想检查系统是否具有输出声音的能力在C 中可以吗您
将新文件添加到 Cloud Storage 时触发 Dataflow 作业

我想在将新文件添加到存储桶时触发数据流作业以便处理新数据并将其添加到 BigQuery 表中我看到云函数可以被触发 https cloud google com functions calling google cloud storag
android 录音时可以静音吗

我想构建一个应用程序我想在通话中调制声音我编写了一段代码来记录声音并以不同的音调播放它现在我想要在通话时使用此功能我想将通话静音记录声音然后以不同的音调播放它如何将通话静音但仍录制音频此答案可在通话期间使麦克风静音 Boole
签名 URL 在过期日期后仍然有效

我创建了一个签名 URL 有效期为 2 天尽管过期但它仍然有效我希望它给出一些错误 3XX 4XX 测试脚本 https gist githubusercontent com forvaidya 984003008b0603ca679
使用 Google Speech 时从 Google Cloud Storage 访问音频文件

我使用下面的这段代码使用 Google Speech 成功解析了包含语音的 wav 文件并将其转换为文本但我想访问另一个 wav 文件该文件已放置在 Google Cloud Storage 公开上而不是本地硬盘上为什么不简单地
如何在 iPad 上使用 HTML5/Javascript 合成音频

有没有人有工作示例代码可以在 iPad 上的 Mobile Safari 上使用 HTML5 Javascript 合成并播放音频我在网上找到了一些基于 javascript 的声音合成示例但它们似乎都只能在 Firefox 中使
“初始化 MCI 时出现问题”播放声音问题

我正在尝试使用 Playsound 播放代码文件夹中的文件但是每次运行代码时它似乎都能够调用该文件但我总是收到以下输出 playsound PlaysoundException Error 277 for command open p
Mediaplayer 播放几次后停止播放

我有一个按钮按下它会播放一个随机声音剪辑然后播放另一个声音剪辑然后通过一个媒体播放器播放另一个声音剪辑但是多次按下该按钮 15 20 次后所有音频都会停止我在播放最后一个音频剪辑后释放媒体播放器所以我不认为这是原因有什么指
音频html标签无法快进或快退控制

我正在使用音频 html 标签从我的上传服务器加载音频但我不知道为什么我的音频无法像往常一样循环快进或快退控制我的音频标题 Accenpt Ranges bytes Connection Keep Alive Content Len
在 Qt 中播放通知（频率 x）声音 - 最简单的方法？

Qt 5 1 或更高版本我需要播放频率为 x 的通知声音 n 毫秒如果我能像这样组合音调那就太好了 1000Hz 持续 2 秒然后 3000Hz 持续 1 秒最简单的方法是使用文件 WAV MP3 例如如此处所述如何用Qt播放声音
在随机位置启动 HTML5

我有一个大约 2 小时长的音轨我想在我的网站上使用它我希望它在页面加载时在随机位置开始播放曲目使用 HTML5 可以吗我知道您可以使用 element currentTime 函数来获取当前位置但是如何在完全下载之前获取曲目的总时
如何在Java媒体框架中学习.wav持续时间？

我正在尝试使用 java 媒体框架将 mov 文件与 wav 文件合并因此我需要知道它们的持续时间我怎样才能做到这一点任何想法将不胜感激您可以使用以下方式了解声音文件的持续时间即 VitalyVal 的第二种方式 import

随机推荐

使用 Financial Modeling Prep (Python) 访问指定时间间隔的所有历史加密数据

Financial Modeling Prep 是一个免费的 API 可用于访问各种财务指标例如股票价格和加密货币数据 API 文档概述了如何通过 Python 等编程语言访问数据特别是对于加密货币数据 https financialm
如何在操作表中添加日期选择器？

IBAction showCatPicker if self catList nil self catList nil catList release self catList NSMutableArray alloc init self
在 solr 8 中的 fl 中使用父过滤器时获取“当架构嵌套时不应发送父过滤器”

我正在尝试使用子文档获取父文档但得到当模式嵌套时不应发送父过滤器 error 附上下面我尝试过但无法得到解决方案的查询 q parent which content type person fl child parentFilter c
在源代码管理中管理我的数据库

由于我正在处理一个新的数据库项目在 VS2008 中而且我从未从头开始开发数据库因此我立即开始研究如何在源代码管理在本例中为 Subversion 中管理数据库我找到了一些关于SO的信息包括这篇文章保持多个环境中的开发数据库同
在 jinja2 模板中转义 jinja2 语法

我在 Flask 中提供来自 Jinja2 模板的动态页面现在我在脚本标记内定义客户端模板比如 Jinja2 clone Nunjucks 问题是客户端模板的语法如下 that Flask sJinja2 解释器可以解释而不是渲染v
同一 Kinesis 流的多个不同消费者

我有一个 Kinesis 生产者它将单一类型的消息写入流我想在多个完全不同的消费者应用程序中处理这个流因此对于给定的主题流具有单个发布者的发布订阅我还想利用检查点来确保每个消费者处理写入流的每条消息最初我为所有消费者和生
嵌套 ng 网格？

我们可以制作一个嵌套的 ng grid 像这样的事情有可能吗这是笨蛋 http plnkr co edit hYuFfxLR38LA0clIkF48 p preview http plnkr co edit hYuFfxLR38LA0c
使用 htmlpurifier 将具有 of 类的元素列入白名单

我只想仅当 span 元素在 htmlpurifier 中具有特定类时才允许它有谁知道该怎么做现在我有 config gt set HTML Allowed a href p ol li ul img src blockquote em
Sharepoint 上的 WebPart 在本地下载文件 - 我需要将其发送到客户端

请帮助我在使用 Sharepoint 站点的计算机上下载文件而不是在具有 Sharepoint 服务器的计算机上 public class WebClientBL static WebClient client new WebClient
在自动热键中检测活动的镀铬配置文件

我有 2 个 google chrome 配置文件 1 个用于工作 1 个用于个人使用有时我会同时打开这两个配置文件并且我希望我的 ahk 脚本仅在特定配置文件窗口处于焦点时运行所以我查找了一些示例并制作了如下测试脚本 IfWinA
角度观察周期或摘要周期完成时如何调用函数

在 Angular 完成所有监视周期后有什么方法可以调用 Angular 中的自定义函数要求我的控制器内有多种手表功能现在我只想在所有手表函数都由角度执行后才执行函数摘要完成后有几种方法可以注册回调 Using postDige
npm ENOSELF 错误 - 在其 gh-pages 分支中安装包

我想使用 Lib 本身为 GitHub 上的 JS Lib 编写一些文档我创建了一个名为的空分支gh pages并开始构建文档页面现在我需要使用我正在记录的库编写一些 Javascript 因为谁不会使用自己的库我尝试通过安装它npm
如何将多行标签 xml 文件转换为 dataframe

我有一个包含多个行标签的 xml 文件我需要将此 xml 转换为正确的数据帧我使用了spark xml 它只处理单行标签 xml数据如下
是否有用于通过 HTTP、HTTP 隧道发送二进制数据的 Java 库？

我想通过 HTTP 以二进制格式发送相当大的数据块也称为HTTP 隧道 http en wikipedia org wiki HTTP tunnel 我想通过 Java 将这种技术用于一些 Java Swing 应用程序也可能是 And
当 DataSource 更改时 ComboBox 不会自动更新？

由于某种原因当从数据源一个简单的 BindingList 添加或删除项目时组合框会相应更新但如果我编辑这样的项目它不会自动更新 myBindingList index Name NewName myBindingList inde
合并两个对象数组并根据对象内部存在的键更新对象

我有两个数组对象 array1 和 array2 我想根据键名合并数据 array1 name adam data name eve data child secondchild array2 name adam data
使用SMT-LIB使用公式计算模块数量

我不确定使用 SMT LIB 是否可以做到这一点如果不可能是否存在可以做到这一点的替代求解器考虑方程 a lt 10 and a gt 5 b lt 5 and b gt 0 b lt c lt a with a b and c整数
Delphi XE 中的数据绑定向导 - 可以将其配置为映射到 MSXML 接口吗？

Delphi XE 中的数据绑定向导生成继承自 Delphi 自己的 DOM ADOM XML v4 实现的类和接口它似乎不支持针对模式进行验证解析时验证选项仅适用于 MSXML 供应商type 从 VCL 源代码以及 IDE 中 X
Codeigniter - 检查用户是否已登录并存在（它是真实用户）

我正在尝试在用户登录我的网站时为他们设置会话数据因此如果用户存在于数据库中我将设置一个会话数据例如 this gt session gt set userdata user exists 1 现在每次我想检查用户是否存在并已登录时
使用 Google Speech 时从 Google Cloud Storage 访问音频文件

我使用下面的这段代码使用 Google Speech 成功解析了包含语音的 wav 文件并将其转换为文本但我想访问另一个 wav 文件该文件已放置在 Google Cloud Storage 公开上而不是本地硬盘上为什么不简单地

使用 Google Speech 时从 Google Cloud Storage 访问音频文件

使用 Google Speech 时从 Google Cloud Storage 访问音频文件 的相关文章

随机推荐

热门标签

使用 Google Speech 时从 Google Cloud Storage 访问音频文件的相关文章