如何在Python中使用谷歌语音识别API？ [关闭]

2024-03-26

我有一个 mp3 文件，我想使用 Google 的语音识别功能从该文件中获取文本。任何我可以找到文档或示例的想法将不胜感激。

看一眼谷歌云语音API https://cloud.google.com/speech/使开发人员能够将音频转换为文本 [...] API 可识别 80 多种语言和变体 [...] 您可以创建一个免费帐户来获取有限数量的 API 请求。

HOW TO:

你需要先安装gcloud python 模块 http://googlecloudplatform.github.io/gcloud-python/#/ & 谷歌 API python 客户端 https://developers.google.com/api-client-library/python/start/installation模块：

pip install --upgrade gcloud
pip install --upgrade google-api-python-client

然后在云平台控制台中，进入项目页面，选择或创建一个新项目。当您需要为您的项目启用计费后，然后启用云语音API https://console.cloud.google.com/flows/enableapi?apiid=speech.googleapis.com.

启用 Google Cloud Speech API 后，单击“转到凭据”按钮以设置您的 Cloud Speech API 凭据

See 设置服务帐户 https://cloud.google.com/speech/docs/common/auth#set_up_a_service_account有关如何通过代码授权 Cloud Speech API 服务的信息

您应该获取服务帐户密钥文件（JSON 格式）和 GOOGLE_APPLICATION_CREDENTIALS 环境变量，以允许您对 Speech API 进行身份验证

全部完成后，下载音频原始文件 https://cloud.google.com/speech/docs/samples/audio.raw来自谷歌以及语音发现_google_rest_v1.json https://cloud.google.com/speech/docs/samples/speech-discovery_google_rest_v1.json来自谷歌

修改之前下载的 JSON 文件以设置您的凭据密钥然后确保您已将 GOOGLE_APPLICATION_CREDENTIALS 环境变量设置为 .json 文件的完整路径：

export GOOGLE_APPLICATION_CREDENTIALS=/path/to/service_account_file.json

also

确保您已将 GCLOUD_PROJECT 环境变量设置为 Google Cloud 项目的 ID：

export GCLOUD_PROJECT=your-project-id

假设一切都完成了，您可以创建一个教程.py文件包含：

import argparse
import base64
import json

from googleapiclient import discovery
import httplib2
from oauth2client.client import GoogleCredentials


DISCOVERY_URL = ('https://{api}.googleapis.com/$discovery/rest?'
                 'version={apiVersion}')


def get_speech_service():
    credentials = GoogleCredentials.get_application_default().create_scoped(
        ['https://www.googleapis.com/auth/cloud-platform'])
    http = httplib2.Http()
    credentials.authorize(http)

    return discovery.build(
        'speech', 'v1beta1', http=http, discoveryServiceUrl=DISCOVERY_URL)


def main(speech_file):
    """Transcribe the given audio file.

    Args:
        speech_file: the name of the audio file.
    """
    with open(speech_file, 'rb') as speech:
        speech_content = base64.b64encode(speech.read())

    service = get_speech_service()
    service_request = service.speech().syncrecognize(
        body={
            'config': {
                'encoding': 'LINEAR16',  # raw 16-bit signed LE samples
                'sampleRate': 16000,  # 16 khz
                'languageCode': 'en-US',  # a BCP-47 language tag
            },
            'audio': {
                'content': speech_content.decode('UTF-8')
                }
            })
    response = service_request.execute()
    print(json.dumps(response))

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument(
        'speech_file', help='Full path of audio file to be recognized')
    args = parser.parse_args()
    main(args.speech_file)

然后运行：

python tutorial.py audio.raw

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在Python中使用谷歌语音识别API？ [关闭] 的相关文章

动态向类添加类方法

我有以下片段 FEED TYPES fan mail Fan Mail review Review tip Tip fan user Fan User fan song Fan Song fan album Fan Album played
sklearn 估计器管道的参数无效

我正在实现 O Reilly 书中的一个示例 Python 机器学习简介使用 Python 2 7 和 sklearn 0 16 我正在使用的代码 pipe make pipeline TfidfVectorizer LogisticRe
如何在 Debian 上的 virtualenv 中安装 numpy？

注参见这另一篇文章 https stackoverflow com questions 6442754 how to install h5py numpylibhdf5 as non root on a debian linux syst
为什么需要在 Python 方法中显式使用“self”参数？ [复制]

这个问题在这里已经有答案了当在 Python 中的类上定义方法时它看起来像这样 class MyClass object def init self x y self x x self y y 但在其他一些语言中例如 C 您可以使用
Keras model.predict 函数给出输入形状错误

我已经在 Tensorflow 中实现了通用句子编码器现在我正在尝试预测句子的类概率我也将字符串转换为数组 Code if model model type universal classifier basic class probs
为什么在访问 Python 对象属性时使用 getattr() 而不是 __dict__ ？

在具有一定程度的 Python 对象自省的源代码示例和 SO 答案中常见的模式是 getattr some object attribute name string 是否有理由优先选择这种模式 some object dict attri
类型错误：“datetime.datetime”和“str”的实例之间不支持“>”

我是 python 日期和时间类型的新手我有一个日期值 date 2018 11 10 10 55 31 00 00 我需要检查该日期值是否超过 90 天我试过 from datetime import datetime from da
查找正在导入哪些 python 模块

从应用程序中使用的特定包中查找所有 python 模块的简单方法是什么 sys modules是将模块名称映射到模块的字典您可以检查其键以查看导入的模块 See http docs python org library sys html
App Engine NDB：如何访问属性的 verbose_name

假设我有这个代码 class A ndb Model prop ndb StringProperty verbose name Something m A m prop a string value 当然现在如果我打印 m prop 它会
使用pathlib获取主目录

翻看新的pathlib在 Python 3 4 中我注意到没有任何简单的方法来获取用户的主目录我能想到的获取用户主目录的唯一方法是使用旧的os path像这样的库 import pathlib from os import path p
ValueError：数据必须为正（boxcox scipy）

我正在尝试将我的数据集转换为正态分布 0 8 298511e 03 1 3 055319e 01 2 6 938647e 02 3 2 904091e 02 4 7 422441e 02 5 6 074046e 02 6 9 265747e
设置高亮大括号的 vim 颜色主题

如何更改突出显示大括号的 vim 配色方案我希望实际编辑 vim 主题文件以使更改永久生效问候克雷格匹配括号的自动高亮颜色称为MatchParen 您可以通过执行以下操作来更改 vimrc 中的颜色 highlight MatchP
高级描述熊猫

有没有像 pandas 那样更高级的功能通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结就像这样 A count 1000 000
如何用正则表达式替换多个匹配/组？

通常我们会编写以下内容来替换一场比赛 namesRegex re compile r is life re I replaced namesRegex sub r butter There is no life in the void pr
Python 2.7 缩进错误[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这个问题是由拼写错误或无法再重现的问题引起的虽然类似的问题可能是on topic help on topic在这里这个问题的解决方式不
是否可以使用 Anaconda 包作为 Google Cloud Functions 的依赖项？

我正在使用 Python 运行时编写 Google Cloud Function 我需要包含一些无法使用的依赖项pip 如文档中所述here https cloud google com functions docs writing spe
Python：如何在不先创建整个列表的情况下计算列表的总和？

通常我们必须 1 声明一个列表 2 使用以下方法计算该列表的总和sum 但现在我希望指定一个以 1 开头间隔为 4 100 个元素的列表如下所示 1 5 9 13 17 21 25 29 33 37 我不想涉及数学公式所以 1 如何在
Python 读取未格式化的直接访问 Fortran 90 给出不正确的输出

这是数据的写入方式它是一个二维浮点矩阵我不确定大小 open unit 51 file rmsd nn output form unformatted access direct status replace recl Npoints
如何同时接受int和float类型的输入？

我正在制作一个货币转换器如何让 python 同时接受整数和浮点数我就是这样做的 def aud brl amount From to ER 0 42108 if amount int if From strip aud and to
基于值的 matplotlib 条形图颜色

有没有一种方法可以根据条形图的值对条形图的条形进行着色例如 values below 0 5 red values between 0 5 to 0 green values between 0 to 08 blue etc 我找到了一些

随机推荐

在 Android 中使用拨号盘启动应用程序

我想通过拨号盘启动我的应用程序我使用以下代码用于拨号盘启动应用程序在广播接收器中 public class HiddenReceiver extends BroadcastReceiver Override public void o
无法创建请求的服务[org.hibernate.engine.jdbc.env.spi.JdbcEnvironment]

我正在尝试将 hibernate orm 映射工具配置到我的 java 类并使用 PostgreSQL 作为我的数据库并将密码配置为 password 当我尝试运行该应用程序时我在控制台日志中遇到错误如下所示无法创建请求的服务 or
社交网站的数据库设计

社交网站例如 Twitter 中会出现哪些表格到目前为止我有一个用户表如何跟踪关注者和我关注的人我应该为关注者和我关注的人维护一个单独的表吗这些表中会有哪些列请不要认为这是主观偏离主题的由于我是初学者我想专家可以指导我获得
如何通过 React JS 博览会正确从 Firebase 实时数据库获取随机节点

跟进问题来自在控制台中记录变量时出现引用错误 https stackoverflow com questions 75509803 referenceerror when the variable is being logged in co
django 表单 - 从 clean() 引发特定字段验证错误

我对依赖于多个字段的表单进行了验证检查但最好让验证错误向用户具体显示哪些字段导致了问题而不仅仅是表单顶部的错误消息该表单有很多字段因此可以更清楚地具体显示错误所在作为解决方法我尝试在每个相关字段中创建相同的验证clean fie
GoldenLayout，如何隐藏/显示组件？

我有一个基于 GoldenLayout 1 5 9 的应用程序布局是包含两列的行请参阅下面我感兴趣的列的配置 let config content type row content type column width 31 conten
用另一条具有相同位置但使用“geom_curve”在“ggplot2”中切割开头和结尾的曲线重叠绘制曲线

我有一个df带有曲线信息 df lt data frame x c 0 0 1 1 xend c 0 1 1 0 y c 0 1 0 1 yend c 1 0 1 1 curvature c 2 5 1 1 我可以用单独的曲线绘制这些曲线c
Laravel Eloquent toArray 不使用方括号

我正在编写一个 api 并尝试将一些结果转换为 JSON 当雄辩的结果转换为数组时我期待这样的结果 id 0 id 相反 Laravel 使用表键将其显示为键值列表 0 id 0 1 id 1 这是函数 results App Even
Angular Bootstrap Modal：未知提供者：$modalInstanceProvider

我正在尝试使用 Angular Bootstrap Modal 指令 http angular ui github io bootstrap http angular ui github io bootstrap 如下在我的控制器中打开模
这个 Haskell 函数的类型签名是什么？

我写了一个函数来检查一个数字是否是质数 prime n prime n 2 floor sqrt n where prime n c u n mod c 0 False c gt u True otherwise prime n c 1 u
Swift 可选链在闭包中不起作用

我的代码看起来像这样我的班级有一个可选的变量 var currentBottle BottleLayer BottleLayer有一个方法jiggle 这段代码使用可选链接在我的类中编译得很好 self currentBottle ji
Gradle：使用注释过滤测试所需的指导

我们正在开发一个大型测试套件旨在运行在多种环境上例如烟雾性能全套等我们目前使用 JUnit 作为测试框架我们想要实现的是注释测试类或方法或两者带有一个或多个注释例如 SmokeTest PerformanceTest Ac
响应缓存在 asp.net core 项目中不起作用

我尝试在 asp net core 项目中实现响应缓存但它不起作用这是startup cs public void ConfigureServices IServiceCollection services services AddRe
获取 Facebook 应用程序的应用程序访问令牌？

我读过这个尝试获取应用程序访问令牌 https stackoverflow com questions 12948809 trying to get app access token 而且这不起作用我收到以下错误 error messa
“运算符不存在：uuid = bytea”Java 与 Postgres

我在引用此查询时遇到问题在 Postgres 上此查询执行时没有错误在JAVA上会抛出以下异常 javax persistence PersistenceException org hibernate exception SQLGr
德鲁伊 vs Elasticsearch

我是德鲁伊新手我已经看过 druid VS Elasticsearch 但还是不知道druid擅长什么以下是我的问题我有一个有 70 个节点的 solr 集群我在 solr 中有一个非常大的表有 10 亿行每行有 100 个字段
Akamai 传感器数据生成器，用于发布请求时的有效 _abck cookie (Python)

所以我试图在网站上进行自动结账但我一直被阻止因为我无法获得有效的 abck cookie 我在一些网站上看到人们付费所以编码员给他们传感器数据生成器我买不起所以我来这里寻找一些关于如何编码这个生成器的建议首先我必须创建一个以传
如何杀死使用多处理池 imap_unordered 时产生的线程

我正在尝试使用多处理池来加速一个简单的 Python 程序具体来说 imap unordered 函数就我而言我正在搜索具有特定属性的特定对象并且检查此属性需要很长时间因此我想将负载分散到 CPU 核心上我创建了以下代码 fro
TypeScript 3.0“未知”类型可以替代“any”或“泛型”吗？

https blogs msdn microsoft com typescript 2018 07 12 announcing typescript 3 0 rc the unknown type https blogs msdn micr
如何在Python中使用谷歌语音识别API？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个 mp3 文件我想使用 Google 的语音识别功能从该文件中获取文本任何我可以找到文档或

如何在Python中使用谷歌语音识别API？ [关闭]

如何在Python中使用谷歌语音识别API？ [关闭] 的相关文章

随机推荐

热门标签