python中的语音识别持续时间设置问题

2024-05-03

我有一个 Wav 格式的音频文件，我想转录：

我的代码是：

import speech_recognition as sr
harvard = sr.AudioFile('speech_file.wav')
with harvard as source:
    try:
        audio = r.listen(source)
        #print("Done")
    except sr.UnknownValueError:
        exec()

r.recognize_google(audio)

我确实收到了输出：

Out[20]: 'thank you for calling my name is Denise who I have a pleasure speaking with hi my name is Mary Jane. Good afternoon Mary Jane I do have your account open with your email'

不过，这之后还有很多话要说。我认为它只捕获了这部分语音，因为在音频文件中说出“电子邮件”一词后有一个短暂的停顿。我尝试设置持续时间，但收到错误：

import speech_recognition as sr
harvard = sr.AudioFile('speech_file.wav')
with harvard as source:
    try:
        audio = r.listen(source,duration = 200)
        #print("Done")
    except sr.UnknownValueError:
        exec()


r.recognize_google(audio)
Traceback (most recent call last):

  File "<ipython-input-24-30fb65edc627>", line 5, in <module>
    audio = r.listen(source,duration = 200)

TypeError: listen() got an unexpected keyword argument 'duration'

我该怎么做才能让我的代码转录整个音频文件并且在出现暂停时不会停止打印文本？

您可以使用timeout代替duration像这样：

audio = r.listen(source, timeout=2)

这意味着模型将等待最多两秒在放弃和投掷之前开始的一个短语speech_recognition.WaitTimeoutError例外。如果timeout=None，您的情况将无需等待。

EDIT

所有功能recognize_google()所做的就是调用 google Speech API 并返回结果。当我使用提供的音频文件时，我得到了前 30 秒的转录。这是由于免费版 Google 语音 API 的限制，与代码无关。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NLP

SpeechRecognition

pyaudio

python中的语音识别持续时间设置问题的相关文章

如何覆盖 Django 的默认管理模板和布局

我正在尝试覆盖 Django 的默认模板现在只有base site html 我正在尝试更改 django 管理文本我做了以下事情我在我的应用程序目录中创建了一个文件夹 opt mydjangoapp templates admin
有没有一种方法可以将python对象直接存储在mongoDB中而不需要序列化它们

我在某处读到过您可以使用 BSON 将 python 对象更具体地说是字典作为二进制文件存储在 MongoDB 中但是现在我找不到任何与此相关的文档有人知道具体如何做到这一点吗没有办法在不序列化的情况下将对象存储在文件数据库
嵌套字典中的 Django 模板

我正在使用 Django 模板并且遇到了嵌套字典的一个问题 Dict result dict type 0 file name abc count 0 type 1 file name xyz count 50 我的 HTML 文件中的模
从sklearn PCA获取特征值和向量

如何获取 PCA 应用程序的特征值和特征向量 from sklearn decomposition import PCA clf PCA 0 98 whiten True converse 98 variance X train clf f
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
Pandas dataframe：每批行的操作

我有一个熊猫数据框df我想计算每批行的一些统计信息例如假设我有一个batch size 200000 对于每批batch sizerows 我想要一列的唯一值的数量ID我的数据框我怎样才能做这样的事情呢这是我想要的一个例子 prin
小部件之间的自定义信号

尝试将信号从一个 gtk EventBox 子级发送到另一个在 init HeadMode 第 75 行上出现错误类型错误未知信号名称消息发送 why usr bin env python coding utf8 import p
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
揭秘sharedctypes性能

在 python 中可以在多个进程之间共享 ctypes 对象然而我注意到分配这些对象似乎非常昂贵考虑以下代码 from multiprocessing import sharedctypes as sct import ctypes
对使用 importlib.util 导入的对象进行酸洗

我在使用Python的pickle时遇到了一个问题我需要通过将文件路径提供给 importlib util 来加载一些 Python 模块如下所示 import importlib util spec importlib util sp
如何在Python中按AaB而不是ABa顺序对字符串进行排序

我正在尝试对字符串进行排序为 punnetsquare 制作基因型我目前的实现是 unsorted genotype ABaB sorted genotype sorted list unsorted genotype sorted s
`pyqt5'错误`元数据生成失败`

我正在尝试安装pyqt5使用带有 M1 芯片和 Python 3 9 12 的 mac 操作系统我怀疑M1芯片可能是原因我收到一个错误metadata generation failed 最小工作示例 directly in the t
使用 pybtex 将 bibtex 转换为格式化的 HTML 参考书目，例如哈佛风格

我正在使用 Django 并将 bibtex 存储在我的模型中并且希望能够以格式化 HTML 字符串的形式向我的视图传递引用使其看起来像哈佛引用样式使用中描述的方法Pybtex 无法识别 bibtex 条目 https stackov
在 Windows 上使用带有对数刻度的 matplotlib 时出现 Unicode 错误

我正在使用 python 2 6 和 matplotlib 如果我运行 matplotlib 库页面中提供的示例 histogram demo py 它工作正常我已经大大简化了这个脚本 import numpy as np import
以编程方式使用 Sphinx 特定指令解析 .rst 文件

我希望能够在 Python 中解析基于 sphinx 的 rst 以便进一步处理和检查就像是 import sphinx p sphinx parse path to file rst do something with p 似乎在 do
从 python 检测 macOS 中的暗模式

我正在编写一个 PyQt 应用程序我必须添加一个补丁以便在启用暗模式的 Macos 上可以读取字体 app QApplication Fix for the font colours on macos when running dark
sqlite3从打印数据中删除括号

我创建了一个脚本用于查找数据库第一行中的最后一个值 import sqlite3 global SerialNum conn sqlite3 connect MyFirstDB db conn text factory str c con
附加两个具有相同列、不同顺序的数据框

我有两个熊猫数据框 noclickDF DataFrame 0 123 321 0 1543 432 columns click id location clickDF DataFrame 1 123 421 1 1543 436 colu
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
PHP 和 NLP：嵌套括号（解析器输出）到数组？

想要将带有嵌套括号的文本转换为嵌套数组以下是 NLP 解析器的输出示例 TOP S NP PRP I VP VBP love NP NP DT a JJ big NN bed PP IN of NP NNS roses 原文我喜欢一大床

随机推荐

WebSQL DB 会与 Chrome 的应用程序同步吗？

我正在为 Chrome 构建一个打包应用程序我目前正在使用 WebSQL 来存储检索数据如果我选择在 Chrome 中同步应用程序我在一台计算机上输入的数据会显示在另一台计算机上吗例如在我的桌面上我打开应用程序并添加一条记录
是否有一种快速替代方法可以从 XNA 中的位图对象创建 Texture2D？

我环顾四周发现从位图创建Texture2D的唯一方法是 using MemoryStream s new MemoryStream bmp Save s System Drawing Imaging ImageFormat Png s S
使用 Bixolon R200 进行打印的 Android 应用程序

我正在开发一个 Android 应用程序用于使用 Bixolon R200 进行打印我在工作中使用 bxlprint jar 的类当我想打印波斯字符串时打印机打印奇怪的字符我使用UTF 8和UTF 16进行编码你能帮我吗 Str
记录中嵌套 Spring 配置（ConfigurationProperties）

如何绘制一张地图application yaml将嵌套属性配置为 Java 中类似的记录结构例如如果我们有以下 yaml foo bar something 42 baz otherThing true color blue 所需的记录
GPars 报告大量异步函数的状态并等待完成

我有一个解析器在收集一行数据后我想触发一个 aync 函数并让它处理该行同时主线程继续运行并获取下一行我看过这个帖子在 Groovy 中如何同时执行两个任务并等待结果 https stackoverflow com questio
替换函数中的特殊字符

GREL 替换函数需要 3 个字符串或者一个字符串一个正则表达式和一个字符串在用于替换的第三个字符串中某些字符具有特殊行为 t n 以及可能还有一些其他组合不执行任何操作或者出现错误被解释为 t 被解释为制表符 n 被解释为新
在 Perl 中验证电子邮件的正则表达式

我是 Perl 新手正在尝试掌握脚本语言其中我遇到了正则表达式来验证电子邮件地址我正在分享 perl 脚本我不确定我在哪里犯了错误部分始终被省略随后正确的电子邮件 ID 也显示为无效这是代码 usrs bin perl str
Rails 5 api - 未定义的方法“user_url”

我在 API 模式下使用 Rails 5 启动了一个新项目目前我只是创建项目设置数据库并使用脚手架命令 rails g scaffold User 我用邮递员尝试我的代码来创建一个新用户 POST Request URI localho
如何将 !important 添加到 CSS-in-JS (JSS) 类属性？

我正在尝试使用一些 CSS in JS 类这个答案 https stackoverflow com questions 54525334 how can i change the label size of a material ui te
如何只显示 HTML5 datalist 中的文本而不显示值？

这是一个例子
Java ArrayList，在一行中获取多种类型（int、String 等）的用户输入

我正在努力提高 Java 水平我遇到的一个问题是获取用户输入所有这些都在一行中如下所示 System out println Please input numbers that you would like to work with
如何在活动之间传递大型集合（主从流）

背景我正在实现一个从网络服务读取有关电影信息的应用程序该网络服务返回有关每部电影的一些信息标题日期海报网址导演演员等该 Web 服务支持分页因此电影以 100 部为一组加载执行这个想法是显示一个包含所有海报的网格当用
Elasticsearch：如何查询连接数？

如何询问我的 Elasticsearch 服务器现在有多少个连接这与插座数量相同吗我也不知道如何获得这些数字这与客户端的数量不同对吧因为每个客户端可能打开多个连接找不到任何相关信息但我确实发现您可以在 Elasticsearc
Python - 使用 win32com.client 将 Excel 单元格范围格式化为表格

我正在尝试编写一个函数该函数选择工作表中的所有非空单元格根据内容调整列宽并将其格式化为表格我被困在最后一点这是我当前的代码 import win32com client from win32com client import co
main:Object 的未定义方法“命名空间”(NoMethodError) - 活动记录/rakefile

我正在尝试运行一个基本的 Sinatra 应用程序当我进入机架步骤时出现错误 rvm gems ruby 2 2 1 gems activerecord 4 2 1 lib active record railties databa
如何通过 RestTemplate 发布字节数组

目标使用 RestTemplate 发布图像目前正在使用这个的变体 MultiValueMap
Meteor React 教程第 2 步不起作用

我正在做 Meteor React simple todos 教程第一步只是创建应用程序 cd 进入应用程序目录并运行meteor 到目前为止一切都很好我按照步骤 2 中的说明进行了更改但未显示待办事项列表我得到一个空白屏幕代码
如何更改 Bootstrap 按钮的形状

如何将引导程序中默认的圆角按钮更改为正常的矩形按钮现在我只能更改按钮的大小颜色或字体 btn lg padding 10px 16px font size 18px line height 1 33 border radius 6px b
Lambda、封闭变量、显示类、可序列化性和流行层

我已经为 Compact Framework 实现了一个流行层包括BinaryFormatter 类似序列化器我希望能够在适当的情况下序列化编译器生成的类这些类是由 lambda 和迭代器等产生的这样如果例如 lambda 及其封
python中的语音识别持续时间设置问题

我有一个 Wav 格式的音频文件我想转录我的代码是 import speech recognition as sr harvard sr AudioFile speech file wav with harvard as source

python中的语音识别持续时间设置问题

EDIT

python中的语音识别持续时间设置问题 的相关文章

随机推荐

热门标签

python中的语音识别持续时间设置问题的相关文章