在 python 中将声音从网站转换为文本

2023-11-30

如何将网站上的声音转换为文本？当我单击网站中的按钮时会播放声音，但我的问题是如何在不使用麦克风的情况下将其转换为文本，仅使用网站和 python。

import speech_recognition as sr

r = sr.Recognizer()
with sr.AudioFile('my.wav') as source:

    audio_text = r.listen(source)

    try:
        text = r.recognize_google(audio_text)
        print('Converting audio transcripts into text ...')
        print(text)

    except:
         print('Sorry.. run again...')

这是我的代码，但我没有 wav 文件，只有来自我尝试转换的网站的声音。

我想做的例子

当我单击网站中的按钮时，它会播放“hello”，并且 python 将从网站获取声音并打印出来。

首先尝试下载文件，我不知道您的音频文件的位置或格式，所以这是一个猜测：

编辑：向真实的音频文件添加一个网址并且它可以工作，但它会因音频质量较差而失败

import requests
import speech_recognition as sr

def download(url, path):
    response = requests.get(url)     # get the response of the url
    with open(path, 'wb') as file:   # create the file
        file.write(response.content) # write response contents to the file

def transcribe(path):
    r = sr.Recognizer()
    with sr.AudioFile(path) as source:
        audio_text = r.record(source)

        text = r.recognize_google(audio_text)
        print('Converting audio transcripts into text ...')
        return text


audio_url = 'https://google.github.io/tacotron/publications/parrotron/audio/norm_vctk/03_norm_input.wav'
audio_path = './speech.wav'

download(audio_url, audio_path)

audio_text = transcribe(audio_path)

print(audio_text)

Output

Converting audio transcripts into text ...
this is a huge confidence boost

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

在 python 中将声音从网站转换为文本的相关文章

围绕 readline 构建的 python 批处理的触发器选项卡完成

背景我有一个 python 程序它导入并使用 readline 模块来构建自制的命令行界面我有第二个 python 程序围绕 Bottle 一个 Web 微框架构建充当该 CLI 的前端第二个 python 程序向第一个程序打开
从数据框中按索引删除行

我有一个数组wrong indexes train其中包含我想从数据框中删除的索引列表 0 63 151 469 1008 要删除这些索引我正在尝试这样做 df train drop wrong indexes train 但是代码失败
Python中Decimal类型的澄清

每个人都知道或者至少每个程序员都应该知道 http docs oracle com cd E19957 01 806 3568 ncg goldberg html 即使用float类型可能会导致精度错误然而在某些情况下精确的解决方
pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
如何迭代按值排序的 Python 字典？

我有一本字典比如 a 6 b 1 c 2 我想迭代一下by value 不是通过键换句话说 b 1 c 2 a 6 最直接的方法是什么 sorted dictionary items key lambda x x 1 对于那些讨厌 la
填充两个函数之间的区域

import matplotlib pyplot as plt import numpy as np def domain x np arange 0 10 0 001 f1 lambda x 2 x x 2 0 5 plt plot x
从零开始的 numpy 形状意味着什么

好的我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况这对我来说是有意义的它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑为什么这么定义呢据我所知这只是表达空数组的
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
Pandas 根据 diff 列形成簇

我正在尝试使用 Pandas 根据表示时间以秒为单位的列中的差异来消除数据框中的一些接近重复项例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
创建嵌套字典单行

您好我有三个列表我想使用一行创建一个三级嵌套字典 i e l1 a b l2 1 2 3 l3 d e 我想创建以下嵌套字典 nd a 1 d 0 e 0 2 d 0 e 0 3 d 0 e 0 b a 1 d 0 e 0 2 d 0
mac osx 10.8 上的初学者 python

我正在学习编程并且一直在使用 Ruby 和 ROR 但我觉得我更喜欢 Python 语言来学习编程虽然我看到了 Ruby 和 Rails 的优点但我觉得我需要一种更容易学习编程概念的语言因此是 Python 但是我似乎找不到适用于
当鼠标悬停在上面时，intellisense vscode 不显示参数或文档

我正在尝试将整个工作流程从 Eclipse 和 Jupyter Notebook 迁移到 VS Code 我安装了 python 扩展它应该带有 Intellisense 但它只是部分更糟糕我在输入句点后收到建议但当将鼠标悬停在其上方
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
如何读取Python字节码？

我很难理解 Python 的字节码及其dis module import dis def func x 1 dis dis func 上述代码在解释器中输入时会产生以下输出 0 LOAD CONST 1 1 3 STORE FAST 0 x

随机推荐

QFileSystemModel 自定义图标？

在我的项目中我有一个 QTreeView 显示我的驱动器上的位置我需要将文件的所有图标更改为自定义图标但保留文件夹我重新实现了 QFileSystemModel 并且能够更改所有图标有什么方法可以限制仅更改文件而不是文件夹吗 QV
我怎样才能知道 JSF 组件的 id 以便在 Javascript 中使用

Problem 有时你会想从 javascript 访问一个组件getElementById 但是 id 是在 JSF 中动态生成的所以你需要一种获取对象 ID 的方法我在下面回答了如何做到这一点原问题我想使用如下代码如何在 J
无法更新数据库“*.mdf”，因为只读 EntityFramework

我有一个 C NET Framework 4 0 桌面应用程序其中实体框架作为 DAL 当尝试将数据保存到除我之外的任何人的机器上的 DBContext 时我收到了一个异常 Failed to update database mdf r
属性和多态性

我有两节课 public class Increase public int a 3 public void add a 5 System out println f class SubIncrease extends Increase p
R 中的行相关

我有两个相同大小的矩阵我想计算这些矩阵中每对行之间的相关系数 A 的第 1 行与 B 的第 1 行 A 的第 2 行与 B 的第 2 行等等 A lt matrix runif 1 200 nrow 20 B lt matrix run
在 Android 中使用通过 OTG 线连接的 USB 播放视频？

我想问是否有可用的应用程序用户可以通过 OTG 电缆设备将 USB 连接到 Android 并播放其中包含的媒体特别是视频我制作了一个广播接收器来检测连接的 USB 我也想读取内容我正在使用这个代码片段 private final
多层应用程序数据文件夹 - Windows 7

在命令窗口中如果我导航到 c users me 并执行 dir 我会看到 13 个文件夹但没有文件如果我执行 dir s 我会看到数千个文件但令我困扰的是我看到这样的路径 C Users me AppData Local Appli
异步 https firebase 函数

HTTPS 函数是否应该像实时函数那样返回异步承诺我们还没有返回 HTTPS 函数仅使用 res status send 等而且看起来 firebase function samples 也没有返回但文档有点含糊https fire
从 Excel 调用具有多个参数的存储过程

我已经建立了 SQL Server 与存储过程所在数据库的连接存储过程在 SQLServer 中运行良好存储过程通过与 Excel 中的硬编码参数的连接运行得很好我得到了我的数据集并将其插入到我的电子表格中宏不起作用在宏中我尝试
如何将 YAML 拆分为多个具有正确名称的文件

我有一个有效的 YAML name first metadata a name second metadata b name third metadata c 如何在文件中使用单行 AWK 脚本拆分它first yaml second ya
如何在 TypeScript 中索引对象类型？

我的应用程序收到消息我首先验证未知输入以确保它遵循预期的消息格式 const isMessage x gt typeof x object x null typeof x data string 我希望在 TypeScript 中输入此
按字母数字顺序对一组 li 标签进行排序

我一直在尝试获得一个功能可以按内容对 li 标签的选择进行排序但目前无济于事至少没有速度准确性 sortasc live click function var liArr Array licontainer children li
错误：运行帖子时标题检查不正确

我需要从休息调用中获取zip 为了模拟我使用具有二进制选项的邮递员进行发布并添加一个带有文件夹和html文件的小zip文件在模拟期间我想使用express获取数据并提取zip并放入C盘下的某个文件夹目前当我运行以下程序时这是我
仅在提交时进行 AngularJS 验证

我想在我的 AngularJS 应用程序中实现一些简单的表单验证但我不希望它在用户单击表单提交按钮之前显示任何验证错误我不希望它在我输入时甚至退出字段时进行验证有没有办法做到这一点我需要至少编写一个自定义验证器指令因此它需要与之配
有人能让这个自定义的 AlertDialog 真正起作用吗？

我问了另一个关于自定义 AlertDialog 的问题here 然后我点击了这个自定义的AlertDialog 发现here import android app AlertDialog import android content Con
如何使用 C# 获取 Excel 下拉列表中的值

我正在寻找打开和读取 Excel 文件的代码任何版本的 Excel 包括 2010 我的其中一列有一个下拉菜单我需要获取下拉列表中所选项目的值我最终希望将这些值填充到业务对象中如果有人有一些代码可以分享请告诉我我正在使用 C 和
使用VLC的虚拟界面时如何防止显示控制台

我正在尝试从 Node js 服务器脚本以虚拟模式启动 VLC 但是使用child process spawn vlc I dummy 使用 Windows 时为 VLC 的输出生成一个新的控制台窗口有没有办法防止这种情况发生并强制
基于文本输入字段创建动态链接

我正在尝试创建一个文本输入字段访问者可以在其中输入值然后单击执行或提交根据数字它们将被发送到新页面例如如果他们输入 123 并点击提交则会将他们发送至http www example com page 123 有人可以帮
过滤 OData 中的扩展实体

如何对 OData 中的扩展实体应用过滤条件假设我有主实体作为home有字段 homeId StateId CountyID Address 和子实体state as StateId StateName and county as Cou
在 python 中将声音从网站转换为文本

如何将网站上的声音转换为文本当我单击网站中的按钮时会播放声音但我的问题是如何在不使用麦克风的情况下将其转换为文本仅使用网站和 python import speech recognition as sr r sr Recognizer

在 python 中将声音从网站转换为文本

在 python 中将声音从网站转换为文本 的相关文章

随机推荐

热门标签

在 python 中将声音从网站转换为文本的相关文章