在 python 中将声音从网站转换为文本

2023-11-30

如何将网站上的声音转换为文本?当我单击网站中的按钮时会播放声音,但我的问题是如何在不使用麦克风的情况下将其转换为文本,仅使用网站和 python。

import speech_recognition as sr

r = sr.Recognizer()
with sr.AudioFile('my.wav') as source:

    audio_text = r.listen(source)

    try:
        text = r.recognize_google(audio_text)
        print('Converting audio transcripts into text ...')
        print(text)

    except:
         print('Sorry.. run again...')

这是我的代码,但我没有 wav 文件,只有来自我尝试转换的网站的声音。

我想做的例子

当我单击网站中的按钮时,它会播放“hello”,并且 python 将从网站获取声音并打印出来。


首先尝试下载文件,我不知道您的音频文件的位置或格式,所以这是一个猜测:

编辑:向真实的音频文件添加一个网址并且它可以工作,但它会因音频质量较差而失败

import requests
import speech_recognition as sr

def download(url, path):
    response = requests.get(url)     # get the response of the url
    with open(path, 'wb') as file:   # create the file
        file.write(response.content) # write response contents to the file

def transcribe(path):
    r = sr.Recognizer()
    with sr.AudioFile(path) as source:
        audio_text = r.record(source)

        text = r.recognize_google(audio_text)
        print('Converting audio transcripts into text ...')
        return text


audio_url = 'https://google.github.io/tacotron/publications/parrotron/audio/norm_vctk/03_norm_input.wav'
audio_path = './speech.wav'

download(audio_url, audio_path)

audio_text = transcribe(audio_path)

print(audio_text)

Output

Converting audio transcripts into text ...
this is a huge confidence boost
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 python 中将声音从网站转换为文本 的相关文章

随机推荐

  • QFileSystemModel 自定义图标?

    在我的项目中 我有一个 QTreeView 显示我的驱动器上的位置 我需要将文件的所有图标更改为自定义图标 但保留文件夹 我重新实现了 QFileSystemModel 并且能够更改所有图标 有什么方法可以限制仅更改文件而不是文件夹吗 QV
  • 我怎样才能知道 JSF 组件的 id 以便在 Javascript 中使用

    Problem 有时你会想从 javascript 访问一个组件getElementById 但是 id 是在 JSF 中动态生成的 所以你 需要一种获取对象 ID 的方法 我在下面回答了如何做到这一点 原问题 我想使用如下代码 如何在 J
  • 无法更新数据库“*.mdf”,因为只读 EntityFramework

    我有一个 C NET Framework 4 0 桌面应用程序 其中实体框架作为 DAL 当尝试将数据保存到除我之外的任何人的机器上的 DBContext 时 我收到了一个异常 Failed to update database mdf r
  • 属性和多态性

    我有两节课 public class Increase public int a 3 public void add a 5 System out println f class SubIncrease extends Increase p
  • R 中的行相关

    我有两个相同大小的矩阵 我想计算这些矩阵中每对行之间的相关系数 A 的第 1 行与 B 的第 1 行 A 的第 2 行与 B 的第 2 行 等等 A lt matrix runif 1 200 nrow 20 B lt matrix run
  • 在 Android 中使用通过 OTG 线连接的 USB 播放视频?

    我想问是否有可用的应用程序 用户可以通过 OTG 电缆设备将 USB 连接到 Android 并播放其中包含的媒体 特别是视频 我制作了一个广播接收器来检测连接的 USB 我也想读取内容 我正在使用这个代码片段 private final
  • 多层应用程序数据文件夹 - Windows 7

    在命令窗口中 如果我导航到 c users me 并执行 dir 我会看到 13 个文件夹 但没有文件 如果我执行 dir s 我会看到数千个文件 但令我困扰的是我看到这样的路径 C Users me AppData Local Appli
  • 异步 https firebase 函数

    HTTPS 函数是否应该像实时函数那样返回异步承诺 我们还没有返回 HTTPS 函数 仅使用 res status send 等 而且看起来 firebase function samples 也没有返回 但文档有点含糊https fire
  • 从 Excel 调用具有多个参数的存储过程

    我已经建立了 SQL Server 与存储过程所在数据库的连接 存储过程在 SQLServer 中运行良好 存储过程通过与 Excel 中的硬编码参数的连接运行得很好 我得到了我的数据集并将其插入到我的电子表格中 宏不起作用 在宏中 我尝试
  • 如何将 YAML 拆分为多个具有正确名称的文件

    我有一个有效的 YAML name first metadata a name second metadata b name third metadata c 如何在文件中使用单行 AWK 脚本拆分它first yaml second ya
  • 如何在 TypeScript 中索引对象类型?

    我的应用程序收到 消息 我首先验证未知输入以确保它遵循预期的消息格式 const isMessage x gt typeof x object x null typeof x data string 我希望在 TypeScript 中输入此
  • 按字母数字顺序对一组 li 标签进行排序

    我一直在尝试获得一个功能 可以按内容对 li 标签的选择进行排序 但目前无济于事 至少没有速度 准确性 sortasc live click function var liArr Array licontainer children li
  • 错误:运行帖子时标题检查不正确

    我需要从休息调用中获取zip 为了模拟 我使用具有二进制选项的邮递员进行发布 并添加一个带有文件夹和html文件的小zip文件 在模拟期间 我想使用express获取数据并提取zip并放入C盘下的某个文件夹 目前 当我运行以下程序时 这是我
  • 仅在提交时进行 AngularJS 验证

    我想在我的 AngularJS 应用程序中实现一些简单的表单验证 但我不希望它在用户单击表单提交按钮之前显示任何验证错误 我不希望它在我输入时甚至退出字段时进行验证 有没有办法做到这一点 我需要至少编写一个自定义验证器指令 因此它需要与之配
  • 有人能让这个自定义的 AlertDialog 真正起作用吗?

    我问了另一个关于自定义 AlertDialog 的问题here 然后我点击了这个自定义的AlertDialog 发现here import android app AlertDialog import android content Con
  • 如何使用 C# 获取 Excel 下拉列表中的值

    我正在寻找打开和读取 Excel 文件的代码 任何版本的 Excel 包括 2010 我的其中一列有一个下拉菜单 我需要获取下拉列表中所选项目的值 我最终希望将这些值填充到业务对象中 如果有人有一些代码可以分享 请告诉我 我正在使用 C 和
  • 使用VLC的虚拟界面时如何防止显示控制台

    我正在尝试从 Node js 服务器脚本以 虚拟 模式启动 VLC 但是使用child process spawn vlc I dummy 使用 Windows 时 为 VLC 的输出生成一个新的控制台窗口 有没有办法防止这种情况发生并强制
  • 基于文本输入字段创建动态链接

    我正在尝试创建一个文本输入字段 访问者可以在其中输入值 然后单击 执行 或 提交 根据数字 它们将被发送到新页面 例如 如果他们输入 123 并点击提交 则会将他们发送至http www example com page 123 有人可以帮
  • 过滤 OData 中的扩展实体

    如何对 OData 中的扩展实体应用过滤条件 假设我有主实体作为home有字段 homeId StateId CountyID Address 和子实体state as StateId StateName and county as Cou
  • 在 python 中将声音从网站转换为文本

    如何将网站上的声音转换为文本 当我单击网站中的按钮时会播放声音 但我的问题是如何在不使用麦克风的情况下将其转换为文本 仅使用网站和 python import speech recognition as sr r sr Recognizer