可以仅使用频谱图图像重建音频吗？

2024-03-06

所以我正在创建一些带有 librosa 的频谱图以保存为图像，之后我打算直接对图像进行修改（即添加随机噪声等），然后我想从该图像重建音频。

不管怎样，一些研究让我找到了类似过程的例子（参见here https://stackoverflow.com/questions/61132574/can-i-convert-spectrograms-generated-with-librosa-back-to-audio or here https://stackoverflow.com/questions/34710011/how-do-i-go-from-sound-to-spectrum-then-back-to-sound-in-python）但没有什么像我想做的那样，即获取频谱图的 png/jpg 图像并将其转换回可用的音频文件。

这是我用来生成规格图像的完整代码：

import librosa
from librosa import display
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.backends.backend_agg import FigureCanvasAgg as FigureCanvas

filename = librosa.util.example_audio_file()
y, sr = librosa.load(filename)
window_size = 1024
window = np.hanning(window_size)
stft = librosa.core.spectrum.stft(y, n_fft=window_size, hop_length=512, window=window)
out = 2 * np.abs(stft) / np.sum(window)

fig = plt.Figure()
canvas = FigureCanvas(fig)
ax = fig.add_subplot(111)
fig.subplots_adjust(left=0,right=1,bottom=0,top=1)
ax.axis('tight')
ax.axis('off')

p = librosa.display.specshow(librosa.amplitude_to_db(out, ref=np.max), ax=ax, y_axis='log', x_axis='time')
fig.savefig('spectrogram.png')

这会产生这个精确的图像：频谱图.png https://i.stack.imgur.com/e5tU7.png

但是像 librosa.istft 或 librosa.griffinlim 这样的函数期望 librosa.core.spectrum.stft 的输出，并且我无法仅从图像文件反转整个过程。假设我有这张图片，有什么方法可以重新构建音频（即使它是有损的）？还需要哪些类型的其他信息？我该怎么做？

提前致谢。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

可以仅使用频谱图图像重建音频吗？的相关文章

Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
如何使用 imaplib 获取“消息 ID”

我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好所以我认为 Message ID 是正确的但我不知道如何获取它我只知道 imap fetch uid XXXX 有人有解决方案吗来自 IMAP 文档本身 IMAP4消息号
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
Django 模型在模板中不可迭代

我试图迭代模型以获取列表中的第一个图像但它给了我错误即模型不可迭代以下是我的模型和模板的代码我只需要获取与单个产品相关的列表中的第一个图像模型 py class Product models Model title models
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
将 2D NumPy 数组按元素相乘并求和

我想知道是否有一种更快的方法专用 NumPy 函数来执行 2D NumPy 数组的元素乘法然后对所有元素求和我目前使用np sum np multiply A B 其中 A B 是相同维度的 NumPy 数组m x n 您可以使用np
在 Pandas 中使用正则表达式的多种模式

我是Python编程的初学者我正在探索正则表达式我正在尝试从描述列中提取一个单词数据库名称我无法给出多个正则表达式模式请参阅下面的描述和代码描述 Summary AD1 Low free DATA space in data
如何在 OSX 上安装 numpy 和 scipy？

我是 Mac 新手请耐心等待我现在使用的是雪豹 10 6 4 我想安装numpy和scipy 所以我从他们的官方网站下载了python2 6 numpy和scipy dmg文件但是我在导入 numpy 时遇到问题 Library F
如何为每个屏幕添加自己的 .py 和 .kv 文件？

我想为每个屏幕都有一个单独的 py 和 kv 文件应通过 main py main kv 中的 ScreenManager 选择屏幕设计应从文件 screen X kv 加载类等应从文件 screen X py 加载 Screens
迭代 my_dict.keys() 并修改字典中的值是否会使迭代器失效？

我的例子是这样的 for my key in my dict keys my dict my key mutate 上述代码的行为是否已定义假设my dict是一本字典并且mutate是一个改变其对象的方法我担心的是改变字典中的值可能
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
具有自定义值的 Django 管理外键下拉列表

我有 3 个 Django 模型 class Test models Model pass class Page models Model test models ForeignKey Test class Question model M
迭代 pandas 数据框的最快方法？

如何运行数据框并仅返回满足特定条件的行必须在之前的行和列上测试此条件例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1

随机推荐

放大 AMCharts 时丢失 Timeserie

当我放大图表时 serie2 消失了如果我通过从右侧选择光标进行缩放但是从左侧缩放工作正常无论如何我期待看到 2 系列但似乎有时不是 See my 截屏 https i stack imgur com MXsX1 png 知道为什
在opencv c++中绘制旋转矩形

我想用c 在opencv中绘制一个旋转的矩形我用 rectangle 函数如下 rectangle RGBsrc vertices 0 vertices 2 Scalar 0 0 0 CV FILLED 8 0 但是这个函数画了一个0角的
从 C# 安装项目运行另一个程序

我已经用 C 创建了一个设置和部署项目现在我有另一个 Windows 更新 exe 我想在安装我的项目之前成功运行和安装它我已将 exe 与我的项目打包在一起我之前如何运行该exe 您想要将自定义操作添加到运行可执行文件的安装项目本
根据等于 x.x.x.x/x 的 IP 字符串计算 IP 范围

给定 IP 字符串我如何计算 IP 范围x x x x x最常见的情况可能是198 162 1 1 24但可以是任何东西任何法律允许的东西我要拿198 162 1 1 24并将其转换为 198 162 1 1 198 162 1 12
音频 - 快进 30 秒

我有一个音频播放器可以播放从 Core Date 检索到的音频播放和暂停工作正常我正在尝试实现向前跳转 30 秒按钮并寻求有关如何实现该操作的任何指示我的播放暂停按钮的代码 IBAction func playPress
Python Selenium Webdriver - 动态更改下载目录

为了在定义 selenium webdriver 之前显式定义下载目录我们使用以下代码 chromeOptions webdriver ChromeOptions prefs download default directory C da
使用 Mayavi 制作 3D 图表，并使用 Matplotlib 风格的轴

我一直在用 Mayavi 进行 3D 绘图我可以绘制我想要的散点图但似乎无法让轴看起来正确我发现了以下内容上一个问题 https stackoverflow com questions 4739360 any easy way to
JOOQ 嵌套条件

嗨我想弄清楚如何在 jooq 中写这样的东西 select from table where a query or b query or a query and e query or g query or z query 我不知道如何在
将相等的矩形拟合成更大的矩形

我有一个大矩形dimensions L W and n smaller rectangles每个都有相同的尺寸l w 每个小矩形都有相同的dimensions 我的目标是适合所有人n of smaller将矩形合并到大矩形中同时尽可能最有
Rails 5.2 中范围内的连接与 Rails 5.1 有何不同？

将 Rails 从 5 1 升级到 5 2 后我开始收到以下错误 NoMethodError undefined method expr for nil NilClass from gems path activerecord 5 2 0
该捆绑包无效。 Apple 目前不接受使用此版本的 SDK 4.2 构建的应用程序 [已关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 亲爱的关心
Hibernate：映射3个表

我正在尝试使用 Hibernate 映射一些现有表这很简单我们有具有多种语言名称的类别 DDL如下 create table language id integer not null auto increment code varcha
有没有办法在logback中为单个日志文件定义多个滚动策略？

我正在尝试设置一个 logback 配置该配置创建一个解压缩的日志文件作为第一卷然后从那时起将压缩文件写入不同的目录我相信最好的方法是在单个附加程序中创建多个rollingPolicy 元素谁能指导我一个有人成功做到这一点的例子
向 Azure IoT 中心分区发送消息

有谁知道是否有一个库允许您使用 Azure 将消息发送到 IoT 中心上的特定分区我以前能够使用 azuresblite 库实现这一点不幸的是我无法使用它 https github com ppatierno azuresblite h
声明堆栈变量而不指定名称并获取指针

众所周知定义一个堆变量new获取指针而不指定名称 Var p new Var name 1 但我必须清除指向的变量p with delete p稍后在节目中我想声明一个堆栈变量以便在函数退出后自动清除它但我只想获取指针以及以下内容
弹出窗口中的动态 iframe

我试图通过下面的 href 链接实现两件事首先我想启动一个弹出窗口完毕接下来我希望弹出窗口显示 iframe 这也很容易完成until我意识到我需要将 href 链接文本作为 iframe src 中的参数传递例如 iframe
如何绘制 CSV 数据

我有一个 python 代码其中使用 pandas 读取 csv 文件并将日期和时间存储在一列中Datetime 现在我想在 y 轴上绘制传感器值在 x 轴上绘制日期时间我怎样才能做到这一点我的代码如下 import pandas
从 DialogFragment 调用 registerReceiver

EDIT 我添加了这一行 getActivity registerReceiver new BroadcastReceiver new IntentFilter SENT 但现在出现运行时错误错误内容如下 09 03 04 12 41 8
如何确定类型是否可以仅使用 const 引用进行调用？

我想写一个 C 元函数is callable
可以仅使用频谱图图像重建音频吗？

所以我正在创建一些带有 librosa 的频谱图以保存为图像之后我打算直接对图像进行修改即添加随机噪声等然后我想从该图像重建音频不管怎样一些研究让我找到了类似过程的例子参见here https stackoverflow com

可以仅使用频谱图图像重建音频吗？

可以仅使用频谱图图像重建音频吗？ 的相关文章

随机推荐

热门标签

可以仅使用频谱图图像重建音频吗？的相关文章