时间序列 dBFS 图输出修改 - 当前输出图不符合预期 (matplotlib)

2024-06-03

我正在尝试绘制Amplitude (dBFS) vs. Time (s)音频图（.wav）文件使用matplotlib。我设法用以下代码做到了这一点：

def convert_to_decibel(sample):
    ref = 32768                    # Using a signed 16-bit PCM format wav file. So, 2^16 is the max. value.
    if sample!=0:
        return 20 * np.log10(abs(sample) / ref)

    else:
        return 20 * np.log10(0.000001)


from scipy.io.wavfile import read as readWav
from scipy.fftpack import fft

import matplotlib.pyplot as gplot1
import matplotlib.pyplot as gplot2
import numpy as np
import struct
import gc

wavfile1 = '/home/user01/audio/speech.wav'

wavsamplerate1, wavdata1 = readWav(wavfile1)
wavdlen1 = wavdata1.size
wavdtype1 = wavdata1.dtype

gplot1.rcParams['figure.figsize'] = [15, 5]
pltaxis1 = gplot1.gca()
gplot1.axhline(y=0, c="black")
gplot1.xticks(np.arange(0, 10, 0.5))
gplot1.yticks(np.arange(-200, 200, 5))
gplot1.grid(linestyle = '--')
wavdata3 = np.array([convert_to_decibel(i) for i in wavdata1], dtype=np.int16)
yvals3 = wavdata3
t3 = wavdata3.size / wavsamplerate1
xvals3 = np.linspace(0, t3, wavdata3.size)
pltaxis1.set_xlim([0, t3 + 2])
pltaxis1.set_title('Amplitude (dBFS) vs Time(s)')
pltaxis1.plot(xvals3, yvals3, '-')

给出以下输出：

我还绘制了Power Spectral Density (PSD, in dBm)使用下面的代码：

from scipy.signal import welch as psd            # Computes PSD using Welch's method.

fpsd, wPSD = psd(wavdata1, wavsamplerate1, nperseg=1024)

gplot2.rcParams['figure.figsize'] = [15, 5]

pltpsdm = gplot2.gca()
gplot2.axhline(y=0, c="black")
pltpsdm.plot(fpsd, 20*np.log10(wPSD))
gplot2.xticks(np.arange(0, 4000, 400))
gplot2.yticks(np.arange(-150, 160, 10))
pltpsdm.set_xlim([0, 4000])
pltpsdm.set_ylim([-150, 150])
gplot2.grid(linestyle = '--')

输出如下：

上面的第二个输出使用韦尔奇方法绘制了更美观的输出。 dBFS 图虽然信息丰富，但在我看来并不是很美观。这是因为：

域中的差异（第一个输出的时间与第二个输出的频率）？
pyplot中plot函数的实现方式？

另外，有没有办法可以绘制我的dBFS输出为峰峰式的情节就像在我的PSD (dBm)情节而不是密集茎图?

将会很有帮助，并且会感谢这里专家的任何指示、答案或建议，因为我只是一个初学者matplotlib和情节python一般来说。

TLNR

这与pyplot.
频域与时域不同，但这并不是您没有得到想要的结果的原因。
您的代码中 dbFS 的计算是错误的。

你应该构建数据，计算每帧的 RMS 或峰值，然后将该值转换为 dbFS而不是将这种变换应用于每个样本点。

当我们谈论振幅时，我们谈论的是周期信号。当我们从声音文件中读取一系列数据时，我们读取了一系列样本点信号的（可以是或不是周期性的）。每个采样点的值代表在特定时间采样的电压值或声压值。

We assume在很短的时间间隔内，例如 10 毫秒，信号是静止的。每个这样的区间称为frame.

通常会对每一帧应用一些特定的函数，以减少该帧边缘的突变，这些函数称为窗函数。如果您对每个帧不执行任何操作，则会向它们添加矩形窗口。

举个例子：当你的声音采样频率是44100Hz时，在10ms长的帧中，有44100*0.01=441样本点。这就是nperseg争论意味着在你的psd功能，但与 dbFS 无关。

有了上面的知识，现在我们可以讨论振幅了。

有两种方法可以获取每帧的幅度值：

最直接的方法是获取每一帧中的最大值（峰值）。
另一种是计算每一帧的RMS（均方根）。

之后，峰值或RMS值可以转换为dbFS值。

让我们开始编码：

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile

# Determine full scall(maximum possible amplitude) by bit depth
bit_depth = 16
full_scale = 2 ** bit_depth

# dbFS function
to_dbFS = lambda x: 20 * np.log10(x / full_scale)

# Read in the wave file
fname = "01.wav"
fs,data = wavfile.read(fname)

# Determine frame length(number of sample points in a frame) and total frame numbers by window length(how long is a frame in seconds)
window_length = 0.01 
signal_length = data.shape[0]
frame_length = int(window_length * fs)
nframes = signal_length // frame_length

# Get frames by broadcast. No overlaps are used.
idx = frame_length * np.arange(nframes)[:,None] + np.arange(frame_length)
frames = data[idx].astype("int64") # Convert to in 64 to avoid integer overflow

# Get RMS and peaks
rms = ((frames**2).sum(axis=1)/frame_length)**.5
peaks = np.abs(frames).max(axis=1)

# Convert them to dbfs
dbfs_rms = to_dbFS(rms)
dbfs_peak = to_dbFS(peaks)

# Let's start to plot

# Get time arrays of every sample point and ever frame
frame_time = np.arange(nframes) * window_length
data_time = np.linspace(0,signal_length/fs,signal_length)

# Plot
f,ax = plt.subplots()
ax.plot(data_time,data,color="k",alpha=.3)

# Plot the dbfs values on a twin x Axes since the y limits are not comparable between data values and dbfs
tax = ax.twinx()
tax.plot(frame_time,dbfs_rms,label="RMS")
tax.plot(frame_time,dbfs_peak,label="Peak")
tax.legend()
f.tight_layout()

# Save serval details
f.savefig("whole.png",dpi=300)
ax.set_xlim(1,2)
f.savefig("1-2sec.png",dpi=300)
ax.set_xlim(1.295,1.325)
f.savefig("1.2-1.3sec.png",dpi=300)

整个时间跨度看起来像（右轴单位为dbFS):

And the voiced part looks like:

您可以看到 dbFS 值变大，而元音起点处的振幅变大：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

matplotlib

plot

时间序列 dBFS 图输出修改 - 当前输出图不符合预期 (matplotlib) 的相关文章

如何显示 pymongo.errors.OperationFailure 详细信息？

写入 MongoDB 时我在 python 中遇到 pymongo OperationsFailure 除了回溯之外还有没有办法打印出详细信息或代码属性另请参阅 http api mongodb org python current
将鼠标悬停在 Folium 的弹出窗口中

用这样一个简单的例子 import folium map 1 folium Map location 45 372 121 6972 zoom start 12 tiles Stamen Terrain folium Marker 45 3
来自 yahoo 的 python lxml etree 小程序信息

雅虎财经更新了他们的网站我有一个 lxml etree 脚本用于提取分析师建议然而现在分析师的建议已经存在但只是以图表的形式出现你可以看到一个例子这一页 https finance yahoo com quote CSX ana
如何在 Pandas 中用多个唯一字符串替换重复值？

import pandas as pd import numpy as np data Name Tom Tom Jack Terry Age 20 21 19 18 df pd DataFrame data 假设我有一个如下所示的数据框
Python + Selenium：驱动程序路径

是否有可能在不输入路径的情况下运行 Python Selenium 脚本exePython 行中每个脚本中的文件 driver webdriver Chrome 同样的问题也适用于 IE 驱动程序 Edge 驱动程序和 Gecko 驱动程
从两个列表中查找总和等于 x 的 2 个数字的最快方法

我的代码 n 3 a1 0 b1 10 a2 2 b2 2 if b1 gt n b1 n if b2 gt n b2 n diap1 x for x in range a1 b1 1 diap2 x for x in range a2 b
对训练和测试数据帧使用相同的标签编码器

我有 2 个不同的 csv 其中包含训练数据和测试数据我从这些 train features df 和 test features df 创建了两个不同的数据帧请注意测试和训练数据有多个分类列因此我需要对它们应用 labelEnco
如何使用 BeautifulSoup 排除表中的某些行？

我已经从表格中获得了所需的数据但不想要各个玩家统计数据之间的缩写 Rk Pos Name 等如何在保留所需数据的同时排除这些数据包含缩写的行被归类为 thead 但我不知道如何使用该信息来跳过它我知道玩家的数据都被压缩在一起但现在
Pygame - 两个圆圈的碰撞检测

我正在制作一个碰撞检测程序其中我的光标是一个半径为 20 的圆当它碰到另一个圆时应该将值更改为 TRUE 出于测试目的我在屏幕中心有一个半径为 50 的固定圆我可以测试光标圆是否击中固定圆但它不能正常工作因为它实际上是在测试它是
Python条件运算符“if else”不等于“and or”[重复]

这个问题在这里已经有答案了我认为下面两个函数的结果会相同但事实并非如此 def fib2 n return n and n lt 2 or fib2 n 1 fib2 n 2 def fib3 m return m if m lt 2
如何使用 Python 从 URL 中删除查询字符串

Example http example com a text q2 text2 q3 text3 q2 text4 删除后 q2 它将返回 http example com q text q3 text3 在这种情况下出现了多个 q2
如何向 Iron Python 添加模块？

我一直在尝试使用 C Visual Studio 执行以下 Python 代码 graphcreater py 我通过 NuGet 包管理器添加了 IronPyton 2 7 7 和 IronPython StdLib 2 7 7 一旦我运
使用 Python for PyQt WebEngine 授予对 Cam & Mic 的访问权限

我正在构建一个从 Python 调用的简单 Web 应用程序我正在使用下面的代码加载此页面时以编程方式授予对摄像头和麦克风的访问权限的最简单方法是什么我只在网上找到了 C 示例无法找到在 Python 代码中执行此操作的方法 fr
从线程队列中获取所有项目

我有一个线程将结果写入队列在另一个线程 GUI 中我定期在 IDLE 事件中检查队列中是否有结果如下所示 def queue get all q items while 1 try items append q get nowai
pandas 数据帧和聚合中的行明智排序

我在 pandas dataframe df 中有一个表 col1 col2 count 12 15 3 13 17 5 1 36 4 15 12 7 36 1 4 等等我想要的是将 12 和 15 和 15 和 12 等计算值视为相同
如何在 python setup.py 中 chmod 文件？

我使用 setup py 创建了一个 python 包安装我希望它复制文件夹为临时创建的 did 中的数据文件问题是我必须使用 sudo 权限调用 setup py 因为它写入 usr local 因此当我的数据文件复制到 did
如何在（最好是纯）Python 中解码 QR 码图像？

TL DR 我需要一种使用最好是纯 Python 从图像文件中解码 QR 码的方法我有一个带有 QR 码的 jpg 文件我想使用 Python 对其进行解码我发现有几个库声称可以做到这一点 PyQRCode 网站在这里 http p
在 QThread.exit() 上立即停止处理事件队列

我正在构建一个 Qt GUI 应用程序它使用 QThread QObject 组合充当在主线程之外执行操作的工作人员 Via moveToThread QObject 被移动到 QThread 中这样我的工作线程就可以拥有在事件循环
Python：正则表达式 findall

我使用 python 正则表达式从给定字符串中提取某些值这是我的字符串 mystring txt sometext somemore text here some other text course course1 Id Name mar
python chaco轴标签时间格式

在 Enthought 的 Chaco 中 TimeFormatter类用于格式化刻度的时间字符串标签有没有办法指定时间格式类似于time strftime 源代码现在将显示月份和日期时的格式硬编码为美国风格 MMDD 我想添加一些灵

随机推荐

Python：在方法内部时，类属性是否等同于局部变量？

在Python中我知道查找本地范围的变量比查找全局范围的变量要快得多所以 a 4 def function for x in range 10000
data.table：j中的匿名函数

我试图让匿名函数返回多列j的论证data table 这是一个例子 sample data tmpdt lt data table a c rep a 5 rep b 5 b c rep f 3 rep r 7 c 1 10 d 21 30
滑动浏览段选项卡 - Ionic 3

下面的代码使用 ionic 3 中的片段文档显示了 ngSwitch ngModel 的使用但我想简单地在该段上滑动并切换到另一个段选项卡我怎样才能实现这个目标我对滑动顶部的选项卡不感兴趣但通过滑动内容我想更改分段选项卡
Rails 可以自动解析从表单 text_field 收到的日期时间吗

Rails 可以自动解析从表单的文本字段接收到的日期时间吗 in view div class field br div in controller params product updated at yesterday 目前我收到以下错误
获取 UIView 的视图控制器（iphone）

我这样做是为了获得视图 self superview viewWithTag 10 但我怎样才能获得该视图的视图控制器就像您可以获得视图控制器的视图一样我想采用另一种方式以便我可以向该视图控制器发送消息调用方法例如 self su
我怎样才能让我的 nextjs with Express 网站在 ssl 上工作

我们有一个在 Next js 和 Express 上运行的网站这是在带有 Aapche 的 cPanel 服务器上并与用作反向代理的 nginx 一起我需要在网站上安装 ssl 但我对配置应该如何感到非常困惑我的 server js
在发布我的应用程序之前在 play.google 上获取我的应用程序的链接

我想使用 facebook api 分享我的应用程序的链接 play google 上的链接但在将应用程序发布到市场之前我必须拥有它才能将其放入我的代码中除了发布后立即更新我的应用程序之外还有其他解决方案吗用这个 https pla
解析器中的链相关可观察量

我有一个解析器需要在加载页面之前从两个依赖的 API 获取数据第二个调用是由第一个调用的结果定义的因此我尝试链接两个可观察量并且需要在解析器末尾返回第二个可观察量在我尝试链接可观察量之前我有 resolve route Acti
英特尔 JCC 勘误表 - 用于缓解的前缀有什么影响？

Intel 推荐 https www intel com content dam support us en documents processors mitigations jump conditional code erratum pd
Flask.cli.NoAppException：无法导入“flaskr.flaskr”

我正在处理 http flask pocoo org docs 1 0 tutorial http flask pocoo org docs 1 0 tutorial 我写过 init py 这里的代码 http codepad org 4
清除通过在 IPython 中绘图分配的内存

我正在 IPython QtConsole 和 Notebook 中绘制一些大图这些占用了大量的内存但是一旦它们被绘制出来我就不再需要它们了它们就可以走了我怎样才能释放内存 None以下作品 close clf cla reset
创建日期 - Laravel 中的 Carbon

我开始阅读有关Carbon并且似乎不知道如何创建一个carbon date 在文档中说你可以 Carbon createFromDate year month day tz Carbon createFromTime hour minute
如何在iframe中插入html

大家好我需要在 iframe 中插入一个 html 字符串如下所示 var html p body p jQuery popolaIframe click function parent indexIframe 0 documentEl
变量值的 Heredoc 语法

我尝试使用 Heredoc 语法作为字符串变量的值如下所示 variable docker config type string default lt
更改 Symfony2 中的默认语言环境

我正在尝试更改应用程序的默认区域设置到目前为止我尝试过的事情将 intl default locale 设置为 et EE 将区域设置设置为 et app config parameters ini 更改了我的捆绑包 boot 方法中描
VS Code 中的 C\C++ 以及适用于 Windows 的 Linux 子系统

我在使用 Windows 的 Linux 子系统在 Windows 10 版本 17134 上的 VS Code 编辑器中使用包含时遇到问题我安装了 C C 扩展并且可以使用文档中概述的 launch json 信息运行我的应用程序
具有 Windows 身份验证的 ASP.NET Web API 自托管

我正在尝试将 ASP NET Web API 自托管选项与 Windows 身份验证结合使用以便我可以确定登录的用户并最终根据用户的身份接受或拒绝用户这是我的控制台应用程序代码 using System using System We
带有输入的动态创建行上的日期选择器

我有一个表单可以使用输入动态创建新行每个新行上的日期输入应该有一个日期选择器我几乎可以正常工作但是当创建带有输入的新行时日期选择器将不再在已经存在的日期字段上工作我玩了一整天来找出我做错了什么但我就是不知道如何解决这个问题这是
MVC 3 不会提供 Areas 子文件夹中的内容文件

我有一个 MVC3 应用程序其中有几个区域和一个可移植区域使用 MVCContrib 通常我将所有内容文件保存在 Content 下将脚本保存在 Scripts 下然而我正在为我的网站上的另一个服务构建一个相当复杂的网络客户端
时间序列 dBFS 图输出修改 - 当前输出图不符合预期 (matplotlib)

我正在尝试绘制Amplitude dBFS vs Time s 音频图 wav 文件使用matplotlib 我设法用以下代码做到了这一点 def convert to decibel sample ref 32768 Using a si

时间序列 dBFS 图输出修改 - 当前输出图不符合预期 (matplotlib)

时间序列 dBFS 图输出修改 - 当前输出图不符合预期 (matplotlib) 的相关文章

随机推荐

热门标签