使用快速傅里叶变换分析音频

2023-11-27

我正在尝试用 python 创建图形频谱分析仪。

我当前正在读取 16 位双通道 44,100 Hz 采样率音频流的 1024 字节，并对 2 个通道的幅度进行平均。现在我有 256 条签名短裤。我现在想使用 numpy 之类的模块对该数组执行 fft，并使用结果创建图形频谱分析仪，该分析仪一开始只有 32 个条。

我已阅读有关快速傅里叶变换和离散傅里叶变换的维基百科文章，但我仍然不清楚结果数组代表什么。这是我使用 numpy 对数组执行 fft 后数组的样子：

   [ -3.37260500e+05 +0.00000000e+00j   7.11787022e+05 +1.70667403e+04j
   4.10040193e+05 +3.28653370e+05j   9.90933073e+04 +1.60555003e+05j
   2.28787050e+05 +3.24141951e+05j   2.09781047e+04 +2.31063376e+05j
  -2.15941453e+05 +1.63773851e+05j  -7.07833051e+04 +1.52467334e+05j
  -1.37440802e+05 +6.28107674e+04j  -7.07536614e+03 +5.55634993e+03j
  -4.31009964e+04 -1.74891657e+05j   1.39384348e+05 +1.95956947e+04j
   1.73613033e+05 +1.16883207e+05j   1.15610357e+05 -2.62619884e+04j
  -2.05469722e+05 +1.71343186e+05j  -1.56779748e+04 +1.51258101e+05j
  -2.08639913e+05 +6.07372799e+04j  -2.90623668e+05 -2.79550838e+05j
  -1.68112214e+05 +4.47877871e+04j  -1.21289916e+03 +1.18397979e+05j
  -1.55779104e+05 +5.06852464e+04j   1.95309737e+05 +1.93876325e+04j
  -2.80400414e+05 +6.90079265e+04j   1.25892113e+04 -1.39293422e+05j
   3.10709174e+04 -1.35248953e+05j   1.31003438e+05 +1.90799303e+05j...

我想知道这些数字到底代表什么以及如何将这些数字转换为 32 个条形中每个条形的高度百分比。另外，我应该将 2 个通道一起平均吗？

您显示的数组是音频信号的傅里叶变换系数。这些系数可用于获取音频的频率内容。 FFT 是为复数值输入函数定义的，因此即使您的输入都是实数值，您得到的系数也将是虚数。为了获得每个频率的功率量，您需要计算每个频率的 FFT 系数的幅度。这是not只是系数的实部，您需要计算其实部和虚部的平方和的平方根。也就是说，如果你的系数是 a + b*j，那么它的大小就是 sqrt(a^2 + b^2)。

计算出每个 FFT 系数的幅度后，您需要弄清楚每个 FFT 系数属于哪个音频频率。 N 点 FFT 将为您提供从 0 开始的 N 个等间隔频率处的信号的频率内容。因为您的采样频率是 44100 个样本/秒。 FFT 中的点数为 256，频率间隔为 44100 / 256 = 172 Hz（大约）

数组中的第一个系数将是 0 频率系数。这基本上是所有频率的平均功率水平。其余系数将从 0 以 172 Hz 的倍数递增，直到达到 128。在 FFT 中，您最多只能测量采样点一半的频率。阅读以下链接奈奎斯特频率 and 奈奎斯特-香农采样定理如果你是一个贪图惩罚的人并且需要知道为什么，但基本结果是你的较低频率将被复制或aliased在较高频率的桶中。因此，频率将从 0 开始，每个系数增加 172 Hz，直到 N/2 系数，然后减少 172 Hz，直到 N - 1 系数。

这些信息应该足以帮助您入门。如果您想要比维基百科上提供的更平易近人的 FFT 介绍，您可以尝试了解数字信号处理：第二版。。这对我很有帮助。

这就是这些数字所代表的意义。可以通过将每个频率分量幅度乘以所有分量幅度的总和来转换为高度的百分比。尽管如此，这只会给你一个相对频率分布的表示，而不是每个频率的实际功率。您可以尝试按频率分量可能的最大幅度进行缩放，但我不确定这是否会显示得很好。找到可行的缩放因子的最快方法是对响亮和柔和的音频信号进行试验，以找到正确的设置。

最后，如果您想整体显示整个音频信号的频率内容，则应该对两个通道进行平均。您正在将立体声音频混合为单声道音频并显示组合频率。如果您想要左右频率有两个单独的显示，那么您将需要分别对每个通道执行傅里叶变换。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用快速傅里叶变换分析音频的相关文章

Python 和 Numpy 是 nan 和 set

我在使用 Python 的 Numpy set 和 NaN 非数字时遇到了不可预测的行为 gt gt gt set np float64 nan np float64 nan set nan nan gt gt gt set np flo
Flask中使用的路由装饰器是如何工作的

我熟悉 Python 装饰器的基础知识但是我不明白这个用于 Flask 路由的特定装饰器是如何工作的以下是 Flask 网站上的代码片段 from flask import Flask escape request app Flask
如何为未捕获的异常处理程序编写单元测试

我有一个函数可以捕获uncaught例外情况如下有没有办法编写一个单元测试来执行uncaught exception handler 功能正常但测试正常退出 import logging def config logger logge
指示电子邮件的类型

我有以下自动化程序它将电子邮件发送给我自己并添加了特定的链接 import win32com client as win32 import easygui import tkinter as to from tkinter import
数据框 - 平均列

我在 pandas 中有以下数据框 Column 1 Column 2 Column3 Column 4 2 2 2 4 1 2 2 3 我正在创建一个数据框其中包含第 1 列和第 2 列第 3 列和第 4 列等的平均值 ColumnA
如何获取numpy.random.choice的索引？ - Python

是否可以修改 numpy random choice 函数以使其返回所选元素的索引基本上我想创建一个列表并随机选择元素而不进行替换 import numpy as np gt gt gt a 1 4 1 3 3 2 1 4 gt gt
如何使用 Homebrew 在 Mac 上安装 Python 2 和 3？

我需要能够在 Python 2 和 3 之间来回切换我如何使用 Homebrew 来做到这一点因为我不想弄乱路径并陷入麻烦现在我已经通过 Homebrew 安装了 2 7 我会用pyenv https github com yyuu
如何使用 opencv python 计算乐高积木上的孔数？

我正在开发我的 python 项目我需要计算每个乐高积木组件中有多少个孔我将从输入 json 文件中获取有关需要计算哪个程序集的信息如下所示 img 001 red 0 blue 2 white 1 grey 1 yellow 1 r
Python“非规范化”unicode 组合字符

我正在寻找标准化 python 中的一些 unicode 文本我想知道是否有一种简单的方法可以在 python 中获得组合 unicode 字符的非规范化形式例如如果我有序列u o xaf i e latin small lette
检索 geodjango 多边形对象的边界框

如何在 geodjango 中获取 MultiPolygon 对象的边界框在 API 中找不到任何内容http geodjango org docs geos html http geodjango org docs geos html
如何从列表类别中对 pandas 数据框进行排序？

所以我在下面有这个数据集我想根据我的列表从名称列进行排序以及按 A 升序和按 B 降序排序 import pandas as pd import numpy as np df1 pd DataFrame from items A 1
使用 suds SOAP 库进行 HTTP 身份验证的奇怪行为

我有一个正在运行的 python 程序它使用 suds 通过 SOAP 获取大量数据 Web服务是通过分页功能实现的这样我就可以抓取nnn每个 fetch 调用的行并获取下一个nnn与后续的电话如果我使用如下代码向 HTTP 服务器进
Discord.py 嵌入中禁用按钮/冻结按钮

I m trying to make a replica of this bot in which when I press any of the buttons below it shows a dropdown menu and you
基于值而不是类型的单次调度

我在 Django 上构建 SPA 并且有一个庞大的功能其中包含许多功能if用于检查我的对象字段的状态名称的语句像这样 if self state new do some logic if self state archive do s
使用 selenium 和 python 来提取 javascript 生成的 HTML？萤火虫？

这里是Python新手我遇到的是数据收集问题我在这个网站上当我用 Firebug 检查我想要的元素时它显示了包含我需要的信息的源然而常规源代码没有 Firebug 不会给我这个信息这意味着我也无法通过正常的 selenium
在 numpy 中连接维度

我有x 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 2 3 I want 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 6 也就是说我想连接中间维度的所有项目在这种特殊情况下我可以得到这
非法指令：MacOS High Sierra 上有 4 条指令

我正在尝试在 pygame 3 6 中制作一个看起来像聊天的窗口我刚刚将我的 MacBook 更新到版本 10 13 6 在我这样做之前它工作得很好但在我收到消息之后非法指令 4 Code import pygame from pyg
在matlab中，如何读取python pickle文件？

在 python 中我生成了一个 p 数据文件 pickle dump allData open myallData p wb 现在我想在Matlab中读取myallData p 我的Matlab安装在Windows 8下其中没有Pyt
如何在 scikit 中加载 CSV 数据并将其用于朴素贝叶斯分类

尝试加载自定义数据以在 Scikit 中执行 NB 分类需要帮助将示例数据加载到 Scikit 中然后执行 NB 如何加载目标的分类值使用相同的数据进行训练和测试或使用完整的数据集进行测试 Sl No Member ID Membe
描述符“join”需要“unicode”对象，但收到“str”

代码改编自here http wiki geany org howtos convert camelcase from foo bar to Foo Bar def lower case underscore to camel case s

随机推荐

Pydub - 将 split_on_silence 与最小长度/文件大小结合起来

我有两个脚本其中一个会分割一定长度的音频另一个会在每次出现无声段落时分割音频是否可以在静音时分割音频但只能在经过一定时间后我需要在静音状态下分割成不少于 5 分钟的视频块分割脚本忽略静音 from pydub import Au
我应该创建一个可以为空的外键还是创建一个新表？

我有一个关于如何设计数据库的小问题我有一个动物收容所的桌狗我有一个桌主人所有现在和曾经在收容所的狗都被安置在餐桌狗中现在我想在桌狗和桌主人之间建立联系问题是在这个例子中并不是所有的狗都有主人并且由于一个主人可以有不止一只狗
Kotlin：当 Java 库同时重载原始类型和装箱类型时我该怎么办？

例如 FastUtil 的IntArrayList has a push接受两者的方法int 原始和Integer 盒装但 Kotlin 将它们视为同一个函数push Int 因此我根本无法使用该函数因为该函数不明确当 Java 库
Java 停止服务器线程

以下代码是我的应用程序中的服务器代码 private int serverPort private Thread serverThread null public void networkListen int port serverPort
通过将数字列与固定值进行比较来创建类别

考虑iris data iris Sepal Length Sepal Width Petal Length Petal Width Species 1 5 1 3 5 1 4 0 2 setosa 2 4 9 3 0 1 4 0 2 se
如何“清除”绝对定位的元素

好吧我知道 1 仅靠 CSS 可能是不可能的 2 这确实不应该是可能的不幸的是由于用户的一些要求我需要找到一种方法来使其成为可能好的一些大大简化的标记 div div div div Stuff1 div div Stuff2
Spring mvc @PathVariable

你能给我一个简短的解释和使用示例吗 PathVariable在 Spring MVC 中请说明您如何输入网址我正在努力获取正确的 url 来显示 jsp 页面谢谢假设你想写一个 url 来获取一些订单你可以说 www mydoma
分页不正确显示页码 Codeigniter

我的控制器功能 function test start from 0 this gt load gt library pagination data array per page 3 total this gt activity model
如何使用 javascript 获取 firebase 3 的 accessToken

我需要使用带有 firebase REST Api 的 javascript 进行浅层休息调用在过去的版本中我需要像这样传递访问令牌 var authKey ref getAuth token var s firebaseUrl json
LinearLayout、RelativeLayout 和 AbsoluteLayout 之间有什么区别？

我对 LinearLayout RelativeLayout 和 AbsoluteLayout 之间的区别感到困惑有人可以告诉我它们之间的确切区别吗 LinearLayout意味着您可以将视图一一对齐垂直水平 RelativeLayo
如何ptrace多线程应用程序？

编辑取得进展我正在尝试 ptrace vsftpd 守护进程我有以下附加到守护进程的代码然后它成功显示第一个生成的进程的 PID 然而对于这个生成进程的子进程它返回的 PID 为 2 3 该程序确实捕获了生成进程的退出这让我觉
运行 npm install create-react-app 时出现错误 404

出现错误404在跑步的时候npm install create react app or npm install g npm latest Log 0 info it worked if it ends with ok 1 verbose
使关键字自动全局链接

有没有办法让单词的每个实例自动变成链接例如每次我写 apple 时它都会自动格式化为 a href www apple com class whatever target blank apple a 我假设我可以使用 javascri
Seaborn load_dataset

我正在尝试使用 Seaborn 按照以下方式进行分组箱线图工作example 我可以让上面的例子工作但是行 tips sns load dataset tips 根本没有解释我已经找到 Tips csv 文件但我似乎无法找到有关 lo
使用 Criteria API 的动态 JPA 2.0 查询

我在使用 JPA 2 0 的 CriteriaBuilder 构建动态查询时有点卡住了我猜想我有一个相当常见的用例用户提供任意数量的搜索参数 X 和或连接例如 select e from Foo where name X1 or n
为什么C++中的静态thread_local对象被构造两次？

这段代码 include
有 UIView 调整大小事件吗？

我有一个视图其中包含图像视图的行和列如果调整此视图的大小我需要重新排列图像视图的位置该视图是另一个已调整大小的视图的子视图有没有办法检测该视图何时调整大小正如 Uli 在下面评论的那样正确的方法是覆盖layoutSubview
如何告诉 Gem 文件使用 gem 的特定本地副本

假设我有一颗宝石幸福地生活在 MyPath MyGem gem 我想使用本地且独特的 gem 而不是来自 Github 或从任何地方获取的 gem 版本我如何指定我要使用gem mygem from MyPath MyGem gem 尝试
检测文本是否溢出[重复]

这个问题在这里已经有答案了如何检测文本是否溢出例如以下文本的长度超出了 div 容器允许的长度我如何在 JavaScript 中检测到这一点 div style max width 100px Lorem ipsum dolor s
使用快速傅里叶变换分析音频

我正在尝试用 python 创建图形频谱分析仪我当前正在读取 16 位双通道 44 100 Hz 采样率音频流的 1024 字节并对 2 个通道的幅度进行平均现在我有 256 条签名短裤我现在想使用 numpy 之类的模块对该数组执

使用快速傅里叶变换分析音频

使用快速傅里叶变换分析音频 的相关文章

随机推荐

热门标签

使用快速傅里叶变换分析音频的相关文章