比较两个音频文件[重复]

2023-11-23

基本上，我有很多代表同一首歌的音频文件。然而，有些歌曲的质量比原曲差，有些经过编辑，与原曲不再相符。我想做的是以编程方式将这些音频文件与原始音频文件进行比较，看看哪些音频文件与该歌曲匹配，无论质量如何。直接比较显然行不通，因为文件的质量各不相同。

我相信这可以通过分析歌曲的结构并与原曲进行比较来完成，但我对音频工程一无所知，所以这对我没有多大帮助。所有歌曲的格式相同（MP3）。另外，我正在使用 Python，所以如果有它的绑定，那就太棒了；如果没有，那么适用于 JVM 甚至本地库的东西也可以，只要它在 Linux 上运行并且我可以弄清楚如何使用它。

这实际上不是一项微不足道的任务。我认为没有任何现成的图书馆可以做到这一点。这是一种可能的方法：

将 mp3 解码为 PCM。
确保 PCM 数据具有您事先选择的特定采样率（例如 16KHz）。您需要对具有不同采样率的歌曲进行重新采样。不需要高采样率，因为无论如何您都需要模糊比较，但太低的采样率会丢失太多细节。
归一化 PCM 数据（即找到最大样本值并重新调整所有样本，以便具有最大幅度的样本使用数据格式的整个动态范围，例如，如果样本格式为有符号 16 位，则归一化后最大振幅样本应具有值 32767 或 -32767 ）。
将音频数据分割成固定数量样本的帧（例如：每帧 1000 个样本）。
将每一帧转换为谱域（FFT).
计算代表两首歌曲的帧序列之间的相关性。如果相关性大于某个阈值，则假设歌曲是相同的。

Python 库：

PyMedia（对于步骤 1）
NumPy（用于数据处理）--另见本文一些介绍性信息

一个额外的并发症。您的歌曲在开始时可能会有不同长度的静音。因此，为了避免漏报，您可能需要执行额外的步骤：

3.1.从头开始扫描 PCM 数据，直到声能超过预定义的阈值。（例如，使用 10 个样本的滑动窗口计算 RMS，并在超过动态范围的 1% 时停止）。然后丢弃直到此时的所有数据。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

比较两个音频文件[重复] 的相关文章

numba 函数何时编译？

我正在研究这个例子 http numba pydata org numba doc 0 15 1 examples html multi threading http numba pydata org numba doc 0 15 1 ex
django_openid_auth TypeError openid.yadis.manager.YadisServiceManager 对象不是 JSON 可序列化

I used django openid auth在我的项目上一段时间以来它运行得很好但今天我测试了该应用程序并遇到了这个异常 Environment Request Method GET Request URL http local
我怎样才能更多地了解Python的内部原理？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我使用Python编程已经有半年多了我对Python内部更感兴趣而不是使用Python开发应用程序
如何在序列化器创建方法中获取 URL Id？

我有以下网址 url r member P
如何迭代按值排序的 Python 字典？

我有一本字典比如 a 6 b 1 c 2 我想迭代一下by value 不是通过键换句话说 b 1 c 2 a 6 最直接的方法是什么 sorted dictionary items key lambda x x 1 对于那些讨厌 la
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
如何使用 imaplib 获取“消息 ID”

我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好所以我认为 Message ID 是正确的但我不知道如何获取它我只知道 imap fetch uid XXXX 有人有解决方案吗来自 IMAP 文档本身 IMAP4消息号
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
使用 NumPy 将非均匀数据从文件读取到数组中

假设我有一个如下所示的文本文件 33 346 1223 10 23 11 23 12 23 13 23 14 23 15 23 16 24 10 24 11 24 12 24 13 24 14 24 15 24 16 25 14 25 15
如何在 OSX 上安装 numpy 和 scipy？

我是 Mac 新手请耐心等待我现在使用的是雪豹 10 6 4 我想安装numpy和scipy 所以我从他们的官方网站下载了python2 6 numpy和scipy dmg文件但是我在导入 numpy 时遇到问题 Library F
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
迭代 my_dict.keys() 并修改字典中的值是否会使迭代器失效？

我的例子是这样的 for my key in my dict keys my dict my key mutate 上述代码的行为是否已定义假设my dict是一本字典并且mutate是一个改变其对象的方法我担心的是改变字典中的值可能
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在
您可以使用关键字参数而不提供默认值吗？

我习惯于在 Python 中使用这样的函数方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

在 java eclipse 控制台中更改颜色

有没有办法改变eclipse控制台中的文本颜色我不是在谈论当我进入选项并将颜色从黑色更改为红色时我的意思是就像当我启动程序并执行代码时它会在某个时刻改变颜色例如 code if a 2 change text color to r
SimpleCov 报告使用 Spork 运行 RSpec 测试后未在 Rails 3 应用程序中生成

我刚刚安装了简单冠状病毒gem 在我的 Rails 3 2 6 应用程序上生成代码覆盖率报告它与 RSpec 配合得很好但与 Spork 配合不好我可以通过运行获得所需的正确报告rspec no drb spec 但我也想让它们与 S
没有删除语句的 MySQL 复制

我一直在寻找一种方法来防止MySQL删除语句被从站处理我正在从事数据仓库项目我想在将数据复制到从站后从生产服务器中删除数据完成这件事的最佳方法是什么谢谢做这件事有很多种方法 Run SET SQL LOG BIN 0 在执行删除之
如何交错流（带背压）

假设我有两个可能无限的流 s1 a b c d e s2 1 2 3 4 5 6 7 我想要merge流然后使用缓慢的异步操作映射合并流例如在 Bacon 中 fromPromise and flatMapConcat 我可以将它们与
服务器端多次TIME_WAIT的代价是多少？

假设有一个客户端与服务器建立了大量短期连接如果客户端关闭连接会出现很多端口TIME WAIT在客户端声明由于客户端耗尽了本地端口因此无法快速尝试新的连接如果服务器关闭连接我会看到很多TIME WAIT在服务器端然而这有什么坏
SQL 在 WHERE 子句中合并

我正在尝试在我拥有的存储过程中实现可选参数但遇到了问题这是一个简化的查询来说明该问题 SET ANSI NULLS OFF DECLARE MiddleName VARCHAR 20 SET MiddleName NULL SELECT
NumberFormat 解析不够严格

我有一个JFormattedTextField with a NumberFormat与 Locale US 因此小数点分隔符是点分组分隔符是逗号现在我在此文本字段中键入字符串 1 23 并将焦点移至另一个组件我希望该字符串会消失
Hibernate 升级：StatisticsService()

我正在将 hibernate 从 3 6 升级到 4 3 5 更换后 jar文件和一些已弃用的包类以及基本数据类型我仍然遇到一些错误StatisticsService 在org hibernate jmx包裹错误如下 1 error p
Ruby on Rails：在布局中的特定位置生成特定视图

如果我有一个标记然后我的所有视图都会呈现在布局中的同一位置我可以有不同的吗不同视图的标签那我该怎么办呢谢谢调查ActionView Helpers CaptureHelper 您可以在您的视图中执行以下操作这将在 content
复制 QTableView 的一部分

因此我有一个问题与我在这里看到的另一个问题非常密切相关但当我尝试在那里提出我的问题时我没有得到答复我希望通过提出这个新问题有人可以帮助我基本上我只想复制我创建的表格的一部分以便我可以将其粘贴到 Excel 文件中这是我所拥有
Python 中的 SSLSocket 密码/密码

我最近一直在考虑为我的一个应用程序制作 iOS 推送通知服务它有一个 Python 2 7 后端所以我想用 Python 而不是 PHP 或其他任何东西来完成它我有发送通知并且设备接收通知的代码但是每次运行该代码时它都会要求我手
如何将 Javascript 日期时间转换为 C# 日期时间？

我一直在读到如果你想从 JavaScript 日期转换为 C 日期你应该使用getTime 然后将该结果添加到 C DateTime 假设我有这样的 JavaScript 时间 Date Tue Jul 12 2011 16 00 00
如何为iPhone创建一个黑色渐变的UIButton？

我想在 iOS 中创建一个具有普通黑色渐变主题的 UIButton 我查看了文档似乎不知道如何执行此操作当我创建按钮时我得到一个没有颜色的圆角矩形按钮这是我的代码 UIButton leagueTeamButton UIButton
C++ 当从函数返回结构体时，汇编中实际发生了什么？

我试图弄清楚如果从函数中按值返回结构而不是返回指向该结构的指针那么在 C 中实际会发生什么如果函数只能返回适合寄存器的值那么当按值发送结构时如何进行通信我在某处读到过我尝试在 Godbolt 上测试它看看它在做什么但我不了
SSL_connect 返回=1 errno=0 状态=错误：证书验证失败（无法获取本地颁发者证书）

我正在尝试从我的应用程序发布到网络服务但经常收到以下错误 SSL connect returned 1 errno 0 state error certificate verify failed unable to get local i
如何使用 doc 任务生成 scaladoc 后运行 bash 脚本？

我有一个简短的 Bash 脚本它对我的 Scaladoc 注释进行查找和替换以便生成第三方库的外部文档的链接我希望每次使用以下命令生成 Scaladocs 时都运行此脚本doc task 我怎样才能实现这个目标这实际上很容易首先
Newtonsoft JSON 序列化 byte[] 属性 [重复]

这个问题在这里已经有答案了 public class MyClass public byte Bytes get set MyClass obj new MyClass obj Bytes new byte 1 22 44 55 strin
HTML5 音频 - currentTime 属性不准确？

我正在研究一下 HTML5
逐行测试多个（并非所有）列是否相等

我想按行检查多列是否全部相等我想出了一种复杂的方法来计算每组每个值的出现次数但这似乎有些麻烦样本数据 sample df lt data frame id letters 1 6 group rep c r l 3 stringsA
比较两个音频文件[重复]

这个问题在这里已经有答案了基本上我有很多代表同一首歌的音频文件然而有些歌曲的质量比原曲差有些经过编辑与原曲不再相符我想做的是以编程方式将这些音频文件与原始音频文件进行比较看看哪些音频文件与该歌曲匹配无论质量如何直接比较显

比较两个音频文件[重复]

比较两个音频文件[重复] 的相关文章

随机推荐

热门标签