为了让您获得答案,您需要专注于您已经完成战斗并显示代码的可回答问题
在我的脑海中,我会走过音频,取出一桶多个样本...然后将桶滑过几个样本并执行另一个桶拔取操作...允许每个桶包含前一个桶中也包含的重叠样本以及下一个桶...更少的样本,更快的计算,更多的样本,在一定程度上更高的准确性 YMMV
...将每个桶输入傅里叶变换,将时域输入音频渲染为其频域对应项...将每个桶的 FFT 显着属性记录到数据库中,例如具有最大能量的 X 频率(最大幅度)你的快速傅里叶变换)
...还可以存储那些最高 X 频率相对于其能量的标准偏差(这些频率的分散程度如何)...根据需要定义其他此类属性...对于这种频域方法的工作,您需要相对较少由于 FFT 适用于周期性时间序列数据,因此每个存储桶中都有样本,因此如果您为其提供 500 毫秒的复杂音频(例如语音或音乐),您将不再拥有周期性音频,而是拥有糊状音频
然后,一旦所有现有音频都通过上述处理发送,对您的实时新音频执行相同的操作,然后确定哪些先前音频包含与您当前音频输入最相似的存储桶序列...使用贝叶斯方法,以便您的猜测附加概率权重自己实时更新
听起来是一个非常酷的项目,祝你好运……这里有一些音频指纹资源
音频片段 A 是否出现在音频文件 B 中
检测音频中的音频[音频识别]检测音频中的音频[音频识别] https://stackoverflow.com/questions/61760505/detecting-audio-inside-audio-audio-recognition
在 Arduino 中从 FFT 检测特定模式在 Arduino 中从 FFT 检测特定模式 https://stackoverflow.com/questions/57151674/detecting-a-specific-pattern-from-a-fft-in-arduino/57152618#57152618
使用 AudioContext API 进行音频指纹识别https://news.ycombinator.com/item?id=21436414 https://news.ycombinator.com/item?id=21436414
https://iq.opengenus.org/audio-fingerprinting/ https://iq.opengenus.org/audio-fingerprinting/
Chromaprint 是 AcoustID 项目的核心组件。
它是一个客户端库,实现了从任何音频源提取指纹的自定义算法https://acoustid.org/chromaprint https://acoustid.org/chromaprint
从 FFT 检测特定模式在 Arduino 中从 FFT 检测特定模式 https://stackoverflow.com/questions/57151674/detecting-a-specific-pattern-from-a-fft-in-arduino/57152618#57152618
音频地标指纹识别作为节点流模块 - nodejs 将 PCM 音频信号转换为一系列音频指纹。https://github.com/adblockradio/stream-audio-fingerprint https://github.com/adblockradio/stream-audio-fingerprint
所以后续
如何比较/匹配两个不相同的声音片段如何比较/匹配两个不相同的声音片段 https://stackoverflow.com/questions/49895223/how-to-compare-match-two-non-identical-sound-clips
Python 中的音频指纹识别和识别https://github.com/worldveil/dejavu https://github.com/worldveil/dejavu
使用 Python 和 Numpy 进行音频指纹识别http://willdrevo.com/fingerprinting-and-audio-recognition-with-python/ http://willdrevo.com/fingerprinting-and-audio-recognition-with-python/
MusicBrainz:开放的音乐百科全书(musicbrainz.org)https://news.ycombinator.com/item?id=14478515 https://news.ycombinator.com/item?id=14478515
https://acoustid.org/chromaprint https://acoustid.org/chromaprintChromaprint 是如何工作的?https://oxygene.sk/2011/01/how-does-chromaprint-work/ https://oxygene.sk/2011/01/how-does-chromaprint-work/
https://acoustid.org/ https://acoustid.org/
MusicBrainz 是一个开放的音乐百科全书,收集音乐元数据并将其提供给公众。https://musicbrainz.org/ https://musicbrainz.org/
Chromaprint 是 AcoustID 项目的核心组件。
它是一个客户端库,实现了从任何音频源提取指纹的自定义算法https://acoustid.org/chromaprint https://acoustid.org/chromaprint
音频匹配(音频指纹) https://stackoverflow.com/questions/26357841/audio-matching-audio-fingerprinting
是否可以比较两首相似歌曲的 wav 文件?是否可以比较两首相似歌曲的 wav 文件? https://stackoverflow.com/questions/44483441/is-it-possible-to-compare-two-similar-songs-given-their-wav-files
音频哈希https://en.wikipedia.org/wiki/Hash_function#Finding_similar_records https://en.wikipedia.org/wiki/Hash_function#Finding_similar_records
音频指纹
ACR云https://www.acrcloud.com/ https://www.acrcloud.com/
如何使用 Python 和 Gracenote 识别音乐样本? https://stackoverflow.com/questions/38075577/how-to-recognize-a-music-sample-using-python-and-gracenote
音频地标指纹识别作为节点流模块 - nodejs 将 PCM 音频信号转换为一系列音频指纹。https://github.com/adblockradio/stream-audio-fingerprint https://github.com/adblockradio/stream-audio-fingerprint