我在编程和转换方面遇到了一些麻烦。我正在设计一个人工智能来识别乐器演奏的音符,并需要从波形文件中提取原始声音数据。我的目标是对文件中的时间块执行 FFT 运算以供 AI 使用。为此,我需要音频文件的幅度列表,但我似乎找不到可行的转换技术。这些文件以 MP3 开头,然后我将它们转换为 wav 文件,但我总是得到一个压缩文件,当我尝试读取它时,它会吐出乱码。有谁知道我如何将 wav 文件转换为与 Python 的波形模块兼容的文件,甚至将数据直接转换为幅度列表的文件?
默认的 Python wave 模块不是很彻底。您可以尝试 scipy 中包含的一个作为替代方案。
查看:在Python中读取*.wav文件 https://stackoverflow.com/questions/2060628/how-to-read-wav-file-in-python
如果您要对音频进行任何数字繁重的工作,那么 scipy 可能是您的最佳选择。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)