我的项目是使用麦克风进行说话人识别。
我正在使用 speeh_recognition 库来提取麦克风音频,但该对象的类是“speech_recognition.AudioData”,我不知道如何将其转换为 wav 文件(例如为了使用 librosa 来获取音频功能)也许还能认出说话者)。
有人可以帮我吗?我学习 Python 的时间不长,所以可能还有更简单的方法来使用麦克风进行说话人识别:)
非常感谢 !
将音频写入 WAV 文件:
with open("microphone-results.wav", "wb") as f:
f.write(audio.get_wav_data())
引用doc:
返回表示 WAV 文件内容的字节字符串
包含由 AudioData 实例表示的音频。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)