实际上声音匹配/搜索的当前技术水平如何?我目前正在远程参与规划一个 Web 应用程序,该应用程序将包含并公开录制的短音频剪辑(最多 3-5 秒,人名)的数据库。有人提出了是否有可能实现基于用户语音输入的搜索的问题。我的直觉告诉我,从计算和算法的角度来看,这都是一项不可能完成的任务,尤其是在 Web 应用程序中(除此之外,它不是应用程序的核心功能)。我意识到可能有很多学术项目,这将是一个很好的研究主题,但它不是任何可以作为附加功能实现到中型 Web 应用程序的东西。为了支持我的主张,我花了半个小时进行搜索,这样我就不会错过任何明显的东西,但我确实找不到任何好的来源。
我知道在不花更多时间自己研究的情况下提出关于 SO 的问题不是很负责任,但我注意到,在 SO 上提出问题比随机谷歌搜索更有效、更精确、更快。
有一些音频指纹识别技术(大部分是专有的),它本质上是“散列”音频文件。然后搜索就是一个简单的哈希表或数据库查找。
Musicbrainz 对各种技术都有很好的总结Here http://musicbrainz.org/doc/Audio_Fingerprint
这些指纹是否适合或准确适合您的特定情况,我无法告诉您。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)