声音匹配/搜索

2024-03-02

实际上声音匹配/搜索的当前技术水平如何？我目前正在远程参与规划一个 Web 应用程序，该应用程序将包含并公开录制的短音频剪辑（最多 3-5 秒，人名）的数据库。有人提出了是否有可能实现基于用户语音输入的搜索的问题。我的直觉告诉我，从计算和算法的角度来看，这都是一项不可能完成的任务，尤其是在 Web 应用程序中（除此之外，它不是应用程序的核心功能）。我意识到可能有很多学术项目，这将是一个很好的研究主题，但它不是任何可以作为附加功能实现到中型 Web 应用程序的东西。为了支持我的主张，我花了半个小时进行搜索，这样我就不会错过任何明显的东西，但我确实找不到任何好的来源。

我知道在不花更多时间自己研究的情况下提出关于 SO 的问题不是很负责任，但我注意到，在 SO 上提出问题比随机谷歌搜索更有效、更精确、更快。

有一些音频指纹识别技术（大部分是专有的），它本质上是“散列”音频文件。然后搜索就是一个简单的哈希表或数据库查找。

Musicbrainz 对各种技术都有很好的总结Here http://musicbrainz.org/doc/Audio_Fingerprint

这些指纹是否适合或准确适合您的特定情况，我无法告诉您。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Audio

声音匹配/搜索的相关文章

Python 中的跨平台音频播放

是否有用于音频播放的跨平台 Python 库我的目标操作系统是按重要性排序 Windows Linux 和 Mac OSX 需要支持的文件格式是按重要性排序 MP3 OGG WAV 和 FLAC 这样的事情存在吗我尝试了一些可用的
如何在 Android 应用程序中播放和停止 mp3 文件

我在 eclipse 中创建了一个应用程序来播放和停止 mp3 文件一切都很好除了当我播放音频文件并停止它并且我想重播它时播放 btn 不起作用我想知道是否有人可以帮助我提前致谢代码如下 package ir polyglotc
实时录制/将音频数据转换为 WAV

我在音频信号处理方面是新手目前我已将设备连接到我的电脑该电脑从麦克风播放轨道向我发送音频数据我已经使用 Steinberg ASIO SDK 2 3 创建了主机应用程序该应用程序连接到设备并在重复回调中返回原始数据信号是 24
iOS Swift - 使用蓝牙外部扬声器时音质较差

我正在使用从 url 广播应用程序流式传输的 iOS 应用程序一旦我尝试通过外部扬声器或汽车音响系统等蓝牙设备从应用程序进行流传输音频质量就会非常差且刺耳当从 iOS 设备本身播放时一切听起来都很好扬声器和耳机 override
在 IE 中使用 html 音频：MEDIA12899：音频/视频：未知的 MIME 类型

html如下
iPhone 上的 SoundManager2 - 声音无法在 jQuery Load 上播放

我正在尝试使用 SoundManager2 作为 iPhone Web 应用程序的一部分以便在使用 jQuery 提交表单后播放声音播放的特定声音取决于结果因此结果页面设置一个变量来标识要播放的声音文件这一切在桌面上运行都没有问题
Java - 调整 WAV 文件的播放速度

我可能很笨但我似乎找不到解决我的问题的方法 NOTE 我发现很多人报告了这个问题似乎它是由于较新的 Java 可能是 1 5 而发生的也许不再支持 SAMPLE RATE 我无法找到任何解决方案我正在尝试调整 SAMPLE RATE
MATLAB：让audioplayer()在函数结束后继续播放

我正在使用使用以下子函数的代码 function playTone duration toneFreq Generate a tone samplesPerSecond 44100 the bit rate of the tone y si
使用 DirectSound 向后读取声音

是否可以使用 DirectSound 的托管版本向后读取声音如果没有是否有另一个库可以轻松实现您可以使用 WaveFileReader 和 WaveFileWriter 类NAudio http www codeplex com na
在 Mobile Safari 中重用 HTML5 音频对象

我希望在 iPad 上的 Mobile Safari 中运行的 Web 应用程序上播放一个简短小于 1 秒的音频文件以响应用户输入同时将事件和音频播放之间的延迟降至最低在页面重新加载之间可以多次触发播放因此我想缓存音频文件以下
Android 将原始字节记录到 WAVE 文件中以进行 Http Streaming

所以我正在使用AudioRecord从 Android 记录原始字节并将其写入 wav 文件由于 Android 不支持此功能我必须使用以下代码手动编写 wav 文件头 randomAccessWriter writeBytes RIF
Firefox createMediaStreamDestination 使用 rtc 的错误？

我通过 rtc 流式传输音频并想要静音和取消静音音频这有效但没有增益控制 function stream getUserMedia stream console log Access granted to audio video pee
如何使用python将下载的音频文件扩展名重命名为mp3

目前我正在尝试根据艺术家姓名和歌曲标题将 YouTube 音乐视频下载为音频文件下载所有视频后我尝试将所有音频文件从 webm 或 mp4 扩展名重命名为 mp3 但似乎我在将文件名和扩展名更改为 mp3 时遇到了一些错误我的代码基
如何使用 Android 1.5 录制音频？

如何使用 Android 录制一些音频 package com benmccann android hello import java io File import java io IOException import android me
android 录音时可以静音吗

我想构建一个应用程序我想在通话中调制声音我编写了一段代码来记录声音并以不同的音调播放它现在我想要在通话时使用此功能我想将通话静音记录声音然后以不同的音调播放它如何将通话静音但仍录制音频此答案可在通话期间使麦克风静音 Boole
如何在 iOS 中使用 AVPlayer 缓冲音频？

我想播放来自互联网的流音频我编写了播放流的代码但它没有任何缓冲区因此如果信号较弱应用程序将停止播放音频这是我的代码 import UIKit import AVFoundation import MediaPlayer impor
软件音频线路输入

这可能是也可能不是询问的地方如果不是就直接扔掉它我有一个正在输出音频的软件我想将其路由到另一个软件简单的解决方案是将耳机插孔连接到麦克风插孔或在计算机上启用立体声混音但是我想要做的进一步实现将在一台机器上发生 2 个这样的实例
java中wav文件转换为字节数组

我的项目是阿塞拜疆语音的语音识别我必须编写一个程序来转换wav文件到字节数组如何将音频文件转换为byte 基本上如第一个答案中的片段所描述但不是BufferedInputStream use AudioSystem getAudio
如何在 iPad 上使用 HTML5/Javascript 合成音频

有没有人有工作示例代码可以在 iPad 上的 Mobile Safari 上使用 HTML5 Javascript 合成并播放音频我在网上找到了一些基于 javascript 的声音合成示例但它们似乎都只能在 Firefox 中使
使用项目中的波形文件

我目前只能通过将波形文件放在已编译的 exe 旁边来播放背景声音但我实际上想要一个包含波形文件的静态可执行文件这在Delphi XE2中可能吗这是我的代码 SndPlaySound Raw wav SND ASYNC or SND L

随机推荐

MVC Mini Profiler 不尊重应用程序的路径

我已经按照其描述设置了 MVC Mini Profiler项目页面 http code google com p mvc mini profiler 并且包含内容确实被写在页面上问题是我的应用程序位于http localhost 808
在 AWS Ubuntu 14.04.1 LTS 上安装 Sublime Text 3

Sublime text 是适用于 Windows 和 Linux 的快速编辑器 http www sublimetext com 我无法使用以下命令在 AWS Ubuntu 14 04 1 LTS 上安装 sublime text 3 s
测量 wifi 到 Iphone/Ipad 的信号强度

我想从 iOS 设备获取当前的 Wifi 信号强度 Google 搜索仅显示适用于 Android 设备的解决方案从文献中我了解到 Apple 不允许访问硬件因此没有人可以通过他们的应用程序以 dbm 形式检索设备的信号强度它是否正确
Spring Batch- ItemWriter - DataIntegrityViolationException - 跳过记录 - 重试 - 不起作用

我从某个时候就被这个问题困扰了我正在使用 spring batch 3 0 7 问题是如果org springframework dao DataIntegrityViolationException在 ItemWriter 中的一条记录
Python/ Pandas：找到左右最大值

我有一个 pandas 数据框第一列中有一个区域其余部分有 8 年的季度数据大约有 4400 行这是一个示例 idx Q12000 Q22000 Q32000 Q42000 Q12001 Q22001 Q32001 Q42001 Q
Android LocationServices.checkLocationSettings 误报结果

目前受影响的设备 Xperia 1 II 小米红米Note 7 Use 为了请求位置更新我检查位置设置事先就足够了如果没有我会显示一条小文字表明服务必须为我的功能启用如果用户单击它系统对话框将启用会提示定位服务我如何运行
在一列中添加多个值

我必须按如下所示的方式创建一个表我们可以这样创作吗如果是表名示例 product id product name category 1 Sample1 1 2 3 2 sample2 4 5 6 其中类别字段包含多个值我们如何搜索
使用 vector 作为缓冲区，而不在 resize() 上对其进行初始化

我想用vector
Powershell：确定进程是 32 位还是 64 位

有没有办法确定给定的进程 ID 是 32 位进程还是 64 位进程我正在使用 Powershell v3 0 尝试这个 Add Type MemberDefinition DllImport kernel32 dll SetLastErr
改造响应保留旧数据并将新数据添加到 editText 搜索的数据中

我正在使用 editText 搜索从 API 获取数据第一次搜索时它按预期工作但在第二次搜索时它不会显示唯一的新响应而是保留旧响应并在其末尾添加新响应它的行为就像缓存以前的一样我该如何修复该问题以仅显示最后一个搜索词结果分段
Google 云端硬盘文件列表：500 错误

对于我们的应用程序我们使用具有 2 足授权的 Google Drive SDK 我们使用 Drive SDK 很长时间了但今天我们遇到了 Files list API 的新问题 https developers google com d
用于一对多查找的 Cassandra 数据建模

考虑存储用户及其联系人的问题大约有一亿用户每个用户有几百个联系人平均联系人大小为 1kb 可能有些用户拥有太多联系人 gt 5000 并且可能有一些联系人比平均 1kb 大得多例如 10 倍用户会主动添加联系人但很少会删除联系人
使用 Ansible 配置 Jenkins 2.0

我使用 Ansible 来配置我们的服务器我安装了 Jenkins 2 0 但当我打开 Web UI 时它变成了启动配置我如何使用 Ansible 或 shell 或 jenkins cli 来做到这一点 CentOS 7 Ansib
登录时从用户集合中获取用户数据

我目前正在开发一个在客户端初始化了 firebase 的应用程序当用户通过 firebase 登录时我想从 firestore 获取用户的数据我目前正在这样做onAuthStateChanged侦听器并成功获取用户我想知道这是否是获
套接字连接超时：规范在哪里？

我的工作环境是我的局域网下面的代码示例是用 Java 语言编写的但我的问题是关于 TCP 而不是编程我遇到过以下连接超时的情况 2 ms when connection established 当主机处于活动状态但未侦听指定套接字端口
emacs lisp 中的 let 和 flet

我不知道你是否会称其为规范公式但为了绑定本地函数 GNU 手册建议我使用 flet defun adder with flet x flet f x x 3 f x 然而我偶然尝试了在玩了一会儿Scheme之后下面的表达式其中我使
将给定字符串转换为具有给定子字符串的回文

给定字符串 S1 和字符串 S2 将字符串 S1 转换为回文字符串例如 S2 是该回文字符串的子字符串 S1 上允许的唯一操作是将任何字符替换为任何其他字符找出所需的最少操作次数我已经编写了这段代码可以计算需要使用常规字符串进行多少
AngularJS CORS 问题

我已经搜索了 200 多个网站也许有点夸张但也不是很多来了解如何使用 angularjs 处理 cors 我们有一台运行 Web API 服务器的本地计算机我们正在开发一个调用 API 获取数据的客户端当从服务器运行客户端时我们
计算多维数组中的元素数量

我有这个代码 loadData function jsonArray var id this attr id for var i in jsonArray id tbody append tr class entry details pag
声音匹配/搜索

实际上声音匹配搜索的当前技术水平如何我目前正在远程参与规划一个 Web 应用程序该应用程序将包含并公开录制的短音频剪辑最多 3 5 秒人名的数据库有人提出了是否有可能实现基于用户语音输入的搜索的问题我的直觉告诉我从计算和算

声音匹配/搜索

声音匹配/搜索 的相关文章

随机推荐

热门标签

声音匹配/搜索的相关文章