编写一个识别声音并执行操作的程序

2023-11-26

我想编写一个能够存储声音模式的程序,例如火车汽笛、喇叭(嘟嘟声)...通过麦克风收听声音..​​.然后在听到声音时采取一些行动。我懂一点Python,很早以前就用VB 编程过。我主要是一个 Oracle、PLSQL 人员。该程序需要一个适度的用户界面。

解决这个问题的最佳解决方案组合是什么(语言、第三方插件等)?


我的猜测是,在这种情况下阻力最小的途径是结合使用第三方音频识别库和高级语言(例如 Java 或 .NET 系列语言之一,例如 C# 或 VB.NET)。

您可以首先在以下领域进行一些研究数字声音处理和音频识别。

当您找到具有您感兴趣的功能并且以您选择的语言进行绑定的库或框架时,请开始使用它来实现。

See MARF(一个 Java 库),也许微软在这个领域的工作是系统语音识别命名空间(如果我没记错的话,它已与较新的 Windows 操作系统集成)

编辑 - 桌面与从网络运行

在评论中,您询问了有关使用 Flash 或 Silverlight 的问题,以便您的解决方案能够在桌面或网络上运行。

首先,我想指出 Flash 和 Silverlight 实际上都在客户端计算机上运行。不同之处在于它们在 Web 浏览器的上下文中运行,并且用户不必安装该应用程序。除此之外,它们与桌面应用程序没有太大区别,并且用户显然必须为其浏览器安装 Flash of Silverlight 插件。

如果这就是您所追求的(即用户不必安装您的应用程序),那么您可以考虑 Flash、Silverlight 或Java网络启动。实际上 JAVA Web Start 可能是一个不错的选择,因为您可以利用MARF框架.

但是,如果您决定使用 Flash、Silverlight 或 Java Web Start,则可能需要处理一些安全问题,因为访问客户端系统资源必然需要一些大多数“基于 Web 的应用程序”不需要的权限通常需要。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

编写一个识别声音并执行操作的程序 的相关文章

  • 如何在 iPhone 上进行实时声音/信号处理?

    我可能正在开发一个基于 iPhone 的应用程序 进行近乎实时的声音处理 过滤等 我想知道开始的最佳方式 我想创建一个用于录制和处理声音的音频提示吗 如上所述here http developer apple com iphone libr
  • waveOutWrite 和 waveOutGetPosition 死锁问题

    我正在开发一个使用连续播放音频的应用程序waveOut API来自winmm dll 该应用程序使用 leapfrog 缓冲区 它基本上是一堆转储到音频队列中的样本数组 Windows 按顺序无缝播放它们 并且当每个缓冲区完成时 Windo
  • 从动态内容提供者加载 html5 音频并进行身份验证

    假设我们这里有一个内容提供者端点myuri org api auth sources id 它返回由 id 标识的音乐文件 路线 api auth 需要身份验证 在本例中 这是通过在请求标头中传递 JWT 来完成的 如下所示Authenti
  • 使用 AVAudioEngine 重复播放音频文件

    我正在使用 Swift 和 Xcode 6 开发一个 iOS 应用程序 我想做的是使用 AVAudioEngine 播放音频文件 到目前为止一切正常 但是我怎样才能不停止地播放它 我的意思是 当它结束播放时它会再次开始 这是我的代码 CON
  • Python检测关键字

    我正在做的应用程序执行以下操作 1 如果麦克风检测到一些噪音 它就会开始录制音频 直到检测不到噪音 之后 音频被录制到 wav 文件中 2 我必须检测上面的一些文字 只有 5 到 10 个单词需要检测 到目前为止 我的代码只执行第一部分 检
  • Clojure/Java:用于声音频谱分析的 Java 库? [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找一个可以接受大量音频数据并返回给定频带内随时间变化的平均幅度的库 我已经在 comp dsp
  • NAudio 音调变换

    我正在使用 NAudio DLL 并且正在寻找音调变换声音的示例代码 有一个使用的例子NAudio https github com naudio NAudio用于开源中的音高变换Skype 变声器 https github com mar
  • 如何低延迟地使用 Android 音频

    Problem 您可能听说过 Android 不提供低延迟音频 API 我所说的低延迟音频是指您应该能够从麦克风获取音频信号并播放声音 中间没有太多时间间隔 例如 5 7 毫秒 我尝试过旧的java 带有AudioRecord和AudioT
  • 如何在 PhantomJS 中使用 JavaScript 检测网页上的声音?

    我需要检测带有横幅的网页中的所有声音 我怎样才能做到这一点 我查看 PhantomJS 但找不到浏览器声音的 API PhantomJS 1 x 和 2 不支持 Flash
  • 如何使用 javascript 从 Audio Element 录制音频

    我正在使用 HTML5 和 Javascript 制作录音机 并且不想包含任何第三方 API 我的第一步是使用以下命令创建音频检索器和播放器
  • OpenAL 初始化问题,仅限 iPod(?)

    我遇到了 OpenAL 问题 似乎只发生在 iPod 硬件上 奇怪的是它was工作正常 但现在不行了 我正在设置音频会话 AVAudioSession sharedInstance setCategory AVAudioSessionCat
  • TarsosDSP 音高分析傻瓜式教程

    我正在开发一个分析声音文件音调的程序 我遇到了一个非常好的 API 称为 TarsosDSP 它提供了各种音高分析 然而 我在设置它时遇到了很多麻烦 有人可以向我展示一些有关如何使用此 API 特别是 PitchProcessor 类 的快
  • 当通过音频采样的数据数量超过 AudioRecord 构造函数中设置的“bufferSizeInBytes”时会发生什么?

    public AudioRecord int audioSource int sampleRateInHz int channelConfig int audioFormat int bufferSizeInBytes 这是公共构造函数Au
  • 使用 Google Speech 时从 Google Cloud Storage 访问音频文件

    我使用下面的这段代码使用 Google Speech 成功解析了包含语音的 wav 文件 并将其转换为文本 但我想访问另一个 wav 文件 该文件已放置在 Google Cloud Storage 公开 上 而不是本地硬盘上 为什么不简单地
  • 如何使用ffmpeg重叠和合并多个音频文件?

    我正在尝试将多个音频文件合并到一个文件中 但我可以使用以下命令来连接 而不是连接 ffmpeg v debug i file1 wav i file2 wav i file3 wav filter complex 0 0 concat n
  • 软件音频线路输入

    这可能是也可能不是询问的地方 如果不是 就直接扔掉它 我有一个正在输出音频的软件 我想将其路由到另一个软件 简单的解决方案是将耳机插孔连接到麦克风插孔或在计算机上启用立体声混音 但是 我想要做的进一步实现将在一台机器上发生 2 个这样的实例
  • 使用 C 创建立体声正弦波

    我正在尝试用 C 创建立体声正弦 WAV 并且可能有不同的 可能是空白的 左声道和右声道 使用此函数为每个通道生成一个音调 int16 t create tone float frequency float amplitude float
  • 音频html标签无法快进或快退控制

    我正在使用音频 html 标签从我的上传服务器加载音频 但我不知道为什么我的音频无法像往常一样循环 快进或快退控制 我的音频 标题 Accenpt Ranges bytes Connection Keep Alive Content Len
  • 使用项目中的波形文件

    我目前只能通过将波形文件放在已编译的 exe 旁边来播放背景声音 但我实际上想要一个包含波形文件的静态可执行文件 这在Delphi XE2中可能吗 这是我的代码 SndPlaySound Raw wav SND ASYNC or SND L
  • 在下载整个文件之前是否可以知道 MP3 的持续时间?

    这是一个关于MP3文件格式的问题 我一直在寻找一种获得 MP3 持续时间的方法 由于我使用 JLayer SPI 来解码 MP3 我发现在音频源是文件的情况下这是可能的 AudioFileFormat fileFormat AudioSys

随机推荐