编写一个识别声音并执行操作的程序

2023-11-26

我想编写一个能够存储声音模式的程序，例如火车汽笛、喇叭（嘟嘟声）...通过麦克风收听声音...然后在听到声音时采取一些行动。我懂一点Python，很早以前就用VB 编程过。我主要是一个 Oracle、PLSQL 人员。该程序需要一个适度的用户界面。

解决这个问题的最佳解决方案组合是什么（语言、第三方插件等）？

我的猜测是，在这种情况下阻力最小的途径是结合使用第三方音频识别库和高级语言（例如 Java 或 .NET 系列语言之一，例如 C# 或 VB.NET）。

您可以首先在以下领域进行一些研究数字声音处理和音频识别。

当您找到具有您感兴趣的功能并且以您选择的语言进行绑定的库或框架时，请开始使用它来实现。

See MARF（一个 Java 库），也许微软在这个领域的工作是系统语音识别命名空间（如果我没记错的话，它已与较新的 Windows 操作系统集成）

编辑 - 桌面与从网络运行

在评论中，您询问了有关使用 Flash 或 Silverlight 的问题，以便您的解决方案能够在桌面或网络上运行。

首先，我想指出 Flash 和 Silverlight 实际上都在客户端计算机上运行。不同之处在于它们在 Web 浏览器的上下文中运行，并且用户不必安装该应用程序。除此之外，它们与桌面应用程序没有太大区别，并且用户显然必须为其浏览器安装 Flash of Silverlight 插件。

如果这就是您所追求的（即用户不必安装您的应用程序），那么您可以考虑 Flash、Silverlight 或Java网络启动。实际上 JAVA Web Start 可能是一个不错的选择，因为您可以利用MARF框架.

但是，如果您决定使用 Flash、Silverlight 或 Java Web Start，则可能需要处理一些安全问题，因为访问客户端系统资源必然需要一些大多数“基于 Web 的应用程序”不需要的权限通常需要。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Audio

编写一个识别声音并执行操作的程序的相关文章

如何在 iPhone 上进行实时声音/信号处理？

我可能正在开发一个基于 iPhone 的应用程序进行近乎实时的声音处理过滤等我想知道开始的最佳方式我想创建一个用于录制和处理声音的音频提示吗如上所述here http developer apple com iphone libr
waveOutWrite 和 waveOutGetPosition 死锁问题

我正在开发一个使用连续播放音频的应用程序waveOut API来自winmm dll 该应用程序使用 leapfrog 缓冲区它基本上是一堆转储到音频队列中的样本数组 Windows 按顺序无缝播放它们并且当每个缓冲区完成时 Windo
从动态内容提供者加载 html5 音频并进行身份验证

假设我们这里有一个内容提供者端点myuri org api auth sources id 它返回由 id 标识的音乐文件路线 api auth 需要身份验证在本例中这是通过在请求标头中传递 JWT 来完成的如下所示Authenti
使用 AVAudioEngine 重复播放音频文件

我正在使用 Swift 和 Xcode 6 开发一个 iOS 应用程序我想做的是使用 AVAudioEngine 播放音频文件到目前为止一切正常但是我怎样才能不停止地播放它我的意思是当它结束播放时它会再次开始这是我的代码 CON
Python检测关键字

我正在做的应用程序执行以下操作 1 如果麦克风检测到一些噪音它就会开始录制音频直到检测不到噪音之后音频被录制到 wav 文件中 2 我必须检测上面的一些文字只有 5 到 10 个单词需要检测到目前为止我的代码只执行第一部分检
Clojure/Java：用于声音频谱分析的 Java 库？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个可以接受大量音频数据并返回给定频带内随时间变化的平均幅度的库我已经在 comp dsp
NAudio 音调变换

我正在使用 NAudio DLL 并且正在寻找音调变换声音的示例代码有一个使用的例子NAudio https github com naudio NAudio用于开源中的音高变换Skype 变声器 https github com mar
如何低延迟地使用 Android 音频

Problem 您可能听说过 Android 不提供低延迟音频 API 我所说的低延迟音频是指您应该能够从麦克风获取音频信号并播放声音中间没有太多时间间隔例如 5 7 毫秒我尝试过旧的java 带有AudioRecord和AudioT
如何在 PhantomJS 中使用 JavaScript 检测网页上的声音？

我需要检测带有横幅的网页中的所有声音我怎样才能做到这一点我查看 PhantomJS 但找不到浏览器声音的 API PhantomJS 1 x 和 2 不支持 Flash
如何使用 javascript 从 Audio Element 录制音频

我正在使用 HTML5 和 Javascript 制作录音机并且不想包含任何第三方 API 我的第一步是使用以下命令创建音频检索器和播放器
OpenAL 初始化问题，仅限 iPod（？）

我遇到了 OpenAL 问题似乎只发生在 iPod 硬件上奇怪的是它was工作正常但现在不行了我正在设置音频会话 AVAudioSession sharedInstance setCategory AVAudioSessionCat
TarsosDSP 音高分析傻瓜式教程

我正在开发一个分析声音文件音调的程序我遇到了一个非常好的 API 称为 TarsosDSP 它提供了各种音高分析然而我在设置它时遇到了很多麻烦有人可以向我展示一些有关如何使用此 API 特别是 PitchProcessor 类的快
当通过音频采样的数据数量超过 AudioRecord 构造函数中设置的“bufferSizeInBytes”时会发生什么？

public AudioRecord int audioSource int sampleRateInHz int channelConfig int audioFormat int bufferSizeInBytes 这是公共构造函数Au
使用 Google Speech 时从 Google Cloud Storage 访问音频文件

我使用下面的这段代码使用 Google Speech 成功解析了包含语音的 wav 文件并将其转换为文本但我想访问另一个 wav 文件该文件已放置在 Google Cloud Storage 公开上而不是本地硬盘上为什么不简单地
如何使用ffmpeg重叠和合并多个音频文件？

我正在尝试将多个音频文件合并到一个文件中但我可以使用以下命令来连接而不是连接 ffmpeg v debug i file1 wav i file2 wav i file3 wav filter complex 0 0 concat n
软件音频线路输入

这可能是也可能不是询问的地方如果不是就直接扔掉它我有一个正在输出音频的软件我想将其路由到另一个软件简单的解决方案是将耳机插孔连接到麦克风插孔或在计算机上启用立体声混音但是我想要做的进一步实现将在一台机器上发生 2 个这样的实例
使用 C 创建立体声正弦波

我正在尝试用 C 创建立体声正弦 WAV 并且可能有不同的可能是空白的左声道和右声道使用此函数为每个通道生成一个音调 int16 t create tone float frequency float amplitude float
音频html标签无法快进或快退控制

我正在使用音频 html 标签从我的上传服务器加载音频但我不知道为什么我的音频无法像往常一样循环快进或快退控制我的音频标题 Accenpt Ranges bytes Connection Keep Alive Content Len
使用项目中的波形文件

我目前只能通过将波形文件放在已编译的 exe 旁边来播放背景声音但我实际上想要一个包含波形文件的静态可执行文件这在Delphi XE2中可能吗这是我的代码 SndPlaySound Raw wav SND ASYNC or SND L
在下载整个文件之前是否可以知道 MP3 的持续时间？

这是一个关于MP3文件格式的问题我一直在寻找一种获得 MP3 持续时间的方法由于我使用 JLayer SPI 来解码 MP3 我发现在音频源是文件的情况下这是可能的 AudioFileFormat fileFormat AudioSys

随机推荐

如何跳过 maatwebsite-excel 3.1 中的空白行以在 Laravel 上进行模型方式导入

我正在开发 laravel 项目maatwebsite exvel 3 1从文件上传方法导入excel文件这是我的StudentsImport class public function model array row return ne
Swagger/OpenAPI - 使用 $ref 传递可重用的定义参数

假设我有一个像这样的参数limit 这个被到处使用如果我需要更新它则必须在各处更改它是一件痛苦的事情 parameters name limit in query description Limits the number of ret
Java 中缺少语言环境？ [复制]

这个问题在这里已经有答案了我在 java 语言环境中发现了许多缺失的国家地区如果我打印出可用语言环境的列表 TreeSet lt String gt m new TreeSet lt String gt for Locale l Lo
Console.Write 在 Windows 窗体应用程序中不起作用

我在 Visual Studio 2008 中创建了一个 VB NET Windows 窗体应用程序当我从命令行运行程序时我没有得到任何输出只有下一个提示我究竟做错了什么 Private Sub Form1 Load ByVal s
Asp.Net 身份和多租户上的重复角色名称

我正在使用 ASP Net MVC 和 Identity 2 0 开发多租户 Web 应用程序我已经像这样扩展了 IdentityRole public class ApplicationRole IdentityRole public
在本机反应中单击按钮时显示加载程序

我正在尝试在我的反应本机应用程序中实现加载器动画但单击按钮时它不会触发加载器尽管动画已经更改为true 看看我下面的代码 componentWillMount this hideLoader showLoader gt this set
where-object $_ 匹配多个条件

data where object Name eq serverName domain com select object Property Description1 Version where object Description1 ma
概念可以与模板模板参数一起使用吗？

让我们考虑以下代码 include
找不到参数的方法 jackOptions()

大家好我面临着在 DefaultConfig Decolated name main Dimension null minSdkVersion DefaultApiVersion mApiLevel 16 mCodename null
将动态键：值对传递给对象文字？ [复制]

这个问题在这里已经有答案了我正在使用这段代码如下所示来尝试填充名为的对象文字Parameters在 for 循环内我需要key value与循环迭代一起分配的对i变量例如 key 1 chunks 1 key 2 chunks 2
动态添加属性到动态对象？

我有这个 dynamic d new ExpandoObject d Name attribute QualifiedName Name 所以我知道 d 将有一个属性名称现在如果我在编译时不知道属性的名称如何将该属性添加到动态中我
如何通过 Telegram Bot 发送文件

我需要使用 TelegramBot API 发送 txt 文件我已经尝试过了并有问题 ok false error code 400 description 错误请求错误的远程指定的文件 ID 字符串长度错误为了完成唐尼的回答我
查询中的问号运算符

在我的 laravel 5 应用程序中我使用 PostgreSQL 的 jsonb 数据类型它有操作员但我无法让它在我的模型中工作因为 laravel 使用问号作为绑定具体来说在 whereRaw 方法中 query gt w
Idea 中不显示字体

更新 jrk7 openjdk 和 jre7 openjdk 字体后 Idea 中不显示字体重新安装软件包 openjdk 和 idea 没有帮助名称 a Linux ftp27host 3 14 6 1 ARCH 1 SMP PREE
使用 pip 安装 uwsgi 时出现“ascii”编解码器无法解码错误

我正在按照本教程设置 uwsgi https uwsgi readthedocs org en latest tutorials Django and nginx html I run pip install uwsgi在virtualen
Visual Studio - 用资源替换硬编码字符串的工具

我有一个大型 ASP NET 项目其中充满了硬编码字符串现在必须将其提取到资源中此类字符串几乎可以在任何地方找到 cs 文件 aspx 文件 ascx 文件等并且文件数量巨大我正在寻找一种工具或任何方式来一次找到所有这些硬编码
从内存流读取存储的 PDF

我正在使用 C 和 SQLServer 2012 开发一个数据库项目在我的一个表单中我有一个 PDF 文件其中包含存储在表中的一些其他信息这是成功的但是当我想检索存储的信息时我在显示 PDF 文件时遇到问题因为我无法显示它而
具有多个数据库/DbContext 的 EF Code First 迁移

我有两个数据库每个数据库都有自己的 dbcontext 我设置了两个迁移配置我可以为第一个数据库添加迁移这很好 Add Migration DB1 InitialCreate ConfigurationTypeName DB1Conf
使用 Jenkins Job-DSL 配置块将自定义步骤放置在特定位置

我正在尝试使用 job dsl plugin 编写之前手动配置的大量 Jenkins 作业的配置脚本这些作业的一种风格有多个步骤其中包括使用 XShell 插件的几个步骤 job dsl 不直接支持这一点不过我应该能够通过使用自定义
编写一个识别声音并执行操作的程序

我想编写一个能够存储声音模式的程序例如火车汽笛喇叭嘟嘟声通过麦克风收听声音然后在听到声音时采取一些行动我懂一点Python 很早以前就用VB 编程过我主要是一个 Oracle PLSQL 人员该程序需要一个适度的用户界面解

编写一个识别声音并执行操作的程序

编写一个识别声音并执行操作的程序 的相关文章

随机推荐

热门标签

编写一个识别声音并执行操作的程序的相关文章