尝试了解 C# 中与 NAudio 相关的缓冲区

2024-01-03

我是一名化学专业的学生，试图在 C# 中使用 NAudio 从计算机的麦克风收集数据（计划稍后切换到音频端口，以防与如何回答这个问题有关）。我了解什么是源流，以及 NAudio 如何使用事件处理程序来了解是否开始从所述流读取信息，但在处理从流中读取的数据时，我感到很困惑。据我了解，缓冲区数组是从源流中以字节或 WAV 格式填充的（使用 AddSamples 命令）。现在，我要做的就是填充缓冲区并将其内容写入控制台或进行简单的可视化。我似乎无法从缓冲区中获取我的值，并且我尝试将其视为 WAV 和字节数组。有人可以帮助我从头开始理解 NAudio 是如何工作的，以及如何从缓冲区中提取数据并将其存储为更有用的格式（即双精度）？这是我迄今为止处理 NAudio 及其附带的所有代码的代码：

public NAudio.Wave.BufferedWaveProvider waveBuffer = null; // clears buffer 

NAudio.Wave.WaveIn sourceStream = null; // clears source stream

public void startRecording(int samplingFrequency, int deviceNumber, string fileName)
{       
    sourceStream = new NAudio.Wave.WaveIn(); // initializes incoming audio stream
    sourceStream.DeviceNumber = deviceNumber; // specifies microphone device number 
    sourceStream.WaveFormat = new NAudio.Wave.WaveFormat(samplingFrequency, NAudio.Wave.WaveIn.GetCapabilities(deviceNumber).Channels); // specifies sampling frequency, channels

    waveBuffer = new NAudio.Wave.BufferedWaveProvider(sourceStream.WaveFormat); // initializes buffer

    sourceStream.DataAvailable += new EventHandler<NAudio.Wave.WaveInEventArgs>(sourceStream_DataAvailable); // event handler for when incoming audio is available

    sourceStream.StartRecording();

    PauseForMilliSeconds(500); // delay before recording is stopped          

    sourceStream.StopRecording(); // terminates recording
    sourceStream.Dispose();
    sourceStream = null;
}

void sourceStream_DataAvailable(object sender, NAudio.Wave.WaveInEventArgs e)
{
    waveBuffer.AddSamples(e.Buffer, 0, e.BytesRecorded); // populate buffer with audio stream
    waveBuffer.DiscardOnBufferOverflow = true;
}

免责声明：我对 NAudio 没有太多经验。

这在某种程度上取决于您想如何处理音频数据。

如果您只是想存储或转储数据（无论是文件目标还是只是控制台），那么您不需要BufferedWaveProvider。只需直接在事件处理程序中做任何您想做的事情sourceStream_DataAvailable()。但请记住，您接收的数据是原始字节，即实际构成录制音频的单个帧（也称为样本）的字节数取决于波形格式：

var bytesPerFrame = sourceStream.WaveFormat.BitsPerSample / 8
                  * sourceStream.WaveFormat.Channels

如果您想分析数据（例如，使用 FFT 进行傅立叶分析），那么我建议使用 NAudioISampleProvider。该接口隐藏了所有原始字节、位深度的内容，让您可以轻松地逐帧访问数据。

首先创建一个ISampleProvider从你的BufferedWaveProvider像这样：

var samples = waveBuffer.ToSampleProvider();

然后您可以使用以下命令访问示例框架Read()方法。确保检查数据是否确实可用BufferedBytes您的财产BufferedWaveProvider:

while (true)
{
    var bufferedFrames = waveBuffer.BufferedBytes / bytesPerFrame;        

    if (bufferedFrames < 1)
        continue;

    var frames = new float[bufferedFrames];
    samples.Read(frames, 0, bufferedFrames);

    DoSomethingWith(frames);
}

因为您想同时做两件事——同时记录和分析音频数据——所以您应该为此使用两个单独的线程。

有一个使用 NAudio 的小型 GitHub 项目 https://github.com/bert2/DtmfDetection用于录制音频数据的 DTMF 分析。您可能想了解一些如何将它们整合在一起的想法。文件DtmfDetector\Program.cs https://github.com/bert2/DtmfDetection/blob/master/DtmfDetector/Program.cs有一个良好的起点。

为了快速启动并为您提供“更连贯”的输出，请尝试以下操作：

将此字段添加到您的类中：

ISampleProvider samples;

将此行添加到您的方法中startRecording():

samples = waveBuffer.ToSampleProvider();

Extend sourceStream_DataAvailable()像这样：

void sourceStream_DataAvailable(object sender, NAudio.Wave.WaveInEventArgs e)
{
    waveBuffer.AddSamples(e.Buffer, 0, e.BytesRecorded);
    waveBuffer.DiscardOnBufferOverflow = true;

    var bytesPerFrame = sourceStream.WaveFormat.BitsPerSample / 8
                      * sourceStream.WaveFormat.Channels
    var bufferedFrames = waveBuffer.BufferedBytes / bytesPerFrame;

    var frames = new float[bufferedFrames];
    samples.Read(frames, 0, bufferedFrames);

    foreach (var frame in frames)
        Debug.WriteLine(frame);
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

NAudio

尝试了解 C# 中与 NAudio 相关的缓冲区的相关文章

为什么使用数组索引循环数组比指针访问慢？

我正在读Kochan的书 Programming in C 在第 14 页的指针和数组部分中 264 他说一般来说索引数组的过程比执行索引过程花费更多的时间访问指针内容的过程其实这也是主要原因之一为什么使用指针来访问数组的元素
表达式访问者仅为某些 lambda 表达式调用 VisitParameter

我希望能够使用嵌套扩展方法将 EF 中的实体投影到相应的视图模型参见我之前的问题使用扩展方法在 EF 中投影单个实体 https stackoverflow com questions 39585427 projection of sin
Monitor.Pulse & Wait - 意外行为

http www codeproject com Articles 28785 Thread synchronization Wait and Pulse demystified http www codeproject com Artic
UI 线程正在阻塞调用 COM 对象的后台线程

我正在开发一个通过第三方 COM 库与外部设备通信的应用程序我试图让与设备的所有通信都通过后台线程以防止通信问题搞砸我的应用程序并消除在 UI 线程中进行通信所引入的一些其他复杂性问题是每当发生导致主 UI 线程阻塞的情况即调用
我如何知道向量的实际最大大小？（不使用 std::vector::max_size）

在在线课程中我正在学习向量在其中一个例子中他们解释说 std vector max size 应该给我向量可以达到的最大大小我决定测试一下 include
将 std::pair const 转换为 std::pair const 安全吗？

理论上或实践上安全吗reinterpret cast a std pair
编译器消息“警告：格式‘%s’需要类型‘char *’，但参数 2 具有类型‘char (*)’”

我正在尝试运行一个简单的 C 程序但收到此错误警告格式 s 需要类型 char 但参数 2 的类型为 char 20 我在跑步Mac OS X v10 8 https en wikipedia org wiki OS X Mounta
Cookie 在 ASP.net 中失去价值

我有以下设置 cookie 的代码 string locale DropDownList this LoginUser FindControl locale SelectedValue HttpCookie cookie new HttpC
使用左连接获得不适当的输出

我正在尝试获取变体列表并且对于每个变体都获取所有subvariants list无论子变体属于何处特别的Test say 100 这是示例数据 Id TestId SourceSubVariantId TargetSubVariantI
如何解析多态 JSON 数组？

我有一个 JSON 格式的文件其中包含个人用户的记录一些用户的记录中间有一个评论字段我只想解析顶级项目全名贡献者姓名电子邮件使用 Newtonsoft JSON 解析器但我似乎无法让它识别单个对象当我将整个字符串解析为一个
ef core 在更新数据库期间不使用 ASPNETCORE_ENVIRONMENT

我使用 Visual Studio 通过一定的迁移来更新我的所有环境使用下面的命令效果很好 update database Migration initMigrationProduct c ProductContext Environme
WCF 服务中的缓冲区大小

我们有一个 WCF 服务它执行某些存储过程并将结果返回给 silverlight 客户端某些存储过程最多返回 80K 行下面给出的是 web config 中服务的设置
我的代码哪里有泄漏？

下面是我的代码它打开一个 XML 文件 old xml 过滤无效字符并写入另一个 XML 文件 abc xml 最后我将再次加载 XML abc xml 当执行以下行时出现异常表示 xml 文件被另一个进程使用 xDoc Load
链接到ntdll.lib并调用ntdll.dll内部的函数

我最近正在对私有 API 进行一些研究我尝试调用诸如NtOpenFile在 ntdll dll 中LoadLibrary and GetProcAddress在运行时幸运的是它成功了今天早上我在电脑上进行了文件搜索发现ntdll
快速将文本附加到文本框

我有一个BackgroundWorker正在发布消息的线程使用BeginInvoke在 GUI 中的文本框中方法 write debug text 在文本框中显示文本使用AppendText并将文本写入Console 外观上是这样的Ba
在链表程序中使用模板时重载 C++ 中的 << 运算符

我正在尝试实现一个链接列表但是当我尝试重载 include
C++ 在预处理器 #if 中对 sizeof() 比较抛出编译错误

我有这个它不会从 Visual Studio 编译错误致命错误 C1017 无效的整数常量表达式我该怎么做 template
推断“x => { throw .. }”的 Lambda 与重载方法中的 Func 匹配吗？

我不明白为什么 C 最终在以下 LINQPad 代码中执行不正确的扩展方法 void Main Actual Sync Action Expected Sync Action Run x gt x Dump Actual Async Tas
从其对象获取结构体字段的名称和类型

例如我有一个类似这样的结构 struct Test int i float f char ch 10 我有一个该结构的对象例如 Test obj 现在我想以编程方式获取字段名称和类型obj 是否可以顺便说一句这是 C 你正在要求C
为什么 INT64_MIN 的定义不同？为什么他们的行为不同？

The stdint h我公司的标题是 define INT64 MIN 9223372036854775808LL 但在我项目的一些代码中一位程序员写道 undef INT64 MIN define INT64 MIN 92233720

随机推荐

是否可以指定TableRow的高度？

我有一个TableLayout与多个TableRow里面的景色我希望以编程方式指定行的高度例如 int rowHeight calculateRowHeight TableLayout tableLayout new TableLayo
如何在 VS 2008 中启用 DirectX 变量的更多调试信息？

我能够启用 directX 变量如 LPD3DXMESH 等的调试信息通常它只显示 IUnknown 和一些指针值但如果启用了额外的调试则可以查看有关该结构的更多详细信息问题是我丢失了该项目现在我不记得如何再次启用此类调试请
安装 JDK 和使用转储之间的区别

全部我想知道使用Oracle提供的安装程序安装JDK和使用安装后创建的JDK目录有什么区别假设我使用 oracle 的安装程序在机器 M1 上安装了 JDK7u1 位置为 C Program Files Java JDK7u1 我可以将
来自 Javascript 的 SOAP Web 服务调用

我正在努力从网页成功地对 SOAP Web 服务进行 Web 服务调用 Web 服务是使用 JAX WS 的 Java Web 服务这是我尝试调用的网络方法 WebMethod public String sayHi WebParam n
printf 和 vprintf 函数系列之间有什么区别，什么时候应该使用其中一个而不是另一个？

我明白两者之间的区别printf fprintf sprintf等功能和vprintf vfprintf vsprintf等函数与它们如何处理函数参数有关但具体如何呢真的有理由使用其中一种而不是另一种吗我应该总是使用printf因为这
如何从运行的 tomcat 7 中获取堆转储

我试过这个从 Tomcat 6 获取 JVM 上的堆转储 https stackoverflow com questions 18578710 get a heapdump on jvm from tomcat 6但它对我不起作用还有其他
迭代并从地图中删除[重复]

这个问题在这里已经有答案了我在做 for Object key map keySet if something map remove key 它引发了 ConcurrentModificationException 所以我将其更改为 fo
Android 捏合缩放 ImageView

我有一张图片ImageView布局 import android app Activity import android os Bundle public class americanfootball extends Activity Ov
当我在 xCode 5 中验证我的应用程序时，收到错误广告标识符 [IDFA] 使用不当的错误

验证我的应用程序时我收到一条错误消息广告标识符使用不当您的应用程序包含广告标识符 IDFA API 但您没有遵守 iOS 中的限制广告跟踪设置我在广告标识符的准备上传页面上选中是我在我的应用程序 COCOS2D X 项目中使用
php_oci8 未在 wamp 服务器 2.0 上加载？

我在 wamp 上启用了扩展截屏 https i stack imgur com h7uKG gif 但我仍然收到此错误 Fatal error Call to undefined function oci connect in C wa
opencv 版本 3.* HogDescriptor 最多接受 1 个参数（给定 5 个）

我正在尝试使用 HogDescriptor 但收到此错误我在文档中看到构造函数可以采用多个参数我正在 python 3 6 和 opencv 3 2 中工作这是我的代码 def extract feature X Performs f
SetMaxOpenConns 和 SetMaxIdleConns

为什么有SetMaxOpenConns and SetMaxIdleConns 在里面doc http golang org pkg database sql DB SetMaxOpenConns 设置最大空闲连接数 SetMaxIdleC
SQL 表中的版本控制 - 如何处理？

这是一个带有一些填充数据的虚构场景出于税务目的我的虚构公司必须保留历史数据记录因此我在表中添加了版本列 TABLE EMPLOYEE with personal commentary ID VERSION NAME Position
如何在 selenium webdriver 中自动输入 type="color" ？

设想选择颜色输入其他详细信息并保存当我单击 html 元素颜色输入类型颜色时它会打开一个颜色选择器它是一个弹出窗口
使用 -lpthread，g++ 编译器错误，“未定义引用”信号量调用，例如“sem_open”

我是 posix 线程库的新手我尝试使用以下命令编译教程中的示例代码 g lpthread agreement cpp o agreement 但是我无法编译代码并收到以下错误消息 a3q2 cpp text 0x7e undefined
如何解决moodle全新安装问题mysql_full_unicode_support#File_format和mysql_full_unicode_support#Large_prefix

I am very new to Moodle When i am trying to install this i got this issue Please ref screenshot 任何人都可以帮我解决这个问题吗先感谢您奥姆卡
使用 R 中的属性值分布创建热图（不是密度热图）

你们中有些人可能已经看过超越苏打水汽水或可乐 http www4 ncsu edu jakatz2 project dialect html 我面临着类似的问题并且想创建一个类似的情节就我而言我有大量的地理编码观测值超过 100
增强变体类型碰撞

后续问题 https stackoverflow com questions 34229428 how to get around matching boost variant return types 所以我一直在玩 Boost Min
当它是参考（主题）时以编程方式获取颜色值

考虑一下样式 xml 属性 xml
尝试了解 C# 中与 NAudio 相关的缓冲区

我是一名化学专业的学生试图在 C 中使用 NAudio 从计算机的麦克风收集数据计划稍后切换到音频端口以防与如何回答这个问题有关我了解什么是源流以及 NAudio 如何使用事件处理程序来了解是否开始从所述流读取信息但在处理从流中

尝试了解 C# 中与 NAudio 相关的缓冲区

尝试了解 C# 中与 NAudio 相关的缓冲区 的相关文章

随机推荐

热门标签

尝试了解 C# 中与 NAudio 相关的缓冲区的相关文章