iOS 6 中使用 AudioFileServices 进行粒度合成

2024-04-09

我对我正在开发的声音合成应用程序有疑问。我正在尝试读取音频文件，使用创建随机“颗粒”颗粒合成技术 http://en.wikipedia.org/wiki/Granular_synthesis，将它们放入输出缓冲区，然后能够使用 OpenAL 向用户播放该缓冲区。出于测试目的，我只是将输出缓冲区写入一个文件，然后我可以监听该文件。

从我的结果来看，我走在正确的轨道上，但遇到了一些锯齿问题和播放声音似乎不太正确。输出文件的中间通常会发出相当大的爆裂声，并且音量有时非常大。

以下是我为获得所需结果而采取的步骤，但我对一些事情有点困惑，即我为 AudioStreamBasicDescription 指定的格式。

从我的 mainBundle 中读取音频文件，该文件是 .aiff 格式的单声道文件：

ExtAudioFileRef extAudioFile;
CheckError(ExtAudioFileOpenURL(loopFileURL,
                           &extAudioFile),
       "couldn't open extaudiofile for reading");
memset(&player->dataFormat, 0, sizeof(player->dataFormat));

player->dataFormat.mFormatID = kAudioFormatLinearPCM;
player->dataFormat.mFormatFlags = kAudioFormatFlagIsSignedInteger | kAudioFormatFlagIsPacked;
player->dataFormat.mSampleRate = S_RATE;
player->dataFormat.mChannelsPerFrame = 1;
player->dataFormat.mFramesPerPacket = 1;
player->dataFormat.mBitsPerChannel = 16;
player->dataFormat.mBytesPerFrame = 2;
player->dataFormat.mBytesPerPacket = 2;

// tell extaudiofile about our format
CheckError(ExtAudioFileSetProperty(extAudioFile,
                               kExtAudioFileProperty_ClientDataFormat,
                               sizeof(AudioStreamBasicDescription),
                               &player->dataFormat),
       "couldnt set client format on extaudiofile");

SInt64 fileLengthFrames;
UInt32 propSize = sizeof(fileLengthFrames);
ExtAudioFileGetProperty(extAudioFile,
                    kExtAudioFileProperty_FileLengthFrames,
                    &propSize,
                    &fileLengthFrames);

player->bufferSizeBytes = fileLengthFrames * player->dataFormat.mBytesPerFrame;

接下来我声明我的 AudioBufferList 并设置更多属性

AudioBufferList *buffers;
UInt32 ablSize = offsetof(AudioBufferList, mBuffers[0]) + (sizeof(AudioBuffer) * 1);
buffers = (AudioBufferList *)malloc(ablSize);

player->sampleBuffer = (SInt16 *)malloc(sizeof(SInt16) * player->bufferSizeBytes);

buffers->mNumberBuffers = 1;
buffers->mBuffers[0].mNumberChannels = 1;
buffers->mBuffers[0].mDataByteSize = player->bufferSizeBytes;
buffers->mBuffers[0].mData = player->sampleBuffer;

我的理解是 .mData 将是 formatFlags 中指定的任何内容（在本例中为 SInt16 类型）。由于它是类型 (void*），我想将其转换为浮点数据，这对于音频操作来说是显而易见的。在我设置一个 for 循环之前，它只是迭代缓冲区并将每个样本转换为 float*。这似乎没有必要，所以现在我将 .mData 缓冲区传递给我创建的函数，然后该函数对音频进行粒度化：
```
    float *theOutBuffer = [self granularizeWithData:(float *)buffers->mBuffers[0].mData with:framesRead];
```
在此函数中，我动态分配一些缓冲区，创建随机大小的颗粒，使用汉明窗对它们进行窗口化后将它们放入输出缓冲区中，然后返回该缓冲区（即浮点数据）。到目前为止一切都很酷。

接下来，我设置所有输出文件 ASBD 等：

AudioStreamBasicDescription outputFileFormat;

bzero(audioFormatPtr, sizeof(AudioStreamBasicDescription));

outputFileFormat->mFormatID = kAudioFormatLinearPCM;
outputFileFormat->mSampleRate = 44100.0;
outputFileFormat->mChannelsPerFrame = numChannels;
outputFileFormat->mBytesPerPacket = 2 * numChannels;
outputFileFormat->mFramesPerPacket = 1;
outputFileFormat->mBytesPerFrame = 2 * numChannels;
outputFileFormat->mBitsPerChannel = 16;
outputFileFormat->mFormatFlags = kAudioFormatFlagIsFloat | kAudioFormatFlagIsPacked;

UInt32 flags = kAudioFileFlags_EraseFile;
ExtAudioFileRef outputAudioFileRef = NULL;
NSString *tmpDir = NSTemporaryDirectory();
NSString *outFilename = @"Decomp.caf";
NSString *outPath = [tmpDir stringByAppendingPathComponent:outFilename];
NSURL *outURL = [NSURL fileURLWithPath:outPath];


AudioBufferList *outBuff;
UInt32 abSize = offsetof(AudioBufferList, mBuffers[0]) + (sizeof(AudioBuffer) * 1);
outBuff = (AudioBufferList *)malloc(abSize);

outBuff->mNumberBuffers = 1;
outBuff->mBuffers[0].mNumberChannels = 1;
outBuff->mBuffers[0].mDataByteSize = abSize;
outBuff->mBuffers[0].mData = theOutBuffer;

CheckError(ExtAudioFileCreateWithURL((__bridge CFURLRef)outURL,
                                 kAudioFileCAFType,
                                 &outputFileFormat,
                                 NULL,
                                 flags,
                                 &outputAudioFileRef),
       "ErrorCreatingURL_For_EXTAUDIOFILE");

CheckError(ExtAudioFileSetProperty(outputAudioFileRef,
                               kExtAudioFileProperty_ClientDataFormat,
                               sizeof(outputFileFormat),
                               &outputFileFormat),
       "ErrorSettingProperty_For_EXTAUDIOFILE");

CheckError(ExtAudioFileWrite(outputAudioFileRef,
                         framesRead,
                         outBuff),
       "ErrorWritingFile");

文件写入正确，为 CAF 格式。我的问题是：我是否正确处理 .mData 缓冲区，因为我将样本转换为浮动数据，操作（粒度化）各种窗口大小，然后使用 ExtAudioFileWrite （CAF 格式）将其写入文件？有没有更优雅的方法来执行此操作，例如将我的 ASBD formatFlag 声明为 kAudioFlagIsFloat？我的输出 CAF 文件中有一些点击声，当我在 Logic 中打开它时，看起来有很多锯齿。如果我尝试向它发送浮点数据，但发生了某种我不知道的转换，这是有道理的。

预先感谢您对此事的任何建议！我一直是几乎所有在线源材料的狂热读者，包括核心有声读物、各种博客、教程等。我的应用程序的最终目标是向戴着耳机的用户实时播放颗粒化音频，以便写入文件目前仅用于测试。谢谢！

你对步骤 3 的说法表明你正在将一组短裤解释为一组浮点数？如果是这样，我们就找到了您遇到麻烦的原因。您可以将短值一一分配到浮点数组中吗？那应该解决它。

看起来像mData is a void *指着一排短裤。将此指针转换为float *不会将底层数据更改为float但您的音频处理功能会将它们视为它们。然而，float and short值以完全不同的方式存储，因此您在该函数中所做的数学运算将在非常不同的值上进行操作，这些值与您的真实输入信号无关。要通过实验对此进行研究，请尝试以下操作：

short data[4] = {-27158, 16825, 23024, 15};
void *pData = data;

The void指针并不表明它指向什么类型的数据，因此错误地，人们可以错误地假设它指向float价值观。请注意，一个short是 2 字节宽，但是float是4字节宽。巧合的是，您的代码没有因访问冲突而崩溃。解释为float上面的数组只够容纳两个值。我们只看第一个值：

float *pfData = (float *)pData;
printf("%d == %f\n", data[0], pfData[0]);

其输出将是-27158 == 23.198200说明如何而不是预期-27158.0f你大致得到23.2f。发生了两件有问题的事情。第一的，sizeof(float) is not sizeof(short)。其次，浮点数的“1 和 0”的存储方式与整数非常不同。看http://en.wikipedia.org/wiki/Single_ precision_floating-point_format http://en.wikipedia.org/wiki/Single_precision_floating-point_format.

如何解决问题？至少有两个简单的解决方案。首先，您可以在将数组的每个元素输入音频处理器之前对其进行转换：

int k;
float *pfBuf = (float *)malloc(n_data * sizeof(float));
short *psiBuf = (short *)buffers->mBuffers[0].mData[k];
for (k = 0; k < n_data; k ++)
{
    pfBuf[k] = psiBuf[k];
}
[self granularizeWithData:pfBuf with:framesRead];
for (k = 0; k < n_data; k ++)
{
    psiBuf[k] = pfBuf[k];
}
free(pfBuf);

您会发现您很可能必须将所有内容转换回short在您致电后granularizeWithData: with:。所以第二个解决方案是在中进行所有处理short尽管从您所写的内容来看，我想您不会喜欢后一种方法。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

iOS 6 中使用 AudioFileServices 进行粒度合成的相关文章

如果.Net Core可以在Windows上运行，为什么不能在.Net Framework中引用.Net Core DLL？

我明白为什么 Net Framework 可能会在 Net Core IE 中导致问题因为不存在特定于 Windows 平台的 API 但是为什么不能直接引用 Net Core 作为 Net Framework 中的库呢如果 Net C
Blazor 与 Razor

随着 Blazor 的发明我想知道这两种语言之间是否存在显着的效率无论是在代码创建方面还是在代码的实际编译执行方面 https github com SteveSanderson Blazor https github com Ste
try-catch 中未处理的异常

try list from XElement e in d Descendants wix File where e Attribute Name Value Contains temp Name e Parent Parent Attri
XCode 4.5 给我“SenTestingKit/SenTestKit.h”文件未找到，但适用于 4.4.1

我刚刚安装了 XCode 4 5 它在我现有的项目之一上给了我一个 SenTestingKit SenTestingKit h 文件未找到错误此错误仅发生在 XCode 4 5 中但它在 4 4 1 上编译正常我已经检查过SenTes
VS30063：您无权访问 https://dev.azure.com

我正在尝试在 asp net core 2 1 mvc 应用程序中使用以下代码连接 Azure DevOps Uri orgUrl new Uri https dev azure com xxxxx String personalAcces
C++11 函数局部静态 const 对象的线程安全初始化

这个问题已在 C 98 上下文中提出并在该上下文中得到回答但没有明确说明有关 C 11 的内容 const some type create const thingy lock my lock some mutex static con
如何用 kevent() 替换 select() 以获得更高的性能？

来自Kqueue 维基百科页面 http en wikipedia org wiki Kqueue Kqueue 在内核和用户空间之间提供高效的输入和输出事件管道因此可以修改事件过滤器以及接收待处理事件同时每次主事件循环迭代仅使用对
在 C# 中将位从 ulong 复制到 long

所以看来 NET 性能计数器类型 http msdn microsoft com en us library system diagnostics performancecounter aspx有一个恼人的问题它暴露了long对于计数器
Xamarin Android：获取内存中的所有进程

有没有办法读取所有进程而不仅仅是正在运行的进程如果我对 Android 的理解正确的话一次只有一个进程在运行其他所有进程都被冻结后台进程被忽略您可以使用以下代码片段获取当前正在运行的所有 Android 应用程序进程 Activ
为什么 FTPWebRequest 或 WebRequest 通常不接受 /../ 路径？

我正在尝试从 ftp Web 服务器自动执行一些上传下载任务当我通过客户端甚至通过 Firefox 连接到服务器时为了访问我的目录我必须指定如下路径 ftp ftpserver com AB00000 incoming files
UWP 无法在两个应用程序之间创建本地主机连接

我正在尝试在两个 UWP 应用程序之间设置 TCP 连接当服务器和客户端在同一个应用程序中运行时它可以正常工作但是当我将服务器部分移动到一个应用程序并将客户端部分移动到另一个应用程序时 ConnectAsync 会引发异常服务器未
过期时自动重新填充缓存

我当前缓存方法调用的结果缓存代码遵循标准模式如果存在则使用缓存中的项目否则计算结果在返回之前将其缓存以供将来调用我想保护客户端代码免受缓存未命中的影响例如当项目过期时我正在考虑生成一个线程来等待缓存对象的生命周期然后运行
32位PPC rlwinm指令

我在理解上有点困难rlwinmPPC 汇编指令旋转左字立即然后与掩码我正在尝试反转函数的这一部分 rlwinm r3 r3 0 28 28 我已经知道什么了r3 is r3在本例中是一个 4 字节整数但我不确定这条指令到底是什么rlw
是否有一个 C++ 库可以从 PDF 文件中提取文本，例如 PDFBox for Java？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案去年我使用 PDFBox 在 Java 中创建了一个应用程序来获取某些 PDF 文件中的原始文本现在
我应该在应用程序退出之前运行 Dispose 吗？

我应该在应用程序退出之前运行 Dispose 吗例如我创建了许多对象其中一些对象具有事件订阅 var myObject new MyClass myObject OnEvent OnEventHandle 例如在我的工作中我应该使
如何查明CONFIG_FANOTIFY_ACCESS_PERMISSIONS是否启用？

我想利用fanotify 7 http man7 org linux man pages man7 fanotify 7 html我遇到的问题是在某些内核上CONFIG FANOTIFY ACCESS PERMISSIONS不起作用虽然C
为什么 Ajax.BeginForm 在 Chrome 中不起作用？

我正在使用 c NET MVC2 并尝试创建一个 ajax 表单来调用删除数据库记录 RemoveRelation 的方法删除记录的过程正在按预期进行删除记录后表单应调用一个 JavaScript 函数从视觉效果中删除该记录 Rem
boost::program_options：带有固定和可变标记的参数？

是否可以在 boost program options 中使用此类参数 program p1 123 p2 234 p3 345 p12 678 即是否可以使用第一个标记指定参数名称例如 p 后跟一个数字是动态的吗我想避免这种情况
如何确定母版页中正在显示哪个子页？

我正在母版页上编写代码我需要知道正在显示哪个子内容页面我怎样才能以编程方式做到这一点我用这个 string pageName this ContentPlaceHolder1 Page GetType FullName 它以 AS
如何创建向后兼容 Windows 7 的缩放和尺寸更改每显示器 DPI 感知应用程序？

我是 WPF 和 DPI 感知 API 的新手正在编写一个在 Windows 7 8 1 和 10 中运行的应用程序我使用具有不同每个显示器 DPI 设置的多个显示器并且有兴趣将我的应用程序制作为跨桌面配置尽可能兼容我已经知道可以将

随机推荐

Python通过字符串名称导入子模块？

如何使用字符串列表子模块名称来导入当前模块中的子模块当前代码 from mainapp utils import firstutil from mainapp utils import secondutil from mainapp
防止 Google Play 上的虚假评论 [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我将 Android 应用程序发布到 Google Play 一切都很好我收到了大约 5000 条用户评论平均分为 4 6 分但在某个时刻我开
如果 URL 参数很长，控制器操作不会调用

仅供参考我的问题不是重复的MVC 3 中的长 url 为 404 20 https stackoverflow com questions 20798392 404 20 for long url in mvc 3所以请不要混淆我有一个
谁在为kafka集群设置授权

我有一个 3 节点 Kafka 集群和 2 个用于生产者和消费者的 kafka 客户端我已启用 SSL 身份验证我想为集群启用授权我已在代理节点的 server properties 中添加了以下属性 authorizer class
检测不同分辨率下的图像相等性

我正在尝试构建一个脚本来浏览我的原始高分辨率照片并替换我在拥有专业帐户之前上传到 Flickr 的旧的低分辨率照片对于其中许多我可以只使用 Exif 信息例如拍摄日期来确定匹配但有些确实很旧要么原始文件没有 Exif 信息要
如何使用java从linux环境获取tomcat中当前目录的相对路径

我想用来从我的网络应用程序外部读取属性文件我在 Windows 环境中的 tomcat 中部署了一个 war 文件并且可以使用以下代码从 Web 应用程序外部读取属性文件 Method 1 String filePath new jav
Android OpenCV 并行化循环

我知道 OpenMP 包含在 NDK 中使用示例如下 http recursify com blog 2013 08 09 openmp on android http recursify com blog 2013 08 09 open
通过转发构造函数参数构建基于可变参数模板的 mixin

我正在尝试构建一个 mixin 模板其基础全部作为可变参数模板参数传递我想通过将每个 mixin 类的构造函数参数作为参数传递给可变参数模板构造函数来构造 mixin 当使用每个 mixin 类类型的对象调用时可变参数模板构造函数会进
在 Objective-C 中观察文件或文件夹

侦听文件夹或文件以查看其是否已保存或是否已添加新文件的最佳方法是什么如果您只想监视目录但不处理单个文件的监视那么 FSEvents API 是理想的选择 Stu Connolly 有一个很棒的 FSEvents C API 的 Obje
如何使用“%f”将双精度值填充到具有正确精度的字符串中

我正在尝试使用 a 来填充带有双精度值的字符串sprintf像这样 sprintf S f val 但精度被截断至小数点后六位我需要大约 10 位小数来保证精度如何才能做到这一点宽度精度宽度应包括小数点 8 2表示8个字符宽点前
UIButton 在 UIScrollView 中时不起作用

我的观点结构 UITableView UITableViewCell UIScrollView CustomView UIButton 问题是当我触摸 UIButton 时它不起作用我用代码创建它 btn UIButton alloc i
继续打开 OpenFileDialog 直到选择有效文件

我有打开 OpenFileDialog 的代码我正在检查文件的大小以确保它不超过特定限制但是如果用户选择了一个大尺寸的文件我需要警告他并引导他返回对话框以选择不同的文件或单击取消这是我尝试过的 OpenFileDialog di
获取 PHP 中动态选择的类常量的值

我希望能够做这样的事情 class ThingIDs const Something 1 const AnotherThing 2 thing Something id ThingIDs thing 这是行不通的有没有一种简单的方法可以做
调试 Windows 消息内容和目标的好方法是什么？

我正在开发一个基于其他行为模拟 Windows 鼠标的应用程序一个示例是按键盘上的或键将 WM MOUSEWHEEL 消息发送到具有适当增量的目标窗口问题是在某些情况下我很难复制那些消息i thinkwindows 正在发送到目
CUDA：如何检查计算能力是否正确？

使用较高计算能力编译的 CUDA 代码将在计算能力较低的设备上完美执行很长一段时间然后有一天在某些内核中默默地失败我花了半天时间追寻一个难以捉摸的错误结果发现构建规则已经sm 21而该设备 Tesla C2050 是2 0 是否有任何
如何在 HTML 中打印每个项目之间有延迟的列表

Id for each item p p p p p p
如何在 Asp.Net-MVC 中添加自定义 HTTP 标头

我创建了一个自定义处理程序如下所示 public class SitHandler DelegatingHandler protected override async Task
facebook php，如何使用结果分页？

您好我正在使用 Facebook PHP SDK v 3 1 1 我不明白如何使用结果分页 url 我想获取我所有朋友的列表这是我的代码 friends fb gt api me friends friend Array data gt
Invalid Uri ： uri 方案无效

我正在尝试通过 WebRequest 登录网站我此时遇到异常 WebRequest req WebRequest Create formUrl Trim string url string username string password
iOS 6 中使用 AudioFileServices 进行粒度合成

我对我正在开发的声音合成应用程序有疑问我正在尝试读取音频文件使用创建随机颗粒颗粒合成技术 http en wikipedia org wiki Granular synthesis 将它们放入输出缓冲区然后能够使用 OpenAL

iOS 6 中使用 AudioFileServices 进行粒度合成

iOS 6 中使用 AudioFileServices 进行粒度合成 的相关文章

随机推荐

热门标签

iOS 6 中使用 AudioFileServices 进行粒度合成的相关文章