如何对重新采样的音频数据进行双三次（或其他非线性）插值？

2024-04-23

我正在编写一些以不同速度播放 WAV 文件的代码，以便波形要么更慢、音调更低，要么更快、音调更高。我目前正在使用简单的线性插值，如下所示：

            int newlength = (int)Math.Round(rawdata.Length * lengthMultiplier);
            float[] output = new float[newlength];

            for (int i = 0; i < newlength; i++)
            {
                float realPos = i / lengthMultiplier;
                int iLow = (int)realPos;
                int iHigh = iLow + 1;
                float remainder = realPos - (float)iLow;

                float lowval = 0;
                float highval = 0;
                if ((iLow >= 0) && (iLow < rawdata.Length))
                {
                    lowval = rawdata[iLow];
                }
                if ((iHigh >= 0) && (iHigh < rawdata.Length))
                {
                    highval = rawdata[iHigh];
                }

                output[i] = (highval * remainder) + (lowval * (1 - remainder));
            }

这工作正常，但只有当我降低播放频率（即减慢播放速度）时，听起来才正常。如果我在播放时提高音调，这种方法往往会产生高频伪影，可能是因为样本信息丢失。

我知道双三次插值方法和其他插值方法不仅仅使用两个最近的样本值进行重新采样，如我的代码示例中所示，但我找不到任何可以插入来替换我的线性插值方法的好的代码示例（最好是 C#）。

有谁知道任何好的例子，或者有人可以编写一个简单的双三次插值方法吗？如果有必要的话我会悬赏这个。 :)

Update：这里有几个插值方法的 C# 实现（第一个感谢 Donnie DeBoer，第二个感谢 nosredna）：

    public static float InterpolateCubic(float x0, float x1, float x2, float x3, float t)
    {
        float a0, a1, a2, a3;
        a0 = x3 - x2 - x0 + x1;
        a1 = x0 - x1 - a0;
        a2 = x2 - x0;
        a3 = x1;
        return (a0 * (t * t * t)) + (a1 * (t * t)) + (a2 * t) + (a3);
    }

    public static float InterpolateHermite4pt3oX(float x0, float x1, float x2, float x3, float t)
    {
        float c0 = x1;
        float c1 = .5F * (x2 - x0);
        float c2 = x0 - (2.5F * x1) + (2 * x2) - (.5F * x3);
        float c3 = (.5F * (x3 - x0)) + (1.5F * (x1 - x2));
        return (((((c3 * t) + c2) * t) + c1) * t) + c0;
    }

在这些函数中，x1 是您尝试估计的点之前的样本值，x2 是您尝试估计的点之后的样本值。 x0 位于 x1 的左侧，x3 位于 x2 的右侧。 t 从 0 到 1，是您估计的点与 x1 点之间的距离。

Hermite 方法似乎效果很好，并且似乎在一定程度上降低了噪声。更重要的是，当波浪加速时，听起来似乎更好。

我最喜欢的音频插值资源（尤其是在重采样应用程序中）是奥利·尼米塔洛《大象》纸 http://iki.fi/o/blog/?p=197.

我已经使用了其中的几个，它们听起来很棒（比相对嘈杂的直接三次解要好得多）。有样条形式、埃尔米特形式、瓦特形式、抛物线形式等。并且从一个角度来讨论它们audio观点看法。这不仅仅是典型的朴素多项式拟合。

并且包含代码！

要决定使用哪个，您可能需要从第 60 页的表格开始，该表格将算法按运算符复杂度（乘法次数和加法次数）进行分组。然后选择最佳的信噪比解决方案——用您的耳朵作为指导做出最终选择。注：一般情况下，higher信噪比越高越好。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何对重新采样的音频数据进行双三次（或其他非线性）插值？的相关文章

如何将网络音频流保存到文件（c++/java）

是否有任何库或众所周知的方法来保存音频网络流网络广播 mp3 流以编程方式归档您可以使用 libvlcVLC http www videolan org vlc 项目这wiki http wiki videolan org Libv
Python 中的跨平台音频播放

是否有用于音频播放的跨平台 Python 库我的目标操作系统是按重要性排序 Windows Linux 和 Mac OSX 需要支持的文件格式是按重要性排序 MP3 OGG WAV 和 FLAC 这样的事情存在吗我尝试了一些可用的
FFT 的窗口大小与数据长度

我正在尝试对流音频数据进行快速频谱分析以捕获元音类似于 JLip sync 使用 PyAudio 在短时间内 0 0625 秒捕获小块 1024 的语音数据使用 numpy fft 进行分析并使用 numpy hanning 窗口消
汉明窗有什么用？

我正在使用一些执行傅里叶变换的代码以计算音频样本的倒谱在计算傅里叶变换之前它会对样本应用汉明窗 for int i 0 i lt SEGMENTATION LENGTH i timeDomain i float 0 53836 0 4
如何在多个 HTML 页面上播放背景音频？

是否有解决方案可以让背景音频音乐在网站上的多个页面上播放而无需在每个页面加载时重新启动该网站当前使用框架集但我正在寻找替代方案如果不让整个网站都 AJAX 我认为框架是唯一的方法如果您需要的话这里有一个关于制作 ajax 站点
在 IE 中使用 html 音频：MEDIA12899：音频/视频：未知的 MIME 类型

html如下
R 中的线性插值

我有一个真实数据的数据集例如如下所示 Dataset 1 with known data known lt data frame x c 0 6 y c 0 10 20 23 41 39 61 plot known x known y t
将非规范化数字刷新为零

我在网上搜索过但没有结果 Xcode 和 Visual C 有没有办法将非规范化数字视为 0 我本以为 IDE 首选项中有一个选项可以打开此选项但似乎找不到它我正在做一些跨平台音频工作需要停止某些处理器占用资源 Cheers 您正在
D3：打字机风格的文本过渡

In this jsfiddle http jsfiddle net VividD QbysN 标签通过减小旧文本的字体然后增加新文本的字体从一个文本过渡到另一个文本但是我希望新文本以打字机方式出现就像这样jsfiddle h
在 jupyter 中 for 循环播放音频

我有大量需要注释的训练数据为了做到这一点我需要听一堆声音片段并记下我听到的内容我在笔记本上为此写了一个小脚本我的主要问题是 IPython 显示不循环显示举个例子 import numpy import IPython displ
如何低延迟地使用 Android 音频

Problem 您可能听说过 Android 不提供低延迟音频 API 我所说的低延迟音频是指您应该能够从麦克风获取音频信号并播放声音中间没有太多时间间隔例如 5 7 毫秒我尝试过旧的java 带有AudioRecord和AudioT
我们可以从 MFCC 系数中恢复音频吗？

可以从 MFCC 系数中获取音频信号吗另外 MFCC 系数是否有一个值范围如果有的话是什么如果没有如何将其归一化在 0 到 1 之间我尝试使用以下 MATLAB 代码 http labrosa ee columbia edu m
Matlab 中二维插值的函数形式

我需要从二维数据数组构造一个插值函数我需要返回实际函数的东西的原因是我需要能够将函数作为我需要进行数值积分的表达式的一部分进行计算因此 interp2 并没有解决这个问题它不返回函数我可以使用 TriScatteredInterp
OpenAL 初始化问题，仅限 iPod（？）

我遇到了 OpenAL 问题似乎只发生在 iPod 硬件上奇怪的是它was工作正常但现在不行了我正在设置音频会话 AVAudioSession sharedInstance setCategory AVAudioSessionCat
TarsosDSP 音高分析傻瓜式教程

我正在开发一个分析声音文件音调的程序我遇到了一个非常好的 API 称为 TarsosDSP 它提供了各种音高分析然而我在设置它时遇到了很多麻烦有人可以向我展示一些有关如何使用此 API 特别是 PitchProcessor 类的快
使用python同时播放两个正弦音

我正在使用 python 来播放正弦音音调基于计算机的内部时间以分钟为单位但我想根据秒同时播放一个音调以获得和谐或双重的声音这就是我到目前为止所拥有的有人能指出我正确的方向吗 from struct import pack fr
检查系统是否有声音 C#

我们目前正在使用 XNA 开发一款游戏但我们偶然发现了一个小声音问题当系统没有插入声音设备扬声器等当 Win7 在扬声器图标上显示红十字时它在尝试播放加载声音时崩溃因此我们想检查系统是否具有输出声音的能力在C 中可以吗您
将声音添加到标记数组 - 谷歌地图 javascript

我是新来的所以我知道我没有任何可信度我是一名艺术家对编程很陌生所以我理解是否没有人会承担这个任务我发布这篇文章是因为这是一个简单的问题 S 这是创建多个标记的代码主要来自谷歌开发者网站它工作正常并为每个标记创建一个自定义图标
如何使用Matlab提高PSD的分辨率

我有音频信号我用 Matlab 读取该信号并使用 pwelch 获取其 PSD 这是我正在使用的代码 x Fs audioread audioFile wav x x 1 mono xPSD f pwelch x hamming 512
使用 pandas 插值将每月值转换为每日值

我有 1000 列的 12 个平均每月值我想使用 pandas 将数据转换为每日数据我尝试过使用插但我得到了从 31 01 1991 到 31 12 1991 的每日值这并不涵盖全年一月份的值没有得到我用了日期范围用于我的数据框的

随机推荐

数据框中值之间的距离

我有一个数据框其中包含一系列虚拟变量这些变量指示在另一个事件 a 之前发生的事件类型 e1 e2 我需要知道从类型 e1 和 e2 的每个事件到下一个事件 a 的索引值的距离我尝试使用显示的数据进行演示我已经研究了一些解决方案包括
管道和流程管理

我正在开发一个用 C 实现的小型 shell tsh 这是一项作业作业的一部分属于 PIPING 我必须将一个命令的输出通过管道传输到另一个命令例如 ls l sort 当我运行 shell 时我在其上执行的每个命令都由它生成的子进程
没有河流的世界地图与 matplotlib / 底图？

有没有一种方法可以用底图或者没有底图如果有其他方法的话绘制大陆的边界而不会出现那些烦人的河流尤其是那段刚果河连入海口都没有令人不安编辑我打算进一步在地图上绘制数据就像在底图库 http matplotlib org ba
是否存在 Yahoogroups api？

我们有 yahoogroups api 吗我有一个 yahoo 群组我希望每当我的 RSS 源更新时都会自动向该群组发布一条消息其中包含该帖子的链接那可能吗不 Yahoo 没有公共 API 团体如果这样的 API 被开放雅虎
Yii CDBCommand getText 显示 SQL 中的所有变量

我正在使用 Yii 的 Yii app gt db gt createCommand 来构建 SQL 查询为了查看 Yii 生成的 SQL 代码我使用 CDBCommand 的 getText 方法问题是当我在包含参数的 SQL 代
如何追踪僵尸对象崩溃？

我的 iOS 应用程序发生了一些有线崩溃并且它不是 100 可重现的从崩溃日志中我可以看到无法识别的选择器属性访问器被发送到类型不正确的对象很可能是僵尸无论如何 XCode 中是否可以用来查看我是否正在尝试访问僵尸对象 Than
如何存储（和使用）当前鼠标位置？

存储当前鼠标位置系统范围然后稍后将鼠标放在该存储点的最佳方法是什么 NSEvent mouseLocation http developer apple com mac library documentation Cocoa Ref
Jsoup 解析和嵌套标签

我正在学习 Jsoup 并有这个 HTML p Content p p Content p p Content p 我使用 Jsoup parse 和文档 select p 来捕获内容并且效果很好但 p Content p p Con
Python向图像添加额外区域

所以我有一张包含图像尺寸的表格有多个不同尺寸的图像 66x66 400x400 等我有一个图像示例原始图像其尺寸始终为 600x532 该图像上是一种产品电视 PC 等我必须调整该图像的大小这不是问题但如果我按照比例这样做
Linux bash 中波浪号的含义（不是主目录）

首先我知道是主目录 CD 至 or 带我到主目录然而 cd X带我去一个特别的地方在那里X似乎是什么在 bash 中如果我点击 cd 然后点击选项卡它会显示一堆可能的 X选项如 mail and postgres and ss
如何计算r中两年的移动平均值

我有一个关于并购 M As 的大数据框 900k 行 df 有四列 date 并购完成时目标国家被合并收购的国家的公司收购方国家收购方是哪个国家的公司以及big corp 无论收购方是否是大公司其中 TRUE 表示该公司很大
SQL：链接连接效率

我的 WordPress 插件中有一个查询如下所示 SELECT users U meta value AS first name M meta value AS last name FROM nwp users AS users LEF
什么时候使用扩展方法，ext.方法与继承？

我们开始使用 C NET 3 0 我想知道你们是如何使用扩展方法的你什么时候使用它们另外如果您还列出使用它们的所有黑暗先决条件我将不胜感激使用扩展方法的次数当你不控制扩展的类型时您不想强迫实现者提供可以使用现有方法完成的代码
Inappbrowser回调

我尝试使用 inappbrowser 登录 facebook 后回拨但它无法检查电子邮件姓名等这是我的代码 Inapp浏览器调用 function onDeviceReady var my client id FBkey my red
在文本文件上书写时，重音符号和特殊字符无法正确显示

这就是我正在做的事情我在网站上进行网络爬虫以供个人使用以复制文本并将书籍的章节设置为文本格式然后使用另一个程序将其自动转换为 pdf 以将其放入我的云中一切都很好直到发生这种情况特殊字符无法正确复制例如重音在文本文件上显示为
自旋锁在单处理器单核架构中有用吗？

我对自旋锁的功能感到困惑自旋锁用于阻止进程重新调度然而在只有一个核心的机器上使用自旋锁有用吗防止上下文切换您的观察结果很好在单处理器系统上旋转等待资源是没有意义的因为您最好尽早切换线程互斥体和信号量正是这样做的在多处理
如何使用 Laravel 4 Eloquent 连接列？

我有一张桌子叫tenantdetails其中包含 Tenant Id First Name Last Name 我想找回First Name and Last Name通过 MySQL 的串联功能作为一列所以我写在我的controller
java.lang.IllegalArgumentException：未找到属性类的 Setter

我想实现一个带有行编辑的表格 I found 在展示柜中但我每次都会收到此错误 javax servlet ServletException 找不到属性类的 Setter java lang IllegalArgumentExceptio
如何使用代码“约定”映射来忽略属性映射

有什么方法可以避免使用 NHibernate 3 2 使用代码约定映射来映射属性吗默认情况下所有属性都会被映射 2 作为复制粘贴 IsPersistent 属性默认实现的替代方案它可以通过反射重用 var mapper new Con
如何对重新采样的音频数据进行双三次（或其他非线性）插值？

我正在编写一些以不同速度播放 WAV 文件的代码以便波形要么更慢音调更低要么更快音调更高我目前正在使用简单的线性插值如下所示 int newlength int Math Round rawdata Length lengthM

如何对重新采样的音频数据进行双三次（或其他非线性）插值？

如何对重新采样的音频数据进行双三次（或其他非线性）插值？ 的相关文章

随机推荐

热门标签

如何对重新采样的音频数据进行双三次（或其他非线性）插值？的相关文章