两路wav文件读取解析和混音输出并使用WaveOut相关API播放

2023-12-16

wav文件格式简介

wav文件由一个RIFF块（Resource Interchange File Format，资源互换文件格式）组成，其中包含一个"fmt "块和一个"data"块。
RIFF块包含了文件的总体信息，具体如下

字段	大小 (字节)	含义
ChunkID	4	固定的4个字符:“RIFF”
ChunkSize	4	wav文件的总大小-8字节，(不包含ChunkID 和ChunkSize本身的大小)
Format	4	固定的4个字符:“WAVE”

"fmt "块包含了音频数据的格式信息，具体如下:

字段	大小 (字节)	含义
Subchunk1ID	4	固定的4个字符 "fmt ",注意最后一个字符为空格且不可省略
Subchunk1Size	4	fmt 块的大小
AudioFormat	2	编码格式
NumChannels	2	声道数，1：单声道，2：双声道
SampleRate	4	采样率
ByteRate	4	码率，每秒传输的字节数，计算方法:SampleRate * NumChannels * BitsPerSample / 8
BlockAlign	2	块对其，播放时一次性需要处理的字节,计算方法：BitPerSample * NumChannels / 8
BitsPerSample	2	采样位数，一般为8,16,32,64等

"data"块包含了实际的音频数据，具体如下

字段	大小 (字节)	含义
Subchunk2ID	4	固定4个字符：''data"
Subchunk2Size	4	pcm原始音频数据的大小,单位：字节

在这里插入图片描述

wav文件头定义

//文件名：WAVEHeader.h 

//"RIFF"块 
 struct RIFF_CHUNK {
	char chunkID[4];//"RIFF"
	int  chunkSize;//整个文件的大小-8字节 
	char format[4];//"WAVE"
};
//"fmt "块
 struct FMT_CHUNK {
	char chunkID[4];//"fmt ",注意最后一个字节的内容为空格" ",不可省略
	int  chunkSize;
	short audioFormat;
	short numChannels;//单声道：1，立体声：2
	int sampleRate;//采样率
	int byteRate;//码率, SampleRate * NumChannels * BitsPerSample/8 
	short blickAlign;//NumChannels * BitsPerSample
	short bitsPerSample;//8bits=8,16bit=16,以此类推
};
//"data" 块
 struct DATA_CHUNK
{
	char chunkID[4];//"data"
	int  chunkSize;//pcm音频数据大小
};

struct WAVHeader
{
	RIFF_CHUNK riff;
	FMT_CHUNK fmt;
	DATA_CHUNK data;
};

读取wav文件



    ifstream fin("test_s8le.wav", ios::binary);
    if (!fin) {
        cout << "open file failed!" << endl;
        return 1;
    }
    WAVHeader header;
    //读取wav文件头并保存到header对象中
    fin.read((char*) & header, sizeof(header));
    if (strncmp(header.riff.chunkID, "RIFF", 4) != 0 || strncmp(header.riff.format, "WAVE", 4) != 0
        || strncmp(header.fmt.chunkID, "fmt ", 4) != 0 || strncmp(header.data.chunkID, "data", 4) != 0) {
        cout << "file is not a valid WAV file" << endl;
        return 1;
    }
	cout << "audio format：" << header.fmt.audioFormat << endl;
	cout << "channel couts：" << header.fmt.numChannels << endl;
	cout << "sample rate：" << header.fmt.sampleRate << endl;
	cout << "byte rate：" << header.fmt.byteRate << endl;
	cout << "bits per sample：" << header.fmt.bitsPerSample << endl;
	cout << "data size：" << header.data.chunkSize << endl;
    cout <<" ---------" << endl;
    
    char* pcmData = new char[header.data.chunkSize];
    //读取wav文件的pcm数据部分，保存到char 数组中
    fin.read(pcmData, header.data.chunkSize);

读取背景音文件

 //读取背景音文件
    ifstream finBg("background_s8le.wav", ios::binary);
    if (!finBg) {
        return 1;
    }

    WAVHeader bgHeader = {};
    finBg.read((char*)&bgHeader, sizeof(header));

	cout << "audio format：" << bgHeader.fmt.audioFormat << endl;
	cout << "channel couts：" << bgHeader.fmt.numChannels << endl;
	cout << "sample rate：" << bgHeader.fmt.sampleRate << endl;
	cout << "byte rate：" << bgHeader.fmt.byteRate << endl;
	cout << "bits per sample：" << bgHeader.fmt.bitsPerSample << endl;
	cout << "data size：" << bgHeader.data.chunkSize << endl;

    char* bgPcmData = new char[bgHeader.data.chunkSize];
    finBg.read(bgPcmData, bgHeader.data.chunkSize);

音频混音

    //----混音start--------------------------
    //音频格式：8bit 8000hz 1channels 
	//使用算法：线性叠加后求平均
	//优点：不会产生溢出，噪音较小；
	//缺点：衰减过大，影响输出音频质量；
    int maxSize = header.data.chunkSize > bgHeader.data.chunkSize ? header.data.chunkSize : bgHeader.data.chunkSize;
    char* targetPcmData = new char[maxSize];
    for (int i = 0; i < maxSize; i++) {
        if (i < header.data.chunkSize && i < bgHeader.data.chunkSize) {
            targetPcmData[i] = (char)(((int16_t)pcmData[i] + (int16_t)bgPcmData[i]) / 2);
        }
        else if (i < header.data.chunkSize) {
            targetPcmData[i] = pcmData[i];
        }
        else {
            targetPcmData[i] = bgPcmData[i];
        }
    }

    //--混音end------------------------------------------------------

使用Windows WaveOut 相关API播放混音后的音频数据

WAVEFORMATEX waveFormat;
    /*
		WAVEFORMATEX是一种数据结构，用于指定波形音频流的数据格式。它包含以下字段：
		wFormatTag：设置波形声音的格式。
		nChannels：设置音频文件的通道数量，对于单声道的声音，此值为1；对于立体声，此值为2。
		nSamplesPerSec：设置每个声道播放和记录时的样本频率。
		nAvgBytesPerSec：设置每秒平均字节数。
		nBlockAlign：设置数据块的对齐方式，即最小数据的原子大小。
		wBitsPerSample：设置每个样本的位数。
		cbSize：设置此结构的大小。
    */
    waveFormat.wFormatTag = WAVE_FORMAT_PCM;
    waveFormat.nChannels = header.fmt.numChannels;
    waveFormat.nSamplesPerSec = header.fmt.sampleRate;
    waveFormat.nBlockAlign = header.fmt.blickAlign;
    waveFormat.wBitsPerSample = header.fmt.bitsPerSample;
    waveFormat.nAvgBytesPerSec =  waveFormat.nSamplesPerSec*waveFormat.wBitsPerSample/8;
    waveFormat.cbSize = 0;

    waveOutOpen(&hWaveOut, WAVE_MAPPER, &waveFormat, (DWORD_PTR)0, 0, CALLBACK_NULL);
    waveOutHdr.lpData = targetPcmData;
    waveOutHdr.dwBufferLength = maxSize;

    waveOutPrepareHeader(hWaveOut, &waveOutHdr, sizeof(WAVEHDR));
    waveOutWrite(hWaveOut, &waveOutHdr, sizeof(WAVEHDR));

将混音后的数据保存到新的wav文件中

 //输出混音后的数据到wav文件
 
	HWAVEOUT hWaveOut; // waveOut设备句柄
	WAVEHDR waveOutHdr; // waveOut数据块头
	
    ofstream fout("output.wav", ios::binary);
    if (!fout) {
        cout << "output.wav create failed" << endl;
        return 1;
    }
    WAVHeader oheader = header.data.chunkSize > bgHeader.data.chunkSize ? header : bgHeader;
    fout.write((char*)&oheader, sizeof(oheader));
    fout.write(targetPcmData, maxSize);

源码下载

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

音频开发

c

音频

两路wav文件读取解析和混音输出并使用WaveOut相关API播放的相关文章

从实体获取单列

如何从查询中获取单个列而不是整个对象我可以这样做来获取整个对象但我想要的只是名称 IList
通过另一个列表更新列表（linq）

我有类 Data 的对象列表如下所示 class Data int code string name DateTime date update 我还有另一个课程列表例如 class RefCodes int old code int n
当其源是 https uri 时如何使 wpf MediaElement 播放

在 wpf 独立应用程序 exe 中我在主窗口中包含了 MediaElement
C++中的类要具备什么条件才能成为容器？

我是 C 编程新手偶然发现了这个术语containers举例如下vector deque map etc 一个企业的最低要求应该是什么class应该满足被称为container in C 我将从范围这个概念开始 Range 只有两个方
MSMQ接收和删除

是否有任何选项可以在读取消息后将其从 MSMQ 中删除比如接收删除可以作为原子操作运行吗听起来您想查看下一条消息然后在处理完成后接收它 Message message Queue Peek Queue ReceiveById me
如何查明 .exe 是否正在 C++ 中运行？

给定进程名称例如程序 exe C 标准库没有这样的支持您需要一个操作系统 API 来执行此操作如果这是 Windows 那么您将使用 CreateToolhelp32Snapshot 然后使用 Process32First 和 Pr
以下 PLINQ 代码没有改进

我没有看到使用以下代码的处理速度有任何改进 IEnumerable
从时间列表中查找最接近的时间

所以这是场景我有一个带有创建时间的文件我想从该文件的创建时间最接近或相等的时间列表中选择一个时间完成此操作的最佳方法是什么 var closestTime listOfTimes OrderBy t gt Math Abs t fi
C 类型命名约定，_t 或 ALLCAPS

我一直想知道是否有任何命名约定例如何时对类型使用全部大写以及何时追加 t 什么时候不使用任何东西我知道当时 K R 发布了各种有关如何使用 C 的文档但我找不到任何相关内容在 C 标准库类型中 t看起来漂亮占主导地位 time t
为什么 std::function 不是有效的模板参数，而函数指针却是？

我已经定义了名为的类模板CallBackAtInit其唯一目的是在初始化时调用函数构造函数该函数在模板参数中指定问题是模板不接受std function作为参数但它们接受函数指针为什么这是我的代码 include
如何增加ofstream的缓冲区大小

我想增加 C 程序的缓冲区大小以便它不会过于频繁地写入默认缓冲区是 8192 字节我尝试使用 pubsetbuf 将其增加到 200K 原始代码 ofstream fq fastq1 cstr ios out fastq1 is a
如何设置消息队列的所有者？

System Messaging MessageQueue 类不提供设置队列所有权的方法如何以编程方式设置 MSMQ 消息队列的所有者简短的答案是 p invoke 对 windows api 函数的调用MQSetQueueSecuri
如果在代码中添加元素，“FindName”将不起作用

在 WPF 应用程序中如果在 XAML 中声明 ContentControl
如何使用 C# 查询远程 MS ACCESS .mdb 数据库

我正在尝试使用 C 查询 mote MS ACCESS 数据库 mdb 文件将文件复制到本地计算机时可以成功查询它我只想远程放置文件所以我的客户端程序不包含原始数据 static string m path http www xyz
WinForms - 加载表单时如何使用 PaintEventArgs 运行函数？

我试图理解图形在 Graphics FromImage 文档中它有这样的示例 private void FromImageImage PaintEventArgs e Create image Image imageFile Image
在 mvc4 中创建通用 mvc 视图

我以前也提过类似的问题没有得到答案如何创建一个通用的 mvc4 视图该视图可以显示传递给它的模型列表或单个模型模型可以是个人组织或团体无论传递给它的是什么如果您正在寻找类似的东西 model MyViewModel
用数组或向量实现多维数组

我想使用单个数组或向量实现多维数组可以像通常的多维数组一样访问它例如 a 1 2 3 我陷入困境的是如何实施操作员如果数组的维数为 1 则 a 1 应该返回位于索引 1 处的元素但是如果维数大于一怎么办对于嵌套向量例如 3 维
将日期时间显示为 MM/dd/yyyy HH:mm 格式 C#

在数据库中日期时间以 MM dd yyyy HH mm ss 格式存储但是我想以 MM dd yyyy HH mm 格式显示日期时间我通过使用 String Format 进行了尝试 txtCampaignStartDate Tex
不使用放置 new 返回的指针时的 C++ 严格别名

这可能会导致未定义的行为吗 uint8 t storage 4 We assume storage is properly aligned here int32 t intPtr new void storage int32 t 4 I k
在 C 中使用 #define 没有任何价值

If a define没有任何价值地使用例如 define COMMAND SPI 默认值是0吗不它的评估结果为零从字面上看该符号被替换为空然而一旦你有了 define FOO 预处理器条件 ifdef FOO现在将是真的另

随机推荐

期末备考 |《数学物理方法》期末备考资料包来啦！

写在前面不知不觉又到了学期的末尾不知道各位计算机er的专业课复习得怎么样了呢为了帮助大家更好地备战期末从今天开始岛主将持续为大家更新计算机期末备考资料为同学们的绩点护航今天岛主为大家带来的是数学物理方法期末备考资料包
Solidity之旅（十）OOP-抽象合约

抽象合约 abstractcontract 前文在讲合约继承的基类构造函数的参数时有提到抽象合约也就是说如果派生合约未能给其继承的基合约指定构造函数参数时那么该派生合约必须声明为抽象合约 abstractcontract 我们知道
Graylog 中日志级别及其对应的数字

在 Graylog 中日志级别 level 通常使用数字表示数字越低表示日志级别越高以下是常见的日志级别及其对应的数字表示 DEBUG 调试对应数字 7 INFO 信息对应数字 6 NOTICE 通知对应数字 5 WARN 警告
ERP、SAP、MES 三者之间的区别是什么？

ERP SAP MES之间有什么区别 SAP 思爱普是ERP系统与企业管理解决方案提供商而ERP和MES是两个用途不一样的管理系统也就是说 SAP是一家厂商提供包含ERP在内的管理系统 SAP搞清楚了那么 ERP和MES 呢
GoLong的学习之路，进阶，Viper（yaml等配置文件的管理）

本来有今天是继续接着上一章写微服务的但是这几天有朋友说再写Web框架的时候遇到一个问题就是很多的中间件 redis 微信 mysql mq 的配置信息写的太杂了很不好管理希望我能写一篇有管理配置文件的所以这篇就放到今天写吧微
【抄作业】ImportError ：cannot import name xxxxxx ，原博主Activewaste

前情介绍网上关于这种问题的解决方案一大堆但是绝大多数都是不适用或者说解决不了问题我根据别人所遇到的和我自己遇到的对这个问题整理了一下希望能解决这个问题问题分析一缺少这个module或者func或者package 缺少pyt
波奇学Linux：环境变量，本地变量和内建命令

Windows下的环境变量 echo PATH 查看指令搜索命令路径在bash命令行输入的指令系统根据PATH中的路径查询增加PATH指令 PATH等于上面的路径表示不同路径分割符 home boki lesson13代表新的路径
基于java中SSM框架实现门诊药品管理系统演示【附项目源码+论文说明】

基于java中SSM框架实现门诊药品管理系统演示摘要 21世纪的今天随着社会的不断发展与进步人们对于信息科学化的认识已由低层次向高层次发展由原来的感性认识向理性认识提高管理工作的重要性已逐渐被人们所认识科学化的管理使信息存储
数说CS | 不招学硕？拟录取人数持续增长？北大软件与微电子学院为何如此热门？

写在前面北京大学软件与微电子学院软件工程学科评估为A类招收哪些专业保研录取情况如何今天岛主就带你深度揭秘北京大学软件与微电子学院 01 院校介绍北京大学软件与微电子学院成立于2002年3月如今已形成了一个学院北京大学软件
数说CS | 拟录取名额上涨，开设九推？上岸复旦大学计算机科学与技术学院更轻松了吗？

写在前面复旦大学计算机科学技术学院学科评估为A类招收哪些专业保研录取情况如何今天岛主就带你深度揭秘复旦大学计算机科学技术学院 01 院校介绍复旦大学计算机学科创建于中国计算机事业的起步期始于 1956 年自主建造的国内第
工业级路由器在货运物流仓储管理中的应用

工业级路由器在货运物流仓储管理中扮演着重要的角色为整个物流系统提供了稳定可靠的网络连接和数据传输支持下面将从以下几个方面介绍工业级路由器在货运物流仓储管理中的应用实时监控和追踪工业级路由器通过与各种传感器监控设备和物联网设备的连接
人工智能自然语言处理：语言之美，算法之智

导言自然语言处理 Natural Language Processing NLP 是人工智能领域中备受关注的分支致力于让计算机能够理解处理和生成人类语言本文将深入研究人工智能在自然语言处理领域的关键技术应用场景以及未来发展趋势 1
学长休学一年强势回归，截胡了我的保研名额……

写在前面保研是一场持久的战役从评定保研资格到申请梦校offer 每一步都需要保研er费尽九牛二虎之力其中最怕的便是半路杀出个程咬金让一切的努力化为乌有算到了加分刺客算到了名额变动独独没想到被上届休学归来的学长姐挤占了保研名
人工智能计算机视觉：解析现状与未来趋势

导言随着人工智能的迅速发展计算机视觉技术逐渐成为引领创新的关键领域本文将深入探讨人工智能在计算机视觉方面的最新进展关键挑战以及未来可能的趋势 1 简介计算机视觉是人工智能的一个重要分支其目标是使机器具备类似于人类视觉的能力这一
C++函数模板与类模板

目录 C 模板定义函数模板类模板类模板的定义模板的优缺点模板的优点模板的缺点 C 模板定义 C 模板允许程序员在通用编程中创建可重用的代码这种编程技术基于模板的编
echarts环形饼图

效果示例代码汇总 pieCharts let data const providerResult name 智诺 value 23 name 海康 value 5 name 大华 value 5 name 云科 value 23 name
开考在即？四六级押题卷免费送！

距12月16日四六级考试还有 1个多月的时间啦在这短短一月时间里只有考前押题和历年真题才能在短时间内帮助到你们所以岛主给你们准备了今年 12月四六级绝密押题卷还包含历年真题卷答案详解没有时间复习想考前突击一下的同
在openEuler上安装openGauss2023年12月最新openGauss5.0.0LTS版本全图片解析

先说环境虚拟机 openEuler22 03 LTS ip 192 168 88 129 普通用户 yirc99 和 root用户主机win10 要安装的数据库 openGauss 5 0 0 LTS 在下面的文章中可能会出现命令不存在
迅为IMX6UL核心板在便携式医疗设备中的应用方案

在科技日益发展的今天便携式医疗设备变得越来越受欢迎这些小巧轻便的设备例如IMX6UL核心板为医疗行业带来了巨大的变革它们不仅便于携带而且集成了多种功能满足了人们对健康管理的各种需求便携式医疗设备在当今社会越来越受到欢迎这
两路wav文件读取解析和混音输出并使用WaveOut相关API播放

目录 wav文件格式简介 wav文件头定义读取wav文件读取背景音文件音频混音使用Windows WaveOut 相关API播放混音后的音频数据将混音后的数据保存到新的wav文件中