音视频基础之音频编码原理简介

2023-05-16

一:隐蔽信号

数字音频信号如果不加压缩地直接进行传送,将会占用极大的带宽。例如,一套双声道数字音频若取样频率为44.1KHz,每样值按16bit量化,则其码率为:
244.1kHz16bit=1.411Mbit/s

如此大的带宽将给信号的传输和处理都带来许多困难和成本(阿里云服务器带宽大于5M后,每M价格是100元/月),
因此必须采取音频压缩技术对音频数据进行处理,才能有效地传输音频数据。

数字音频压缩编码在保证信号在听觉方面不产生失真的前提下,对音频数据信号进行尽可能大的压缩,降低数据量。数字音频压缩编码采取去除声音信号中冗余成分的方法来实现。所谓冗余成分指的是音频中不能被人耳感知到的信号,它们对确定声音的音色,音调等信息没有任何的帮助。

冗余信号包含人耳听觉范围外的音频信号以及被掩蔽掉的音频信号等。例如,人耳所能察觉的声音信号的频率范围为20Hz~20KHz,除此之外的其它频率人耳无法察觉,都可视为冗余信号。

此外,根据人耳听觉的生理和心理声学现象,当一个强音信号与一个弱音信号同时存在时,弱音信号将被强音信号所掩蔽而听不见,这样弱音信号就可以视为冗余信号而不用传送。这就是人耳听觉的掩蔽效应,主要表现在频谱掩蔽效应和时域掩蔽效应。

一个频率的声音能量小于某个阈值之后,人耳就会听不到。当有另外能量较大的声音出现的时候,该声音频率附近的阈值会提高很多,即所谓的掩蔽效应。如下图所示:
在这里插入图片描述
由图中我们可以看出人耳对2KHz~5KHz的声音最敏感,而对频率太低或太高的声音信号都很迟钝,当有一个频率为0.2KHz、强度为60dB的声音出现时,其附近的阈值提高了很多。由图中我们可以看出在0.1KHz以下、1KHz以上的部分,由于离0.2KHz强信号较远,不受0.2KHz强信号影响,阈值不受影响;而在0.1KHz~1KHz范围,由于0.2KHz强音的出现,阈值有较大的提升,人耳在此范围所能感觉到的最小声音强度大幅提升。如果0.1KHz~1KHz范围内的声音信号的强度在被提升的阈值曲线之下,由于它被0.2KHz强音信号所掩蔽,那么此时我们人耳只能听到0.2KHz的强音信号而根本听不见其它弱信号,这些与0.2KHz强音信号同时存在的弱音信号就可视为冗余信号而不必传送。

当强音信号和弱音信号同时出现时,还存在时域掩蔽效应。即两者发生时间很接近的时候,也会发生掩蔽效应。时域掩蔽过程曲线如图所示,分为前掩蔽、同时掩蔽和后掩蔽三部分。
在这里插入图片描述
时域掩蔽效应可以分成三种:前掩蔽,同时掩蔽,后掩蔽。前掩蔽是指人耳在听到强信号之前的短暂时间内,已经存在的弱信号会被掩蔽而听不到。同时掩蔽是指当强信号与弱信号同时存在时,弱信号会被强信号所掩蔽而听不到。后掩蔽是指当强信号消失后,需经过较长的一段时间才能重新听见弱信号,称为后掩蔽。这些被掩蔽的弱信号即可视为冗余信号。

二:音频编码–压缩编码方法

当前数字音频编码领域存在着不同的编码方案和实现方式, 但基本的编码思路大同小异, 如图所示。
在这里插入图片描述
对每一个音频声道中的音频采样信号:
1.将它们映射到频域中,这种时域到频域的映射可通过子带滤波器实现。每个声道中的音频采样块首先要根据心理声学模型来计算掩蔽门限值;
2.由计算出的掩蔽门限值决定从公共比特池中分配给该声道的不同频率域中多少比特数,接着进行量化以及编码工作;
3.将控制参数及辅助数据加入数据之中,产生编码后的数据流。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

音视频基础之音频编码原理简介 的相关文章

  • macbook m1芯片 实现vscode下debug(解决无法读入的问题)

    需要下载的 点击下载vscode xff0c 注意选择Mac的Universal版本 xff08 兼容intel和apple silicon xff09 安装两个插件 C C 43 43 Extension Pack CodeLLDB 需要
  • Ubuntu利用anaconda安装TensorFlow-gpu版本以及安装paddle-gpu版本

    在Ubuntu系统安装GPU版本的TensorFlow xff0c 主要就是要选择好合适的TensorFlow版本以及与之相对应的cuda以及cudnn版本 第一步 xff0c 确保系统安装了anaconda xff0c 这个安装过程较为简
  • 【笔试】备战秋招,每日一题|20230415携程研发岗笔试

    前言 最近碰到一个专门制作大厂真题模拟题的网站 codefun2000 xff0c 最近一直在上面刷题 今天来进行2023 04 15携程研发岗笔试 xff0c 整理了一下自己的思路和代码 比赛地址 A 找到you 题意 xff1a 给定一
  • 【算法】欧拉路径的DFS存储顺序

    欧拉路径和欧拉回路 对于无向图 xff0c 所有边都是连通的 xff08 1 xff09 存在欧拉路径的充分必要条件 xff1a 度数为奇数的点只能有0个或2个 xff08 2 xff09 存在欧拉回路的充分必要条件 xff1a 度数为奇数
  • 【算法】二分图的相关性质

    二分图的定义 二分图是指将图中所有点分为两个集合 xff0c 任意一条边对应的两个点都不在同一个集合中 二分图的判定 判定一个图是否为二分图 xff0c 是考虑这个图中是否有奇数环 xff0c 如果不存在奇数环 xff0c 则图为二分图 具
  • 【比赛】LeetCode 2023 春季杯团队赛题解

    A 符文储备 题意 xff1a 给定一个数组 xff0c 问可以从中选择最多多少个连续的数 xff0c 使得这些数排序后 xff0c 相邻两个数的差最多是 1 数据范围 xff1a 1 lt 61 runes length lt 61 10
  • 关于puts和printf区别

    又是HDU2004那题 xff0c 开始是直接暴力if else puts输出的 xff0c 结果发现是 Warning passing argument 1 of 39 puts 39 makes pointer from integer
  • 高精度 求n!

    我们知道 xff0c 阶乘这玩意一般来说 xff0c 很大时可以和次方相提并论 xff0c 所以在计算机中很容易溢出 xff0c 所以对于它 xff0c 只能采用高精度求解 下面我们有两个求法 一 当所求n不大时 xff0c 这里限制范围为
  • 出租车费计算

    题目描述 某市出租车计价规则如下 xff1a 起步4公里10元 xff0c 即使你的行程没超过4公里 xff1b 接下来的4公里 xff0c 每公里2元 xff1b 之后每公里2 4元 行程的最后一段即使不到1公里 xff0c 也当作1公里
  • CSP-A - 咕咕东的奇遇

    题意 小明得到了一个神奇的圆环 这个圆环由字母表组成首尾相接的环 xff0c 环上有一个指针 xff0c 最初指向字母a 小明每次可以顺时针或者逆时针旋转一格 例如 xff0c a顺时针旋转到z xff0c 逆时针旋转到b 小明手里有一个字
  • week-4-C-TT的神秘礼物(二分答案)

    题意 TT 是一位重度爱猫人士 xff0c 每日沉溺于 B 站上的猫咪频道 有一天 xff0c TT 的好友 ZJM 决定交给 TT 一个难题 xff0c 如果 TT 能够解决这个难题 xff0c ZJM 就会买一只可爱猫咪送给 TT 任务
  • ITK(Insight Tool Kit) 医疗影像数据后处理软件模块使用和算法02

    上节说到如何在windows xff08 10 xff09 的VS xff08 2017 xff09 平台下导入ITK的library xff0c 这次咱们开始说一下咱们一开始最关心的内容 xff0c 如何用ITK来做3D图像 xff08
  • windows10 64位下tensorflow 3.6+cuda 9.0 +cudnn 9.0安装过程与踩过的雷

    在昨天之前 xff0c 我甚至还不知道GPU运行tf程序到底长啥样 xff0c 就在昨晚我开始尝试了 那么问题来了 如何在windows系统下安装tf并且成功运行呢 xff1f 我先说说大致过程 xff0c 然后吐槽下我遇到的一些坑 第一步
  • 相机校参及C-arm校参 07 - 根据2D图像计算相机的相对位姿

    已知条件为 xff1a 1 calibrated camera 校准后相机的intrisic parameters xff08 K xff09 2 Model geometry 模型中特征点 xff08 有些文献中成为标记物Tag xff0
  • Parallel Platform (Stewart Platform) 类型机械臂的正逆解 01

    并联机器人相对于串联机器人有着不同的应用场景 本文主要是基于并联机械臂的基础控制算法做一些阐述 对于机械臂的架构通讯方式 xff08 RS232 RS485 Canbus Modbus xff09 xff0c 结构设计 xff08 球关节
  • 外科手术器械设计 超声刀设计思路和原理 - 01

    换能器设计和控制是超声刀设计最重要的环节之一 xff0c 内容也比较庞大 xff0c 打算分几个章节慢慢的写 xff0c 顺便在回顾一下之前的设计测试过程 比较喜欢挑战难度从高到低 xff0c 本人硬件EE背景比较薄弱 xff0c 所以我可
  • 外科手术器械设计 超声刀设计思路和原理 - 02

    接着上文 xff0c 对于自动跟踪谐振频率的超声刀控制反馈电路做了简单的介绍 xff0c 该方式非常适合无线超声刀 xff08 无主机系统 xff09 xff0c 一方面减少了元器件的数量降低了成本 并且减少了整个handpiece的重量
  • 外科手术器械设计 超声刀设计思路和原理 - 03

    超声刀的原理通过高频的机械振动产生组织细胞内的空化效应 xff0c 相当于内爆吧 xff0c 从而达到在切割组织的同时又有凝闭血管的效果 而如何产生这类高频的机械振动呢 xff1f 换能器的核心还是压电陶瓷 xff0c 原理机制比较复杂的一
  • 外科手术器械设计 超声刀设计思路和原理 - 04

    根据上文牛顿第二定律的谐振频率模型可以得到 xff1a 又有 xff0c 在无阻尼和无外力的情况下 xff0c 可简化为 xff1a 根据简谐振动的情况 xff0c 里面的t可以用x代替 xff1b 根据二阶齐次微分方程的通解可以求得振速

随机推荐