原始pcm格式的音频数据是如何存储的？

2024-02-29

我正在编写一个应用程序来操作音频，我需要首先将文件（wav、MP3 等）转换为原始数据（样本以浮点形式呈现）。

我在cmd中使用ffmpeg：

ffmpeg -i test.wav -f s16le -acodec pcm_s16le output.dat

样本如何在output.dat文件？我知道在S16下一个样本需要两个字节，双通道意味着它存储为L1 R1 L2 R2 ...但是这个文件是否带有帧表示或dat文件中的所有字节都是样本值？两种方法转换后的test.wav文件大小并不相同。一种是通过libav使用ffmpeg网站上的示例代码，另一种是上面提到的，直接在cmd中使用ffmpeg.exe，前一种方法给我一个稍小的文件大小。当我发现有人说pcm使用帧演示时，我很困惑（一帧有 2048 个采样）。

我实际上不需要任何代码，但希望有人可以详细解释原始 pcm 格式。

多谢

从位深度为 16 位、采样率为 44,100 kHz 的立体声 wav 文件开始，您将拥有一个标准 CD 质量的音频文件...在命令行上发出此命令以在文件上显示此类统计信息

ffprobe Cesária_Évora.wav

典型输出

  Duration: 00:00:21.51, bitrate: 1411 kb/s
    Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 44100 Hz, 2 channels, s16, 1411 kb/s

从 wav 问题创建 PCM 文件

ffmpeg -i Cesária_Évora.wav -f s16le -acodec pcm_s16le cesaria.dat

请注意，wav 文件只是一个 44 字节标头，后跟有效负载，它是 PCM 格式的原始音频曲线...这个 PCM 文件严格来说是 L1 R1 L2 R2 不多不少...任何帧的概念都是我们如何在没有专用于实现帧的位（如开始/结束标记）的情况下解析数据...编写代码来操作 PCM 数据请记住您的位深度以及您的文件是否具有小端字节结构或大端字节结构...每当您的文件的位深度为 8 位时，您就可以安全地忽略字节顺序，因为您永远不需要移动字节，但是由于上述文件的位深度为 16 位，这意味着音频曲线的每个点都由单个表示每通道16位数（立体声为两通道，单声道为一通道）

当读取这样的文件时，这个 16 位数字存储在两个字节中...如果在读取字节时使用小端字节序，则最左边的字节（当您迭代文件时在循环中第一次遇到）是最小的字节，后面跟着下一个字节更重要的字节含义

L1 R1 L2 R2

下面我们指出音频曲线上两个 16 位点的立体声表示

Llittle1 Lbig1 Rlittle1 Rbig1 Llittle2 Lbig2 Rlittle2 Rbig2

当我们谈到用于存储这两个点的各个字节时...上面的注释显示了 8 个字节...类似地，如果我们的位深度为 24 字节，则一个通道上的一个原始音频样本将如下所示

Llittle1 Lbigger1 Lbiggest1 Rlittle1 Rbigger1 Rbiggest1

因此，从概念上讲，当读取位深度为 16 位的小端文件时，这里是如何解析原始音频曲线上一个点的一个通道的 PCM

Llittle1 Lbig1

现在生成一个值L1你在概念上这样做

L1 = ( Lbig1 << shift 8 bits to left ) + Llittle1

不确定这是否是您正在寻找的抽象级别，但它是敲定数字音频的垫脚石

超级有用的工具Audacity https://www.audacityteam.org/允许您导入我们在上面生成的 cesaria.dat 中的 PCM 格式的原始音频文件 ... Audacity -> 文件 -> 导入 -> 原始数据 -> 选择 cesaria.dat ->

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

原始pcm格式的音频数据是如何存储的？的相关文章

在 FFmpeg 中使用 -filter_complex amerge 时混合流

我目前遇到 ffmpeg 及其过滤器之一的问题我正在尝试将视频的 2 个音频流合并为一个为此我尝试了这个命令 ffmpeg i home maniaplanet Videos ManiaPlanet 2014 08 21 20 09 1
YUV420p 上的大量绿色 --> iOS 上 OpenGL 2.0 着色器中的 RGB

我想使用 ffmpeg 和 OpenGL ES 2 0 为 iOS 制作一个电影播放器但我有一些问题输出 RGB 图像有很多绿色这是代码和图像 480x320 宽度和高度 512x512 纹理宽度和高度我从 ffmpeg AVFra
ffmpeg通过添加框或边框来扩展（而不是调整大小）视频大小

假设我有一个特殊分辨率的视频例如 1280x718 我想将其更改为 1280x720 但我宁愿只在顶部和底部添加一行而不是将 718 像素垂直插值到 720 所以基本上我正在寻找一种方法告诉 ffmpeg 创建 1280x720 的输
使用 ffmpeg 将视频与其自身连接，但相反

我能够逆转 ffmpeg i input mp4 vf reverse output reversed mp4 我可以连接 ffmpeg i input mp4 i input mp4 filter complex 0 0 0 1 1 0
FFmpeg - H264 编码器找不到有效设备并且无法配置编码器

我尝试使用 H264 编码器进行编码但是当我这样做时出现以下错误 h264 v4l2m2m 0x55682d2416c0 Could not find a valid device h264 v4l2m2m 0x55682d2416c0
访问 AVFrame 的每个像素

我需要访问 FFMPEG 的 AVFrame 对象的每个像素信息如果是 RGB 则每个像素的每种颜色 R G 和 B 我怎样才能做到这一点如果您已经前进到正确的框架类似于 img convert ctx ffmpeg sws getC
无法在 Windows 7 机器中使用 OpenCV 2.4.3、Python 2.7 打开“.mp4”视频文件

我目前正在进行一个涉及读取 mp4 视频文件的项目我遇到的问题是它在Windows 7机器上使用Python 2 7 32位 OpenCV 2 4 3 cv2 pyd 代码片段如下 try video cv2 VideoCapture v
如何在Android项目中使用libffmpeg.so？

我正在尝试在 Android 中创建一个屏幕录制应用程序为此我使用 FFmpeg 我已经创建了 libffmpeg so 文件现在我想在 Android 项目中使用相同的方法来调用它的本机函数我怎样才能做到这一点本教程提供了有关此
H264 字节流到图像文件

第一次来这里所以要温柔我已经在给定的 H 264 字节流上工作了几个星期一般注意事项字节流不是来自文件它是从外部源实时提供给我的字节流使用 Android 的媒体编解码器进行编码当将流写入扩展名为 H264的文件时 VLC能够正
使用 ffmpeg 或 OpenCV 处理原始图像

看完之后维基百科页面 http en wikipedia org wiki Raw image format原始图像格式是任何图像的数字负片为了查看或打印相机图像传感器的输出具有进行处理即转换为照片渲染场景然后以标准光栅图形格
FFmpeg 不适用于 android 10，直接进入 onFailure(String message) 并显示空消息

我在我的一个项目中使用 FFmpeg 进行视频压缩在 Android 10 Google Pixel 3a 上对于发送执行的任何命令它会直接进入 onFailure String message 并显示空消息所以我在我的应用程序 g
如何从 Linux 命令行获取视频文件的分辨率（宽度和高度）？

我一直在挖掘 mplayer mencoder 和 ffmpeg 文档但我似乎无法想出anything 我对输出格式不是特别挑剔因为我可以使用正则表达式将其拉出来我只是似乎无法首先获取数据 Use ffprobe https ffmp
在 ffmpeg 中，如何使用scale2ref 过滤器缩放 dvdsub 字幕以匹配视频大小？

我有一个从直播电视录制的 mpeg 文件其中包含视频以及多个音频和字幕流我的最终目标是能够创建较小的视频文件因为 mpeg 文件大小为数 GB 我在这条道路上的第一步只是能够选择视频音频和字幕流中的每一个并将它们复制到 mkv 文件
Bash 脚本：自动为 mpeg-dash 进行 ffmpeg 编码

我正在编写一个 bash 文件来创建视频编码和串联以供 dash 实时流媒体使用基本上它读取输入视频文件夹将所有视频编码为三种分辨率格式然后将它们连接起来创建三个适应集 DIAGRAM 该脚本检查 fps 一致性如果输入不是 1
Chromium 中的 MP4 编解码器支持

我们已将 Chromium 嵌入式框架集成到我们的 Windows 游戏中以允许我们从应用程序内渲染网页并且一切正常除了 MP4 视频据我所知由于许可问题 Chromium 不包含此编解码器但任何人都可以提供有关我们如何添加支持
Python FFmpeg查询rtsp太慢

目前我正在尝试使用 python 和 FFmpeg 来查询原始格式为 h264 的 rtsp 数据直播流视频的信息为 fps 29 分辨率 1280 720 我希望我可以以相同的格式 h264 查询数据并将其放入python队列中以便将
连接 2 个迷你音频文件并循环播放并添加背景音乐

我需要用循环连接 2 个小音频文件并在单个命令中添加背景音乐我能够将两个音频文件与背景音乐连接起来我上面给出的代码正在运行 ffmpeg i 1 mp3 i 2 mp3 i background mp3 filter complex 0
id3 图像编辑后播放 mp3 时遇到问题

由于硬件限制我们生产的软件试图确保导入到其库中的任何音频文件准备复制到硬件上都是可接受的比特率最近我们开始使用 FFmpeg 将许多不同的音频类型转换为 mp3 以便在我们的硬件上导入和使用它们虽然转换工作正常并且 mp3 文件
ffmpeg计算视频比特率

我想知道如何计算该视频的比特率 http jell yfish us media jellyfish 30 mbps hd hevc mkv http jell yfish us media jellyfish 30 mbps hd hev
如何将AVFrame转换为glTexImage2D使用的纹理？

如您所知 AVFrame 有 2 个属性 pFrame gt data pFrame gt linesize 当我从视频 sdcard test mp4 android平台读取帧后并将其转换为RGB AVFrame副 img conve

随机推荐

检测HTML元素是否包含特定字符实体

如果我有这样的标记 div xf067 div 我想稍后检测 div foo 是否仍然包含相同的字符实体我希望能够通过将其与 xf067 而不是为了在我的代码库中出于维护目的这相当迟钝我尝试过这样的事情使用 jQuery con
getBoundingClientRect().width 和 height 是否包括元素的填充和边框？

Does getBoundingClientRect width and height属性同时返回值包括元素的填充和边框 TLDR 它将始终返回尺寸边框框下面的绿色框其中包含内容区填充区域 and 边区如定义在CSS 盒子模型 h
让 Android WebView 检测并弹出电子邮件对话框或电话对话框

在 Android 上当内置浏览器遇到电子邮件或电话号码并按下时会出现一个对话框但是如果我导航到应用程序的 web 视图中的该 url 则情况不再如此无论如何我的 webview 在检测电子邮件和电话号码并在按下时弹出相应的默认
UndefinedFunctionError phoenix Elixir 新项目

全新安装 Phoenix 后我尝试触发一个新项目当我尝试运行服务器时我遇到了 Unchecked dependencies for environment dev gettext Hex package the dependency
Node.js 服务器启动速度非常慢

我构建了一个小型 angular js Web 应用程序托管在我的计算机上运行的 Node js 服务器上当我启动节点服务器时大约需要 30 35 秒同事计算机上的完全相同的服务器需要 2 4 秒才能启动我已在控制台中记录了时间
nhibernate 是否可以将查询作为 IDictionary 而不是实体类返回？

我有一个实体人 public class Person public virtual int Id get set public virtual string FirstName get set public virtual string
iOS 魔法记录 & SQLCipher

我正在使用 Magical Record 来保存我的数据这些数据需要加密所以我尝试将其与 SQLCipher 库结合起来 http sqlcipher net ios tutorial http sqlcipher net ios tu
如何使用java的selenium web驱动程序获取特定optgroup下的选项？

例如我想从多选选项列表字段中选择特定 optgroup 下的选项
JNI GetByteArrayElements () 错误

我是 JNI 的新手所以我对 JNI 和英语都不熟悉我的JNI项目是一个简单的文件读写在 Java 中读取文件并将字节数组传递给 C API 然后使用 C 将其写入文件我的源代码 Java代码是 public class FileI
使用 jQuery 将活动类添加到导航中的当前页面

我正在尝试将活动类添加到标题中当前页面的导航链接我取得了一些进展但遇到了一个小错误希望得到一些帮助我知道答案很明显但是我是 jQuery Javascript 的新手我自己很难找到它这是我的导航 HTML 结构
“这个分支有必须解决的冲突”但它已经合并了

我合并了一个PR https github com DaniSchenk moment feiertage pull 8使用 GitHub Web 界面成功解决了合并提交 https github com DaniSchenk momen
关闭 websocket++ 连接

当在 ASIO 模式下使用 Websocket 时我开始连接 boost shared ptr
Rscript：没有名为...的包吗？

我想使用 Rscript 以批处理模式运行 R 文件但它似乎没有加载我需要的库我收到的具体错误是 Error in library timeSeries there is no package called timeSeries Exe
如何从 jQuery 函数内部的外部获取变量？ [复制]

这个问题在这里已经有答案了我试图弄清楚如何从函数外部 jQuery 函数内部获取变量但我得到Uncaught ReferenceError myvar is not defined 有什么办法可以做到这一点吗我的代码的一个简单示例 f
如何获得具有多个单位的输出的时间差

再会我在 as POSIXct 中有两个日期列格式为 YYYY MM DD HH MM SS 我想得到两者之间的差异以天小时秒的格式显示这是一些虚拟数据 a lt c 2018 03 20 11 52 25 AST 2018 03
导航到目的地时仅创建一个片段实例（android）

我正在使用导航组件导航时如果片段已经存在于后台堆栈中我不想创建新的片段实例并弹出前面已经存在的片段 findNavController navigate RequestTransferFragmentDirections actio
为什么无作用域枚举的声明可以编译？

In the Effective Modern C Scott Meyers 的书提到无作用域枚举和有作用域枚举枚举类之间的主要区别之一是我们无法转发声明前者请参阅第 3 章第 10 项更喜欢有作用域的枚举而不是无作用域的枚举例
容错 JSON 解析

我正在使用 Data Aeson 将一些 JSON 解析为记录类型有时数据会添加到 JSON 中这会破坏我的代码因为 Aeson 抱怨如下预期对象为 21 名称值对但有 23 个名称值我真的更喜欢以容错方式解析 JSON 我
为什么 Chrome 扩展程序图像在添加到 DOM 时显示为损坏？

我正在构建一个 Chrome 扩展并尝试通过内容脚本将带有背景图像的 div 添加到 DOM CSS 加载正确并且通过开发人员工具检查器查看图像 URL 似乎是正确的 close button css background url ch
原始pcm格式的音频数据是如何存储的？

我正在编写一个应用程序来操作音频我需要首先将文件 wav MP3 等转换为原始数据样本以浮点形式呈现我在cmd中使用ffmpeg ffmpeg i test wav f s16le acodec pcm s16le output d

原始pcm格式的音频数据是如何存储的？

原始pcm格式的音频数据是如何存储的？ 的相关文章

随机推荐

热门标签

原始pcm格式的音频数据是如何存储的？的相关文章