我使用 libav (ffmpeg) 使用时间戳/时基进行帧查找/读取有什么问题？

2024-02-23

所以我想抓取一个框架来自视频在特定时间 using libav用作缩略图。

我正在使用的是以下代码。它编译并运行良好（就检索图片而言），但我很难将其实现检索正确的图片.

我根本无法理解 libav 在每个视频中明显使用多个时基背后的所有清晰逻辑。具体找出哪些函数期望/返回哪种类型的时基。

不幸的是，这些文档基本上没有任何帮助。那么来救援吗？

#define ABORT(x) do {fprintf(stderr, x); exit(1);} while(0)

av_register_all();

AVFormatContext *format_context = ...;
AVCodec *codec = ...;
AVStream *stream = ...;
AVCodecContext *codec_context = ...;
int stream_index = ...;

// open codec_context, etc.

AVRational stream_time_base = stream->time_base;
AVRational codec_time_base = codec_context->time_base;

printf("stream_time_base: %d / %d = %.5f\n", stream_time_base.num, stream_time_base.den, av_q2d(stream_time_base));
printf("codec_time_base: %d / %d = %.5f\n\n", codec_time_base.num, codec_time_base.den, av_q2d(codec_time_base));

AVFrame *frame = avcodec_alloc_frame();

printf("duration: %lld @ %d/sec (%.2f sec)\n", format_context->duration, AV_TIME_BASE, (double)format_context->duration / AV_TIME_BASE);
printf("duration: %lld @ %d/sec (stream time base)\n\n", format_context->duration / AV_TIME_BASE * stream_time_base.den, stream_time_base.den);
printf("duration: %lld @ %d/sec (codec time base)\n", format_context->duration / AV_TIME_BASE * codec_time_base.den, codec_time_base.den);

double request_time = 10.0; // 10 seconds. Video's total duration is ~20sec
int64_t request_timestamp = request_time / av_q2d(stream_time_base);
printf("requested: %.2f (sec)\t-> %2lld (pts)\n", request_time, request_timestamp);

av_seek_frame(format_context, stream_index, request_timestamp, 0);

AVPacket packet;
int frame_finished;
do {
    if (av_read_frame(format_context, &packet) < 0) {
        break;
    } else if (packet.stream_index != stream_index) {
        av_free_packet(&packet);
        continue;
    }
    avcodec_decode_video2(codec_context, frame, &frame_finished, &packet);
} while (!frame_finished);

// do something with frame

int64_t received_timestamp = frame->pkt_pts;
double received_time = received_timestamp * av_q2d(stream_time_base);
printf("received:  %.2f (sec)\t-> %2lld (pts)\n\n", received_time, received_timestamp);

使用测试电影文件运行它，我得到以下输出：

    stream_time_base: 1 / 30000 = 0.00003
    codec_time_base: 50 / 2997 = 0.01668

    duration: 20062041 @ 1000000/sec (20.06 sec)
    duration: 600000 @ 30000/sec (stream time base)
    duration: 59940 @ 2997/sec (codec time base)

    requested: 10.00 (sec)  -> 300000 (pts)
    received:  0.07 (sec)   -> 2002 (pts)

时代不相符。这里发生了什么？我究竟做错了什么？

在寻找线索时我偶然发现了这一点这个说法 http://libav-users.943685.n4.nabble.com/How-do-I-convert-dts-pts-values-into-seconds-tt945776.html#a945779来自 libav-users 邮件列表...

[...] 分组PTS/DTS单位为格式化上下文的 time_base,
哪里的AVFrame->pts值的单位为编解码器上下文的 time_base.

换句话说，容器可以（并且通常）有不同的 time_base 比编解码器。大多数 libav 玩家都懒得使用编解码器的 time_base 或 pts 因为并非所有编解码器都有一个，但大多数容器可以。（这就是为什么danger教程说忽略AVFrame->pts）

…这让我更加困惑，因为我在官方文档中找不到任何此类提及。

反正我换了……

double received_time = received_timestamp * av_q2d(stream_time_base);

…with…

double received_time = received_timestamp * av_q2d(codec_time_base);

...输出变成这样...

...

requested: 10.00 (sec)  -> 300000 (pts)
received:  33.40 (sec)  -> 2002 (pts)

仍然没有比赛。怎么了？

大多是这样的：

流时基是您真正感兴趣的。它是数据包时间戳所在的内容，也是pkt_pts在输出帧上（因为它只是从相应的数据包复制而来）。
编解码器时基（如果设置的话）只是可能写入编解码器级标头中的帧速率的倒数。在没有容器计时信息的情况下（例如，当您正在阅读原始视频时），它可能很有用，但在其他情况下可以安全地忽略。
AVFrame.pkt_pts 是解码到该帧的数据包的时间戳。正如已经说过的，它只是数据包的直接副本，因此它位于流时基中。这是您要使用的字段（如果容器有时间戳）。
AVFrame.pts 在解码时从未设置为任何有用的内容，忽略它（它可能会替换pkt_pts将来，为了让整个混乱不再那么混乱，但现在是这样，主要是出于历史原因）。
格式上下文的持续时间是AV_TIME_BASE（即微秒）。它不能位于任何流时基中，因为您可以拥有三个无数的流，每个流都有自己的时基。
您在查找后获得不同时间戳时看到的问题很简单寻求不准确。在大多数情况下，您只能寻找最近的关键帧，因此通常会出现几秒钟的偏差。解码和丢弃不需要的帧必须手动完成。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

video

ffmpeg

libav

我使用 libav (ffmpeg) 使用时间戳/时基进行帧查找/读取有什么问题？的相关文章

通过 Websockets 进行 WebRTC 视频聊天

我正在尝试使用 webRTC 和 WebSockets 进行信号发送来开发视频聊天应用程序我的问题是我不知道创建 RTCPeerConnection 并通过 webSocket 连接两个对等点 2 个浏览器的过程是什么至少在本地我
如何使用 jQuery 将 html5 视频播放器静音

我找到了如何使用 jquery 暂停和播放视频 video get 0 play video get 0 pause 但我找不到静音按钮如果没有 jquery 解决方案我只需一个 onclick js 解决方案即可我需要尽快还有有办
HTML 5 视频自定义控件

与许多 Web 开发人员一样我期待着利用新的 HTML 5 进行流式传输视频
如何使用ffmpeg重叠和合并多个音频文件？

我正在尝试将多个音频文件合并到一个文件中但我可以使用以下命令来连接而不是连接 ffmpeg v debug i file1 wav i file2 wav i file3 wav filter complex 0 0 concat n
重新采样 H264 视频以降低帧速率，同时保持高图像质量

以下是感兴趣的视频的 mplayer 输出 br carina tmp mplayer foo mov mplayer Symbol ff codec bmp tags has different size in shared object
MP4 到 DASH（bash 脚本）

我有一个网站用户可以在其中上传视频文件我想使用 DASH 流式传输所有内容以获得自适应比特率流式传输因此我编写了一个 bash 脚本由 cron 运行将所有 mp4 文件转换为 DASH 但它无法正常工作出了什么问题例如使
如何获取优酷access_token

我在哪里可以找到access token refresh token在我的优酷账号里我找到了如何使用外部脚本通过 API 将视频上传到 youku com 但我需要access token refresh token使用它您需要对优酷应
如何从 Linux 命令行获取视频文件的分辨率（宽度和高度）？

我一直在挖掘 mplayer mencoder 和 ffmpeg 文档但我似乎无法想出anything 我对输出格式不是特别挑剔因为我可以使用正则表达式将其拉出来我只是似乎无法首先获取数据 Use ffprobe https ffmp
iOS 视频压缩 Swift iOS 8 损坏的视频文件

我正在尝试压缩用户相机从 UIImagePickerController 拍摄的视频不是现有视频而是动态视频以上传到我的服务器并花费少量时间来完成此操作因此较小的尺寸是理想的选择而不是 30 较新质量的相机为 45 mb 这是在
Android 从 C++ 端播放原始音频

我需要能够在 Android 系统的 C 端以自定义文件格式传输音频我正在致力于移植自定义媒体播放器并且需要能够打开自定义文件并从中传输音频这很重要因为我认为从性能角度来看将整个播放器移植到 JAVA 是不可行的并且通过 JNI
如何使用 ffmpeg 将两个视频/音频流混合为一个

我有两个视频 v1 flv 和 v2 flv 想要创建 v3 flv 其中包含来自 v1 flv 的视频流以及来自 v1 flv 和 v2 flv 的混合音频流使用 ffmpeg 命令可以实现类似的操作吗谢谢我认为使用 ffmpe
在 MacOS 终端上运行 ffmpeg [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我对 MacOS 相当陌生我发现使用终端来获取信息并不容易ffmpeg和我在 Window 上一样正常运行我有 ffmpeg 二进制文件ffmpe
如何仅在使用 ffmpeg 添加相同速度的分离音频流时更改视频速度？

我正在使用 ffmpeg 作为视频过滤器但是当我改变视频速度时我遇到了问题音频比视频长 ffmpeg i INPUT mp4 filter v setpts 0 5 PTS shortest y preset ultrafast O
不使用控件时，视频元素在 Chrome 中消失

So I think这是一个浏览器错误它出现在一个更复杂的设计网站中但我已经进行了很好的尝试简化了我的代码和设计等并发现了以下内容嵌入时
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
FFMPEG：使用具有复杂滤波器的视频滤波器

我正在使用fluent ffmpeg用于对视频文件执行批量操作的 Node js 库视频过滤器裁剪 16 9 输入添加填充并将字幕刻录到填充中在下一步中我想使用复杂的滤镜来覆盖图像作为水印 ff input video mp4 ff
如何将 MP3 音频文件读入 numpy 数组/将 numpy 数组保存到 MP3？

有没有办法从 MP3 音频文件中读取写入 MP3 音频文件numpy具有类似 API 的数组scipy io wavfile read https docs scipy org doc scipy 0 14 0 reference gen
Chromium 中的 MP4 编解码器支持

我们已将 Chromium 嵌入式框架集成到我们的 Windows 游戏中以允许我们从应用程序内渲染网页并且一切正常除了 MP4 视频据我所知由于许可问题 Chromium 不包含此编解码器但任何人都可以提供有关我们如何添加支持
某些网站如何在 iOS Safari 中内嵌播放视频？

非常令人难以置信因为我认为所有视频都可以在常规野生动物园中扩展为全屏播放例如检查一下 https entertainment theonion com the onion reviews rogue one 1819596116 htt
使用 Coldfusion 的 CFFILE 标签监控 FFMpeg 的进度日志

我想学习如何使用 ColdFusion 中的 CFFILE 标签来读取文本文件的内容就我而言该文本文件是 FFMpeg 在对媒体文件进行转码时生成的进度日志我想编写一个 ColdFusion 脚本该脚本将定期轮询进度日志直到日志表

随机推荐

Matlab只打开多页tiff堆栈的第一帧

我已经在 ImageJ 中使用宏创建了多页 tiff 文件现在我尝试使用 matlab 打开它但我只能访问第一帧这是 imfinfo filename 的结果因此我得到 length imfinfo filename 1 File
Java - 序列化 - EOFException 问题

抱歉今天发布了关于序列化的第二篇文章修复一个问题导致了另一个问题正如这里所说 Java 序列化 NotSerializedException 问题 https stackoverflow com questions 24824161 j
将 Oracle/关系表中的数据索引到弹性搜索中的更好方法是什么？

将大数据从 Oracle DB 索引到弹性搜索集群有哪些选项要求是将 3 亿条记录一次性索引到多个索引中并且每天进行大约 100 万次更改的增量更新我尝试过 Elasticsearch 的 JDBC 插件河流支线两者似乎都在内部运
在 Identityserver4 .NET Core 中启用多个 AzureAd

我正在尝试在一台身份服务器中启用多个 AzureAD 的登录功能这是必要的因为多个租户需要能够通过 1 个身份服务器登录到自己的 AzureAD 这些设置将动态发生对于此示例我对 AuthenticationBuilder 进行了扩
python中有没有相当于javascript三等号的运算符？

我尝试这样做但失败了 File
如何在 Sylius 主题上添加 CSS 文件？

我在 app theme AcmeTheme 下有一个自定义主题我有主题工作我可以在视图下定义自己的模板或覆盖其他捆绑包的模板问题是我不知道如何在我的主题中添加自定义 CSS 文件太胖了我试过 AcmeTheme public s
让脚手架按特定顺序生成字段

我正在尝试让 asp net core MVC 搭建 Razor 视图其中字段的顺序与明显默认的字母顺序不同我有一个简单的模型 public class Application EntityBase Display Name Naam
OpenGL Phong 光照：镜面高光错误

我的 OpenGL 中的 Phong 光照着色器似乎有一个奇怪的问题镜面高光出现在对象的错误一侧手头的问题正如您所看到的镜面高光出现在立方体的另一侧从灯光的角度来看也出现在立方体垂直边缘的角上它应该只出现在最靠近灯光的一侧立
如何创建目录的 zip 存档？

如何在 Python 中创建目录结构的 zip 存档最简单的方法是使用shutil make archive https docs python org 3 library shutil html shutil make archive
WebView和GridView进入ScrollView，View太大，无法放入绘图缓存

我有布局内存问题当我有一个大的网络视图时它不会显示任何内容并且 logcat 显示视图太大无法放入绘图缓存布局是
Google App 脚本：Javascript 运行时意外退出

我编写了一个应用程序脚本它将与 bigQuery API 交互并获取 bigQuery 结果 API 被击中近 60 70 次在此过程中有时我会收到以下错误消息 JavaScript 运行时意外退出有人可以帮我吗如果您需要任何其他
在现有笔记本服务器上打开 ipython 笔记本

我正在寻找一种在现有笔记本服务器上打开 ipynb 文件的方法我的主目录中有一个笔记本服务器启动如下 home myname ipython notebook 我有一个笔记本文件 home myname work dir test ip
React-router - 将 props 传递给处理程序组件

我的 React js 应用程序使用以下结构反应路由器 https github com ReactTraining react router var Dashboard require Dashboard var Comments req
UWP VisualStateManager PointerOver 不起作用

我正在模仿 Groove Music 的行为当鼠标悬停在专辑封面上时在我的代码中是整个 DataTemplate 它会显示投影效果但我的 VisualStateManager 似乎不起作用有任何想法吗我已经以编程方式实现了该功能
绑定ListPicker.SelectedIndex问题

我正在尝试对 Windows Phone 7 用户控件中的 ListPicker 的 SelectedIndex 属性进行两种方式绑定当我设置 DataContext 时它引发以下异常 SelectedIndex must always
从 ARM 模板中的 Azure 密钥保管库获取最新版本的证书

创建需要安装位于 Azure 密钥保管库内部的 SSL 证书的 ARM 模板如果我用指纹指定证书它工作正常 https contoso vault azure net secrets web01 test contoso com 968
激活虚拟环境时 pyenv 不再正确设置路径

我已经使用 pyenv 近两年了在 X11 模式下运行 RHEL 8 3 Linux 内核 4 18 和 Gnome 3 32 2 的系统上没有出现任何问题我主要使用 Fish shell 但偶尔也会使用 bash 到目前为止两者都可
HTML 锚标记是否应该尊重禁用属性？

如果我创建一个 HTML 锚标记并设置disabled属性为 true 我在不同的浏览器中得到不同的行为惊喜惊喜我创建了一个fiddle http jsfiddle net dhoerster QWhsj 展示在 IE9 中该链接
如何将日期时间设置为空

使用 C 我有一根绳子dateTimeEnd 如果字符串格式正确我希望生成一个DateTime并将其分配给 eventCustom DateTimeEnd 类型 public Nullable
我使用 libav (ffmpeg) 使用时间戳/时基进行帧查找/读取有什么问题？

所以我想抓取一个框架来自视频在特定时间 using libav用作缩略图我正在使用的是以下代码它编译并运行良好就检索图片而言但我很难将其实现检索正确的图片我根本无法理解 libav 在每个视频中明显使用多个时基背后的所有清晰逻辑

我使用 libav (ffmpeg) 使用时间戳/时基进行帧查找/读取有什么问题？

我使用 libav (ffmpeg) 使用时间戳/时基进行帧查找/读取有什么问题？ 的相关文章

随机推荐

热门标签

我使用 libav (ffmpeg) 使用时间戳/时基进行帧查找/读取有什么问题？的相关文章