英伟达Tesla T4 显卡编解码能力测试

2023-10-30

显卡基本参数:

Timestamp : Fri Aug 27 10:04:12 2021
Driver Version : 460.32.03 CUDA Version 11.2
Attached GPUs : 8

FB Memory
Total : 15109 MiB
BAR1 Memory Usage
Total : 256 MiB

Architecture:        x86_64
CPU op-mode(s):      32-bit, 64-bit
Byte Order:          Little Endian
CPU(s):              64
On-line CPU(s) list: 0-63
Thread(s) per core:  2
Core(s) per socket:  16
Socket(s):           2
NUMA node(s):        2
Vendor ID:           GenuineIntel
CPU family:          6
Model:               85
Model name:          Intel(R) Xeon(R) Gold 5218 CPU @ 2.30GHz
Stepping:            7
CPU MHz:             1000.014
BogoMIPS:            4600.00
Virtualization:      VT-x
L1d cache:           32K
L1i cache:           32K
L2 cache:            1024K
L3 cache:            22528K
NUMA node0 CPU(s):   0-15,32-47
NUMA node1 CPU(s):   16-31,48-63

输入: IPC摄像头 Rtsp
分辨率:2560*1440
码流:0.8M/bs
编码:h264

输出:Rtsp
分辨率:1920*1080
码流:0.4M/bs
编码:h264

操作流程:
拉流->解码->YUV2RGB->RGB2YUV->编码
因为解码后颜色空间是YUV如果想进行下一步图像处理,必须将颜色空间转换为BRG方可进行主流图片业务处理。

首先我们放入200路视频进行测试:
用dstat命令后可以看到,输入在150Mb。
在这里插入图片描述
接着查看帧率:
发现帧率非常低,只有11帧上下
在这里插入图片描述
继续看GPU情况:
GPU利用率只有一半过一点。
在这里插入图片描述
打开一路编解码会话就会占用一定GPU内存,所以编解码的另外一个限制是GPU显存的大小,英伟达官网有一篇论文阐述了这个问题
https://developer.nvidia.com/blog/optimizing-video-memory-usage-with-the-nvdecode-api-and-nvidia-video-codec-sdk/
论文名字:Optimizing Video Memory Usage with the NVDECODE API and NVIDIA Video Codec SDK
在这里插入图片描述
上面就是关于显存对于编解码的占用大小表格。

查看CPU情况:

在这里插入图片描述
GPU解码能力:
在这里插入图片描述
发现解码能力没有完全发挥出来,那么真正的瓶颈在哪里呢,接着往下看,瓶颈在颜色空间转换这里。所以如果你的代码中有颜色空间转换,那么毫无疑问,这里就是性能的瓶颈。

重点敲黑板:
颜色空间转换是性能的瓶颈。

总结:
其实从接受码流来看,8张显卡所能处理的最大码流为150Mb/s,每张卡所能处理的流量为150/8=18.75Mb/s,按照每路0.8Mb/s,那么就是23.5路,也就是23路,保守一点一张显卡能处理20路编解码+颜色空间转换。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

英伟达Tesla T4 显卡编解码能力测试 的相关文章

  • 调用mysql数据_调用数据库的五种方式

    ThinkPHP 内置了抽象数据库访问层 把不同的数据库操作封装起来 我们只需要使用 公共的 Db 类进行操作 无须针对不同的数据库写不同的代码和底层实现 Db 类会自动调用 相应的数据库驱动来处理 一 全局配置定义 在common con
  • 明明导入Jar包却抛出ClassNotFoundException

    项目中添加过Jar包 显示ClassNotFoundException 因为在Tomcat中找不到mysql jar包 手动添加Jar包到tomcat bin下 出现错误的原因是 delete调用了executeQuery 方法
  • 私有代码存放仓库 BitBucket介绍及入门操作

    本文主要来自于萧 瑟BLOG 和牛仔的移动开发博客 并综合了多篇网上文章 代码版本控制系统在局域网内Subvision用的比较多 但其局限性太多 在代码审查 异地合作等功能方面比较弱 目前比较出名的分布式版本控制系统有Bitbucket和G

随机推荐

  • 求多边形面积公式(已知顶点坐标)

    下面介绍一种求多边形面积的方法 首先已知各定点的坐标分别为 x1 y1 x2 y2 x3 y3 Xn Yn 则该多边形的面积公式为 s 1 2 x1 y2 x2 y1 x2 y3 x3 y2 Xk Yk 1 Xk 1 Yk Xn y1 x1
  • JavaScript检查null与undefined以及==和===之间的差异

    如何检查变量是否为null或undefined并且null和undefined什么区别 和 什么区别 很难在Google上搜索 1楼 区别是微妙的 在JavaScript中 undefined变量是从未声明或从未分配值的变量 假设您声明va
  • 生信必会格式:Fasta & Fastq 简介及转换

    文章目录 前言 FASTA 例子 血红蛋白 的核酸和蛋白质序列 FASTQ FASTA FASTQ 对比 FASTQ 转为 FASTA 使用基本的命令 sed paste awk 使用现有工具 Bioawk Seqtk FASTA 到 FA
  • sql注入详细解释

    sql注入以及应对措施 sql注入是什么 sql注入的危害 sql注入的几种方式 数字型注入 字符串注入 关于mybatis中传递变量用 的原因 sql注入是什么 sql是我们操作数据库与其交互的语言 而sql注入是用户将Web页面的原UR
  • waymo数据集下载

    下载waymo数据集下载报错 gsutil不能使用怎么办 安装谷歌云 gcloud init gcloud auth login gcloud auth application default login gsutil config 然后就
  • Linux内核调度框架和CFS调度算法

    进程调度 暂时以2 6 24内核版本讲解 该版本是CFS调度器注入Linux内核之后的第二个版本 在框架和数据结构上与4 x之后没有本质上的区别 但是由于4 x对CFS调度做了很大的优化 代码量暴增10倍之多 故不容易把握算法与框架的本质
  • 【两阶段鲁棒优化问题】用列和约束生成方法求解两阶段鲁棒优化问题(Matlab代码实现)

    个人主页 研学社的博客 欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 文献来源 4 Matlab代码及文章 1 概述 文献来源 鲁棒优
  • vue后台水印实现

  • RGB与YCbCr

    1 RGB RGB色彩模式是工业界的一种颜色标准 是通过对红 R 绿 G 蓝 B 三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的 RGB即是代表红 绿 蓝三个通道的颜色 这个标准几乎包括了人类视力所能感知的所有颜色 是目前运
  • 成功解决Array Index Out Of Bounds Exception问题

    成功解决Array Index Out Of Bounds Exception问题 目录 解决问题 解决方法 解决问题 Array Index Out Of Bounds Exception 解决方法 数组索引越界异常 即数组下标号超出数组
  • Spring Cache --- @Cacheable/@CachePut/@CacheEvict注解的原理深度剖析和使用

    这里只是部分 需要深入了解可以看原著 原文链接 https blog csdn net f641385712 article details 94570960 关于Spring的缓存注解 一共有如下5个 1 Cacheable 缓存 sin
  • 实战:10 种实现延迟任务的方法,附代码!

    捡田螺的小男孩 2022 08 04 07 45 发表于广东 以下文章来源于Java中文社群 作者磊哥 Java中文社群 Java实用文章聚集地 程序员田螺 专注分享后端面试题 包括计算机网络 MySql数据库 Redis缓存 操作系统 J
  • 新Kubeflow,新征程 (一):简化部署体验

    综述 2017年底 奥斯汀的Kubecon上 Google项目的产品经理 David Aronchick 和首席工程师 Jeremy Lewi将Kubeflow这个项目带到了大家的视野里 经过一年的发展 在2018年的西雅图的Kubecon
  • Python中selenium实现文件上传所有方法整理总结

    pyAutoGUI官方文档 https pyautogui readthedocs io en latest 文件上传是所有UI自动化测试都要面对的一个头疼问题 今天博主在这里给大家分享下自己处理文件上传的经验 希望能够帮助到广大被文件上传
  • ​stp文件转ply

    什么是一 stp 文件 STP 文件是用于在 CAD 和 CAM 应用程序之间交换产品数据的 3D CAD 文件 它包含有关 3D 对象的信息 并以类似于STEP文件格式的方式保存 STP 文件根据STEP应用程序协议 ISO 10303
  • Qt设置label的文字自动换行、高度随内容调整、上下可滚动

    Qt初学者 想要用label控件实现一个用于显示文字信息的文本框 要求文字自动换行 label高度随内容调整 上下可滚动 为了实现滚动 使用ScrollArea控件 将要显示文字的label放到这个ScrollArea里 然后设置Scrol
  • 控制台报错:failed to load resource: net:err_cert_date_invalid的解决办法

    原因 浏览器端屏蔽了不安全的连接 解决办法 1 打开检查页面里 Network 网络 2 双击name 名称 下红色报错的地方 会出现以下界面 3 点击高级 下面会出现提示 点击继续前往 不安全 4 回到之前的页面刷新 问题就解决了
  • Exception of type 'System.OutOfMemoryException' was thrown.

    OutOfMemoryException Exception of type System OutOfMemoryException was thrown 在装有4G物理内存的32位OS机器上内存不足 原因是 The common lang
  • array type has an incomplete element type

    一 错误详情 array type has an incomplete element type 二 错误分析 1 错误代码 int readInfo int B int n int findMax int B int n int m 2
  • 英伟达Tesla T4 显卡编解码能力测试

    显卡基本参数 Timestamp Fri Aug 27 10 04 12 2021 Driver Version 460 32 03 CUDA Version 11 2 Attached GPUs 8 FB Memory Total 151