TensorRT(11):python版本序列化保存与加载模型

2023-11-19

TensorRT系列传送门(不定期更新): 深度框架|TensorRT

文章目录

一、序列化保存模型
二、反序列化加载模型
三、完整代码

楼主曾经在TensorRT(7)：python版本使用入门一文中简要记录了python版本是序列化与反序列化加载模型的步骤，但因为环境以及TRT版本不同，API也有相当大的变化，这里重新记录下，在windows下，tensorrt8.2.3.0版本下，调用python的API是如何加载模型的。

实验案例：采用 yolov5的onnx模型，进行FP16量化保存模型。
代码案例均来自 TensorRT提供的sample中。
详细可见TensorRT-8.2.3.0\samples\python
在这里插入图片描述

一、序列化保存模型

与C++端序列化保存模型的步骤类似

1、首先定义个log 文件，然后创建一个runtime

TRT_LOGGER = trt.Logger(trt.Logger.WARNING)
runtime = trt.Runtime(TRT_LOGGER)

2、建立builder，设置maxBatchSize参数

builder = trt.Builder(TRT_LOGGER)  # 创建一个builder
builder.max_batch_size = 1

3、配置config，如设置fp16等

config = builder.create_builder_config()  # 创建一个congig
config.max_workspace_size = 1 << 20
config.set_flag(trt.BuilderFlag.FP16)

4、解析onnx文件，并通过config序列化生成一个network

network = builder.create_network(EXPLICIT_BATCH)  # 创建一个network
parser = trt.OnnxParser(network, TRT_LOGGER)

model = open(onnx_file_path, 'rb')
if not parser.parse(model.read()):
    for error in range(parser.num_errors):
        print(parser.get_error(error))

network.get_input(0).shape = [1, 3, 640, 640]
print('Completed parsing of ONNX file')
print('Building an engine from file {}; this may take a while...'.format(onnx_file_path))
plan = builder.build_serialized_network(network, config)
with open(engine_file_path, "wb") as f:
      f.write(plan)
      print("Completed write Engine")

二、反序列化加载模型

在一中序列化建立好network后，可以调用deserialize_cuda_engine反序列化生成一个 engine

engine = runtime.deserialize_cuda_engine(plan)
print("Completed creating Engine")

如果加载保存在本地的trt模型，可以直接加载engine

 if os.path.exists(engine_file_path):
      # If a serialized engine exists, use it instead of building an engine.
      print("Reading engine from file {}".format(engine_file_path))
      with open(engine_file_path, "rb") as f, trt.Runtime(TRT_LOGGER) as runtime:
          return runtime.deserialize_cuda_engine(f.read())

三、完整代码

完整代码都可在github上的官网samples查询。
onnx_to_tensorrt.py


def get_engine(onnx_file_path, engine_file_path=""):
    """Attempts to load a serialized engine if available, otherwise builds a new TensorRT engine and saves it."""
    def build_engine():
        """Takes an ONNX file and creates a TensorRT engine to run inference with"""
        with trt.Builder(TRT_LOGGER) as builder, builder.create_network(common.EXPLICIT_BATCH) as network, builder.create_builder_config() as config, trt.OnnxParser(network, TRT_LOGGER) as parser, trt.Runtime(TRT_LOGGER) as runtime:
            config.max_workspace_size = 1 << 28 # 256MiB
            builder.max_batch_size = 1
            # Parse model file
            if not os.path.exists(onnx_file_path):
                print('ONNX file {} not found, please run yolov3_to_onnx.py first to generate it.'.format(onnx_file_path))
                exit(0)
            print('Loading ONNX file from path {}...'.format(onnx_file_path))
            with open(onnx_file_path, 'rb') as model:
                print('Beginning ONNX file parsing')
                if not parser.parse(model.read()):
                    print ('ERROR: Failed to parse the ONNX file.')
                    for error in range(parser.num_errors):
                        print (parser.get_error(error))
                    return None
            # The actual yolov3.onnx is generated with batch size 64. Reshape input to batch size 1
            network.get_input(0).shape = [1, 3, 608, 608]
            print('Completed parsing of ONNX file')
            print('Building an engine from file {}; this may take a while...'.format(onnx_file_path))
            plan = builder.build_serialized_network(network, config)
            engine = runtime.deserialize_cuda_engine(plan)
            print("Completed creating Engine")
            with open(engine_file_path, "wb") as f:
                f.write(plan)
            return engine

    if os.path.exists(engine_file_path):
        # If a serialized engine exists, use it instead of building an engine.
        print("Reading engine from file {}".format(engine_file_path))
        with open(engine_file_path, "rb") as f, trt.Runtime(TRT_LOGGER) as runtime:
            return runtime.deserialize_cuda_engine(f.read())
    else:
        return build_engine()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

TensorRT(11):python版本序列化保存与加载模型的相关文章

将 Django Model 对象转换为 dict，所有字段都完好无损

如何将 django Model 对象转换为 dictall它的领域理想情况下所有内容都包含外键和 editable False 的字段让我详细说明一下假设我有一个如下所示的 django 模型 from django db imp
在 Python 中静默打印 PDF

我正在尝试使用 Python 打印 PDF 而不打开 PDF 查看器应用程序 Adobe Foxit 等我还需要知道打印何时完成以删除文件 Here http permalink gmane org gmane comp python
根据日期列过滤并创建列

我有一个样本数据如下 date Deadline 2018 08 01 2018 08 11 2018 09 18 2018 12 08 2018 12 18 我想用代码中描述的条件填写截止日期列如 1 DL 2 DL 3 DL 等基于
使用 python 将 bibtex 文件转换为 html （也许是 pybtex？）

您好我想解析 bibtex 出版物文件并对特定字段例如年份进行排序并过滤某些内容然后将其放在网站上我遇到了 pybtex 它可以读取和解析 bibtex 文件但它基本上没有记录我不知道如何对条目进行排序 pybtex 是可行的
Flask-admin 内联建模传递表单参数会抛出 AttributeError

Flask 开发者们大家好在 Flask admin 中我目前尝试在模型视图中实现内联模型编辑在模型方面我有一个简单的树结构表示一组内容页面每个节点都有多个子节点以及与其关联的多个内容数据模型模型被命名为ContentNode
pandas dataframe 对列进行排序会引发索引上的 keyerror

我有以下数据框 df peaklatency snr 0 52 99 0 0 1 54 15 62 000000 2 54 12 82 000000 3 54 64 52 000000 4 54 57 42 000000 5 54 13 7
Dataframe unstack 性能 - pandas

我正在尝试拆开数据框它工作正常但问题是我正在处理 CSV 文件中的巨大数据集约 10 亿这是示例数据集 236539 48512569874 Name Danny 236539 48512569874 Class 12 236539
pyqt4窗口调整大小事件

我正在使用 python3 和 pyqt4 我希望每次运行时都会运行一些代码QMainWindow已调整大小我想要这样的东西 self window resized connect self resize but resized不是内置函
使用字典时如何避免 KeyError？

现在我正在尝试编写汇编程序但我不断收到此错误 Traceback most recent call last File Users Douglas Documents NeWS py line 44 in if item in regis
python中的unicode错误[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 在下面的代码中我收到错误mailSe
使用 matplotlib 在 python3 中对多个形状进行动画处理

尝试在 python3 中使用 matplotlib 动画函数同时对多个对象进行动画处理下面写的代码是我到目前为止的位置我能够创建多个对象并将它们显示在图中我通过使用包含矩形补丁函数的 for 循环来完成此操作从这里开始我希望通过
在视图之间共享并在 AppConfig 中初始化的变量

我想要一个在应用程序启动时初始化的变量并且可以从视图访问该变量 my app my config py class WebConfig AppConfig name verbose name def ready self print lo
为什么Python安装程序不断弹出？

每当我尝试运行 Python 文件时都会自动弹出此窗口虽然我可以关闭它但有时它会连续打开 7 10 个窗口这令人恼火谁能告诉我为什么会发生这种情况 None
在 Jupyter 笔记本中使用 PySpark 读取 XML

我正在尝试读取 XML 文件 df spark read format com databricks spark xml load path to my xml 并收到以下错误 java lang ClassNotFoundExceptio
Chrome 已关闭，并出现错误 ERROR:network_change_notifier_win.cc(141)] WSALookupServiceBegin 失败，原因为：0

我的笔记本电脑操作系统是 windows 10 我使用 selenium webdriver 和 Python 当我通过脚本打开chrome浏览器时加载网页后chrome就关闭了下面是我的python代码和错误 from seleniu
Django ImageField 默认值

模型 py class UserProfile models Model photo models ImageField upload to get upload file name storage OverwriteStorage def
如何使用Python3.4在tornado中进行异步mysql操作？

我现在使用Python3 4 我想在Tornado中使用异步mysql客户端我已经发现torndb https github com bdarnell torndb但在阅读其源代码后我认为它无法进行异步mysql操作因为它只是封装了M
pandas - 组合行的字符串

我有一个像这样的数据框 id text 1 DM HTN Enlarged prostate 2 hypertensive and on regular treatment 2 LBP 3 DM HTN Enlarged prostate
Python google云函数部署失败-Madmom pip包

我正在尝试使用 madmom python pip 包部署 Python3 7 Google Cloud Function 但是指定madmom 0 16 1requirements txt 中的内容导致部署失败当我从requiremen
加载腌制字典对象或加载 JSON 文件哪个更快？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案什么更快 A Unpickling 加载一个 pickled 字典对象使用pickle load or B 使用以下命令将 JSON

随机推荐

JAVA发展历程

Java是一门面向对象的编程语言不仅吸收了C 语言的各种优点还摒弃了C 里难以理解的多继承指针等概念因此Java语言具有功能强大和简单易用两个特征 Java语言作为静态面向对象编程语言的代表极好地实现了面向对象理论允许程序员以优
c语言之数据结构学习心得

写在前面你们好我是小庄很高兴能和你们一起学习c语言如果您对编程感兴趣的话可关注我的动态写博文是一种习惯在这过程中能够梳理知识和巩固知识点一绪论 1 什么是数据数据元素数据项数据对象数据结构 1 数据客观事物的符号表
在eclipse里建立包中包

工具原料工具软件 j2EE eclipse 语言 Java 方法步骤 1 在src文件夹右击 new package 见下图 2 点击finish 3 在com包右击new package 4
工控上位机程序为什么只能用C语言？

工控上位机程序并不只能用C 开发实际上在工业自动化领域中常见的上位机开发语言包括但不限于以下几种 C C 是一种常用的编程语言在工控领域中被广泛使用它具有良好的面向对象特性和丰富的类库支持可以实现高性能的上位机程序开发 C C C
Allegro使用经验笔记

一安装 SPB15 2 CD1 3 安装1 2 第3为库不安装 License安装设置环境变量Lm license file D Cadencelicense Dat 修改License中SERVER Yyh ANY 5280为SER
Typora快捷键大全

1 字体编辑 1 1 大小大小 ctr 数字或 ctr 加减号或 1 2 加粗加粗 ctr b 1 3 倾斜倾斜 ctr i 1 4 下划线下划线 ctr u 1 5 删除线删除线 alt shift 5 1 6 上标上标
YOLOv8改进开源

大致介绍一下AI全栈技术社区的相关内容主要涵盖了YOLO全系列模型的改进量化蒸馏剪枝以及不同工具链的使用同时也涵盖多目标跟踪语义分割 3D目标检测 AI模型部署等内容具体内容小伙伴们可以参考下面的目录部分所有内容均有答疑服务
学习-Python字符串之格式化

第1关学习 Python字符串之格式化任务描述本关任务给定一个列表计算列表内所有数据标准差结果保留小数点后 2 位相关知识为了完成本关任务你需要掌握的使用 format 的使用 Template 的使用在之前的实训中
数据分析01——Anaconda安装/Anaconda中的pip换源/jupyter配置

0 前言数据分析三大模块知识 numpy 数组计算 pandas 基于numpy开发用于数据清洗和数据分析 matplotlib 实现数据可视化 1 Anaconda安装安装Anaconda 注意安装路径不一定是c盘但是安装目录不要
Python Excel操作模块XlsxWriter之写入worksheet.write()

worksheet write wirte row col args 向工作表单元格写入普通的数据参数 row 单元格所在的行索引从0开始计数 col 单元格所在的列索引从0开始计数 args 传递到子方法的附加参数诸如数字字符串
端口介绍

文章来源 https m toutiaocdn com group 6680437870504706572 app news article timestamp 1563010542 req id 201907131735410100230
Linux lvm管理讲解及命令

作者小刘在C站个人主页小刘主页每天分享云计算网络运维课堂笔记努力不一定有回报但一定会有收获加油一起努力共赴美好人生夕阳下是最美的绽放树高千尺落叶归根人生不易人间真情前言目录一 lvm管理 1 Logical
mysql sql优化方法_一个MySql Sql 优化技巧分享

有天发现一个带inner join的sql 执行速度虽然不是很慢 0 1 0 2 但是没有达到理想速度两个表关联且关联的字段都是主键查询的字段是唯一索引 sql如下 SELECTp item token p item product
如何在小程序实现人脸识别的方法

1 获取用户授权在小程序中实现人脸识别需要先获取用户的授权用户需要允许小程序访问他们的摄像头和图像数据这样才能进行人脸识别 2 采集图像数据在获得用户授权后小程序可以通过摄像头或者相册功能采集用户的面部图像数据 3 使用图像处理
Java-private构造方法

private 构造函数一般用于Singleton模式指的是整个应用只有本类的一个对象一般这种类都有一个类似getInstance 的方法 class A public String name 构造函数限定为private 不可以直接创
标准差（Standard Deviation）, 标准误差（Standard error），变异系数 (Coefficient of Variance )的区别与联系

标准差 Standard Deviation 中文环境中又常称均方差是离均差平方的算术平均数的平方根用表示标准差是方差的算术平方根标准差能反映一个数据集的离散程度平均数相同的两组数据标准差未必相同标准误差 Standard
学习Flask之Flask-Login 用户会话管理

Flask Login 用户控制用户会话管理简单点说就是控制登录如果是自己写的登录系统一般都是通过操作session 然后后台根据session 来判断权限 Flask Login 就是负责这部分直接开始安装 pip insta
System.Data.OracleClient 需要 Oracle 客户端软件 version 8.1.7 或更高版本

同学的电脑连接实验室的服务器时出现 System Data OracleClient 需要 Oracle 客户端软件 version 8 1 7 或更高版本而我自己的电脑可以轻松连接服务器的数据库首先实验室用的是Oracle 12c
力扣 942. 增减字符串匹配双指针解法C++

给定只含 I 增大或 D 减小的字符串 S 令 N S length 返回 0 1 N 的任意排列 A 使得对于所有 i 0 N 1 都有如果 S i I 那么 A i lt A i 1 如果 S i D 那么 A i gt A i
TensorRT(11):python版本序列化保存与加载模型

TensorRT系列传送门不定期更新深度框架 TensorRT 文章目录一序列化保存模型二反序列化加载模型三完整代码楼主曾经在TensorRT 7 python版本使用入门一文中简要记录了python版本是序列化与反序列化