tensorRT部署之代码实现 onnx转engine/trt模型

2023-11-20

tensorRT部署之代码实现 onnx转engine/trt模型

前提已经装好显卡驱动、cuda、cudnn、以及tensorRT
下面将给出Python、C++两种转换方式

1. C++实现

项目属性配置好CUDA、tensoeRT库
通常在实际应用中会直接读取onnx模型进行判断，如果对应路径已经存在engine模型，将直接通过tensorrt读入engine,如果没有，则对onnx进行编译生成engine模型后在进行读入
TensorRT在线加载模型，并序列化保存支持动态batch的引擎，实现源码可参考 TextandCode
一篇超级详细的onnx基础教程（非常好）：TextandCode
代码实现：

#include <iostream>
#include <fstream>
#include "NvInfer.h"
#include "NvOnnxParser.h"
 
// 实例化记录器界面。捕获所有警告消息，但忽略信息性消息
class Logger : public nvinfer1::ILogger
{
    void log(Severity severity, const char* msg) noexcept override
    {
        // suppress info-level messages
        if (severity <= Severity::kWARNING)
            std::cout << msg << std::endl;
    }
} logger;
 
 
void ONNX2TensorRT(const char* ONNX_file, std::string save_ngine)
{
    // 1.创建构建器的实例
    nvinfer1::IBuilder* builder = nvinfer1::createInferBuilder(logger);
 
    // 2.创建网络定义
    uint32_t flag = 1U << static_cast<uint32_t>(nvinfer1::NetworkDefinitionCreationFlag::kEXPLICIT_BATCH);
    nvinfer1::INetworkDefinition* network = builder->createNetworkV2(flag);
 
    // 3.创建一个 ONNX 解析器来填充网络
    nvonnxparser::IParser* parser = nvonnxparser::createParser(*network, logger);
 
    // 4.读取模型文件并处理任何错误
    parser->parseFromFile(ONNX_file, static_cast<int32_t>(nvinfer1::ILogger::Severity::kWARNING));
    for (int32_t i = 0; i < parser->getNbErrors(); ++i)
    {
        std::cout << parser->getError(i)->desc() << std::endl;
    }
 
    // 5.创建一个构建配置，指定 TensorRT 应该如何优化模型
    nvinfer1::IBuilderConfig* config = builder->createBuilderConfig();
 
    // 6.设置属性来控制 TensorRT 如何优化网络
    // 设置内存池的空间
    config->setMemoryPoolLimit(nvinfer1::MemoryPoolType::kWORKSPACE, 16 * (1 << 20));
    // 设置低精度   注释掉为FP32
    if (builder->platformHasFastFp16())
    {
        config->setFlag(nvinfer1::BuilderFlag::kFP16);
    }
 
    // 7.指定配置后，构建引擎
    nvinfer1::IHostMemory* serializedModel = builder->buildSerializedNetwork(*network, *config);
 
    // 8.保存TensorRT模型
    std::ofstream p(save_ngine, std::ios::binary);
    p.write(reinterpret_cast<const char*>(serializedModel->data()), serializedModel->size());
 
    // 9.序列化引擎包含权重的必要副本，因此不再需要解析器、网络定义、构建器配置和构建器，可以安全地删除
    delete parser;
    delete network;
    delete config;
    delete builder;
 
    // 10.将引擎保存到磁盘，并且可以删除它被序列化到的缓冲区
    delete serializedModel;
}
 
 
void exportONNX(const char* ONNX_file, std::string save_ngine)
{
    std::ifstream file(ONNX_file, std::ios::binary);
    if (!file.good())
    {
        std::cout << "Load ONNX file failed! No file found from:" << ONNX_file << std::endl;
        return ;
    }
 
    std::cout << "Load ONNX file from: " << ONNX_file << std::endl;
    std::cout << "Starting export ..." << std::endl;
 
    ONNX2TensorRT(ONNX_file, save_ngine);
 
    std::cout << "Export success, saved as: " << save_ngine << std::endl;
 
}
 
 
int main(int argc, char** argv)
{
    // 输入信息
    const char* ONNX_file  = "../weights/test.onnx";
    std::string save_ngine = "../weights/test.engine";
 
    exportONNX(ONNX_file, save_ngine);
 
    return 0;
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

模型部署

c

python

人工智能

目标检测

tensorRT部署之代码实现 onnx转engine/trt模型的相关文章

别碰我的女人

我讨厌的一件事迪斯图尔斯 http docs python org distutils 我猜他是邪恶的人他这样做了 https github com python cpython blob 300dd552b15825abfe0e367a
如何在python中递归复制目录并覆盖全部？

我正在尝试复制 home myUser dir1 及其所有内容及其内容等 home myuser dir2 在Python中此外我希望副本覆盖中的所有内容dir2 It looks like distutils dir util co
在 Python 中，如何获取特定文件中定义的类列表？

如果一个文件myfile py包含 class A object Some implementation class B object Some implementation 我如何定义一个方法以便在给定的情况下myfile py 它返回
与函数复合 UniqueConstraint

一个快速的 SQLAlchemy 问题我有一个文档类其属性为数字和日期我需要确保没有重复的号码同年是有没有办法对数字年份日期进行UniqueConstraint 我应该使用唯一索引吗我如何声明功能部分 SQLA
如何使用 Selenium Webdriver .NET 绑定设置 Chrome 首选项？

这是我正在使用的用户代理可以成功设置而下载首选项则不能 Windows 7 Chrome 26 Selenium dotnet 2 31 2 chromedriver win 26 0 1383 0 ChromeOptions chro
我如何模拟 UserManager 和 RoleManager 进行单元测试

我模拟了抽象类来测试类的具体方法如下所示 var mock new Mock
PermanentTaskFailure：“模块”对象没有属性“迁移”

我在 google appengine 上使用 Nick Johnson 的批量更新库 http blog notdot net 2010 03 Announcing a robust datastore bulk update utili
哪个更快？按引用传递与按值传递 C++

我认为按引用传递应该比按值传递更快因为计算机不复制数据它只是指向数据的地址但是请考虑以下 C 代码 include
为什么 std::atomic 比 volatile bool 慢很多？

多年来我一直使用 volatile bool 来控制线程执行并且效果很好 in my class declaration volatile bool stop In the thread function while stop do th
Pandas DataFrame：如何计算组中第一行和最后一行的差异？

这是我的熊猫数据框 import pandas as pd import numpy as np data column1 338 519 871 1731 2693 2963 3379 3789 3910 4109 4307 4800 4
Python列表对象属性“append”是只读的

正如标题所说在Python中我试图做到这一点以便当有人输入一个选择在本例中为Choice13 时它会从密码列表中删除旧密码并添加新密码 passwords mrjoebblock mrjoefblock mrjoegblock m
从 cin 读取整数序列并将它们存储在向量中

这就是我读取整数的方法std cin并将它们存储在向量中 int number vector
如何在RcppParallel中调用用户定义的函数？

受到文章的启发http gallery rcpp org articles parallel distance matrix http gallery rcpp org articles parallel distance matrix 我
字母尺度和随机文本上的马尔可夫链

我想使用 txt 文件中的一本书中的字母频率生成随机文本以便每个新字符 string lowercase 取决于前一个如何使用马尔可夫链来做到这一点或者使用每个字母都有条件频率的 27 个数组更简单我想使用来自的字母频率生成随机文本
来自用户定义文字的整数字符序列，以字符串作为参数

目前只有双精度数可以在用户定义的文字中生成字符模板 template
如何使用 MongoDB 实现 ASP.NET Core 3.1 Identity？

是一个 API 用于简化后端和逻辑代码来管理用户密码个人资料数据角色声明令牌电子邮件确认等对于 Visual Studio 来说支撑脚手架 https learn microsoft com en us aspnet cor
获取运行云功能的运行时服务帐户

有没有办法以编程方式从云功能获取运行时服务帐户的电子邮件我知道我可以猜测默认的 App Engine 帐户因为它始终是 appspot gserviceaccount com 但这不是我想要的我本来期待有一些环境变量 https
使用 List.Contains 方法为 LINQ 构建表达式树

Problem 我正在重构一些LINQ查询我们的 Web 应用程序中的多个报告并且我尝试将一些重复的查询谓词移至它们自己的中IQueryable扩展方法以便我们可以将它们重新用于这些报告以及将来的报告正如您可能推断的那样我已经重构了
Python 中的迭代器 (iter()) 函数。 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案对于字典我可以使用iter 用于迭代字典的键 y x 10 y 20 for val in iter y print val 当
从 git 签出后 nuget dll 丢失

I have a C solution containing different projects On those projects I have some normal nuget packages like Newtonsoft Js

随机推荐

逍遥子突然辞去阿里一切职务！之前不再担任董事长，现在阿里云CEO也卸了

金磊发自凹非寺量子位公众号 QbitAI 阿里巴巴史上最大架构重组仅半年后再次迎来重大变革原集团CEO张勇花名逍遥子正式卸任同时辞去阿里云董事长和CEO职务这一次阿里巴巴掌门的接力棒交到了蔡崇信和吴泳铭花名东邪手
dalle2：hierarchical text-conditional image generation with clip

DALL E 2 论文精读哔哩哔哩 bilibili更多论文 https github com mli paper reading 视频播放量 30350 弹幕量 256 点赞数 1767 投硬币枚数 1318 收藏人数 751 转发人数
Linux之编辑器强大的vim使用手册

目录 vim三种模式 vim常用操作环境参数配置命令合集方向命令插入命令定位命令删除命令复制和剪切命令替换和取消命令搜索和搜索替换命令保存和退出命令其他命令使用技巧把一个文件的内容导入当前文件中光标所在位置定义快
swarm与kubernetes的对比

前言 docker swarm 与kubernetes都是集群管理工具一个是docker原生自带一个是谷歌项目下的容器编排工具那么到底他们到底有什么有缺点呢 kubernetes kubernetes 是Google多年大规模容器管理
Windows10如何添加开机启动项

在日常生活中偶尔要求其中的软件在开机时便能自动启动比如MySQL一般被设置为自启动项今天将为大家介绍window10中如何添加开机启动项操作过程 1 按下win R调出运行窗口并输入 shell startup 即可进入开机启动文
KPCA数据降维

文章目录效果一览文章概述部分源码参考资料效果一览文章概述 KPCA数据降维 Matlab核主成分分析数据降维可直接运行适合作为创新点部分源码清空环境变量 warning off 关闭报警信息 close all 关闭开
Java【多线程】笔记总结

多线程概念方法间调用普通方法调用从哪里来就到那里去闭合的一条路径多线程调用开辟了多条路径在操作系统中运行的程序就是进程如看视频线程就是独立的执行路径在程序运行时即使没有自己创建线程后台也会存在多个线程如gc 线程
git本地仓库与远程仓库同步

在学习和工作中我们经常遇到这样的场景我们已经在本地创建了一个git仓库并添加了文件和修改记录后面你又想在github或者gitlab上新建一个空白git仓库并且让这2个仓库进行远程同步并且保存之前本地仓库的修改记录这样一来git
Java 之认识String类

目录一 String类的重要性二常用方法 1 字符串构造 2 String对象的比较 3 字符串查找 4 转化 5 字符串替换 6 字符串拆分 7 字符串截取 8 其他操作方法 9 字符串的不可变性 10 字符串修改三 String
《动手学深度学习 Pytorch版》 2.7 查阅文档

2 7 1 查找模块中的所有函数和类 import torch 可以调用 dir 函数查询函数中有哪些模块和类以双下划线开始和结束的函数是 Python 中的特殊对象以单下划线开始的函数是内部函数通常以上两种函数可以忽略 di
如何下载英伟达NVIDIA旧版本驱动，旧版本驱动官方网址

https www nvidia cn Download Find aspx lang cn 也可以直接搜索英伟达官网点击驱动程序然后点击试用版驱动程序里面不但有试用版的驱动还有之前发布的所有驱动
2023年信息素养大赛智能算法挑战复赛初中组

智能算法挑战复赛初中组总共 4 道题 1 修复机器人的对话词库错误题目描述基于人工智能技
深度学习模型参数量/计算量（附计算代码）

参考 https mp weixin qq com s biz MzI4MDYzNzg4Mw mid 2247546551 idx 2 sn f198b6365e11f0a18832ff1203302632 chksm ebb70e63dc
unity 性能查看工具Profiler

文章目录前言 profiler工具介绍菜单栏帧视图模块视图模块详细信息通过profiler分析优化游戏性能最后前言每次进行游戏优化的时候都用这个工具查看内存泄漏啊代码优化啊之类的东西真的好用但是之前也就是自己摸索一下
【FPGA多周期时序约束详解】- 解读FPGA多周期时序约束的全过程

FPGA多周期时序约束详解解读FPGA多周期时序约束的全过程 FPGA作为数字电路设计的常见工具其设计中必然会遇到时序约束的问题而多周期时序约束更是FPGA设计中不可避免的难点之一本文将详细介绍FPGA多周期时序约束的全过程并结合
PHP 使用 Kafka 安装拾遗

最近项目开发中需要使用 Kafka 消息队列经过检索 PHP下面有通用的两种方式来调用 Kafka php rdkafka 扩展以 PHP 扩展的形式进行使用是非常高效的另外该项目也提供了非常完备的文档不过在 Mac 环境中安装
Android9 默认开启/关闭GPS

gps默认打开需要关闭的话修改以下文件 frameworks base packages SettingsProvider res values defaults xml 将
xp系统蓝屏,xp系统蓝屏的详细解决过程

xp系统蓝屏的详细解决过程现在XP系统微软停止开发了服务也升级不得了刚刚使用时还是好好的能够正常的运行怎么一言不合就蓝屏了呢那么xp蓝屏怎么办呢跟你们分享一下小编解决xp蓝屏的经验吧重新启动快速按F8 用箭头上下选择最后
2022VLMo: Unified Vision-Language Pre-Training with Mixture-of-Modality-Experts

摘要我们提出了一个统一的视觉语言预训练模型 VLMo 该模型与一个模块化的transformer网络共同学习一个双编码器和一个融合编码器具体地我们引入了模态混合专家 MoME Transformer 其中每个块包含一个特定于模态的专
tensorRT部署之代码实现 onnx转engine/trt模型

tensorRT部署之代码实现 onnx转engine trt模型前提已经装好显卡驱动 cuda cudnn 以及tensorRT 下面将给出Python C 两种转换方式 1 C 实现项目属性配置好CUDA tensoeRT库通常

tensorRT部署之 代码实现 onnx转engine/trt模型

tensorRT部署之 代码实现 onnx转engine/trt模型

1. C++实现

tensorRT部署之 代码实现 onnx转engine/trt模型 的相关文章

随机推荐

热门标签

tensorRT部署之代码实现 onnx转engine/trt模型

tensorRT部署之代码实现 onnx转engine/trt模型

tensorRT部署之代码实现 onnx转engine/trt模型的相关文章