在 python 上使用 TensorRT .engine 文件进行推理

2024-04-21

我使用 Nvidia 的迁移学习工具包（TLT）进行训练，然后使用 tlt-converter 将 .etlt 模型转换为 .engine 文件。

我想使用这个 .engine 文件在 python 中进行推理。但由于我使用 TLT 进行训练，因此我没有任何冻结图或 pb 文件，而这正是所有 TensorRT 推理教程所需要的。

我想知道 python 推理是否可以在 .engine 文件上进行。如果没有，支持哪些转换（UFF、ONNX）来实现这一点？

Python 推理可以通过 .engine 文件实现。下面的示例从磁盘加载 .trt 文件（实际上与 .engine 文件相同）并执行单个推理。

在这个项目中，我使用以下命令将 ONNX 模型转换为 TRT 模型onnx2trt https://github.com/onnx/onnx-tensorrt使用前可执行。您甚至可以使用 ONNX 作为中间件将 PyTorch 模型转换为 TRT。


import tensorrt as trt
import numpy as np
import os

import pycuda.driver as cuda
import pycuda.autoinit



class HostDeviceMem(object):
    def __init__(self, host_mem, device_mem):
        self.host = host_mem
        self.device = device_mem

    def __str__(self):
        return "Host:\n" + str(self.host) + "\nDevice:\n" + str(self.device)

    def __repr__(self):
        return self.__str__()

class TrtModel:
    
    def __init__(self,engine_path,max_batch_size=1,dtype=np.float32):
        
        self.engine_path = engine_path
        self.dtype = dtype
        self.logger = trt.Logger(trt.Logger.WARNING)
        self.runtime = trt.Runtime(self.logger)
        self.engine = self.load_engine(self.runtime, self.engine_path)
        self.max_batch_size = max_batch_size
        self.inputs, self.outputs, self.bindings, self.stream = self.allocate_buffers()
        self.context = self.engine.create_execution_context()

                
                
    @staticmethod
    def load_engine(trt_runtime, engine_path):
        trt.init_libnvinfer_plugins(None, "")             
        with open(engine_path, 'rb') as f:
            engine_data = f.read()
        engine = trt_runtime.deserialize_cuda_engine(engine_data)
        return engine
    
    def allocate_buffers(self):
        
        inputs = []
        outputs = []
        bindings = []
        stream = cuda.Stream()
        
        for binding in self.engine:
            size = trt.volume(self.engine.get_binding_shape(binding)) * self.max_batch_size
            host_mem = cuda.pagelocked_empty(size, self.dtype)
            device_mem = cuda.mem_alloc(host_mem.nbytes)
            
            bindings.append(int(device_mem))

            if self.engine.binding_is_input(binding):
                inputs.append(HostDeviceMem(host_mem, device_mem))
            else:
                outputs.append(HostDeviceMem(host_mem, device_mem))
        
        return inputs, outputs, bindings, stream
       
            
    def __call__(self,x:np.ndarray,batch_size=2):
        
        x = x.astype(self.dtype)
        
        np.copyto(self.inputs[0].host,x.ravel())
        
        for inp in self.inputs:
            cuda.memcpy_htod_async(inp.device, inp.host, self.stream)
        
        self.context.execute_async(batch_size=batch_size, bindings=self.bindings, stream_handle=self.stream.handle)
        for out in self.outputs:
            cuda.memcpy_dtoh_async(out.host, out.device, self.stream) 
            
        
        self.stream.synchronize()
        return [out.host.reshape(batch_size,-1) for out in self.outputs]


        
        
if __name__ == "__main__":
 
    batch_size = 1
    trt_engine_path = os.path.join("..","models","main.trt")
    model = TrtModel(trt_engine_path)
    shape = model.engine.get_binding_shape(0)

    
    data = np.random.randint(0,255,(batch_size,*shape[1:]))/255
    result = model(data,batch_size)

大家注意安全！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

deeplearning

ComputerVision

Tensorrt

在 python 上使用 TensorRT .engine 文件进行推理的相关文章

在 pandas 中单独打印一列的原始值？

我有一个数据框 df pd DataFrame name george age 23 name anna age 26 现在我想检索乔治的年龄 df df name george age 但这会输出一些额外的信息以及原始值 0 23 Nam
如何使用 Python 裁剪图像中的矩形

谁能给我关于如何裁剪两个矩形框并保存它的建议我已经尝试过这段代码但效果不佳 import cv2 import numpy as np Run the code with the image name keep pressing spa
如何让python优雅地失败？

我只是想知道如何让 python 在所有可能的错误中以用户定义的方式失败例如我正在编写一个处理大项目列表的程序并且某些项目可能不符合我定义的格式如果 python 检测到错误它目前只会输出一条丑陋的错误消息并停止整个过程但是
以矢量化方式在另一个 DataFrame 中查找包含值子集的行

如何匹配此 DataFrame 中的值source car id lat lon 0 100 10 0 15 0 1 100 12 0 10 0 2 100 09 0 08 0 3 110 23 0 12 0 4 110 18 0 32 0
使用 pandas 将字符串对象转换为 int/float

import pandas as pd path1 home supertramp Desktop 100 life 180 data csv mydf pd read csv path1 numcigar Never 0 1 5 Ciga
如何使用 i18n 切换器将“LANGUAGE_CODE”保存到数据库，以便在 Django 中的不同浏览器中语言不会更改？

有什么办法可以改变它的值LANGUAGE CODE单击按钮发送请求时 settings py 中的变量会动态变化吗我希望用户设置自己的默认语言他们的帐户现在用户可以使用下拉列表选择他们的首选语言并且网站会得到完美的翻译并且
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
如何使用 PyMongo 在重复键错误后继续插入

如果我需要在 MongoDB 中插入尚不存在的文档 db stock update one document set document upsert True 将完成这项工作如果我错了请随时纠正我但是如果我有一个文档列表并想将它们全
返回上个月的日期时间对象

如果 timedelta 在它的构造函数中有一个月份参数就好了那么最简单的方法是什么 EDIT 正如下面指出的那样我并没有认真考虑这一点我真正想要的是上个月的任何一天因为最终我只会获取年份和月份因此给定一个日期时间对象返回的最
在 iPython/pandas 中绘制多条线会生成多个图

我试图了解 matplotlib 的状态机模型但在尝试在单个图上绘制多条线时遇到错误据我了解以下代码应该生成包含两行的单个图 import pandas as pd import pandas io data as web aapl
uri 警告中缺少端口：使用 Python OpenCV cv2.VideoCapture() 打开文件时出错

当我尝试流式传输 ipcam 时出现了如下所示的错误 tcp 000000000048c640 uri 中缺少端口警告打开文件时出错 build opencv modules videoio src cap ffmpeg impl h
线性同余生成器 - 如何选择种子和统计检验

我需要做一个线性同余生成器它将成功通过所选的统计测试我的问题是如何正确选择发电机的数字以及我应该选择哪些统计检验我想均匀性的卡方频率测试每代收集10 000个号码的方法将 0 1 细分为10个相等的细分柯尔莫哥洛夫斯米尔
根据列索引重命名 Dataframe 列

是否有内置函数可以按索引重命名 pandas 数据框我以为我知道列标题的名称但事实证明第二列中有一些十六进制字符根据我接收数据的方式我将来可能会在第 2 列中遇到这个问题因此我无法将这些特定的十六进制字符硬编码到 datafram
更换壳牌管道[重复]

这个问题在这里已经有答案了在 subprocess 模块的 Python 2 7 文档中我找到了以下片段 p1 Popen dmesg stdout PIPE p2 Popen grep hda stdin p1 stdout stdo
在 Python 中访问 argparse 的参数值

我正在尝试为我的程序设置一些简单的标志参数但无法弄清楚如何访问它们我有 argparser parser argparse ArgumentParser description Simple PostScript Interpreter
更新 SQLAlchemy 中的特定行

我将 SQLAlchemy 与 python 一起使用我想更新表中等于此查询的特定行 UPDATE User SET name user WHERE id 3 我通过 sql alchemy 编写了这段代码但它不起作用 session
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
如何使用 Pandas Series 绘制两个不同长度/开始日期的时间序列？

我正在绘制每周总事件的几个熊猫系列对象系列中的数据events per week看起来像这样 Datetime 1995 10 09 45 1995 10 16 63 1995 10 23 83 1995 10 30 91 1995
在父类中访问子类变量

我有一个父类和一个继承的子类我想知道如何访问我的父类中的子类变量我尝试了这个但失败了 class Parent object def init self print x class Child Parent x 1 x Child Er

随机推荐

“时钟”是否测量“睡眠”，即挂起的线程？

我正在尝试理解clock t clock void 功能更好有以下问题我理解正确吗clock测量进程的滴答数因为它是积极奔跑 and sleep挂起调用线程在这种情况下只有一个线程即主线程因此挂起整个进程意思就是clock不测
使用 PHP 的 HTTP PUT、DELETE 和 I/O 流

除了 HTTP PUT 方法之外还有什么方法可以访问通过 HTTP PUT 方法发送的数据 putdata fopen php input r 我从未与PUT and DELETE方法和 putdata fopen php input r
使用图形 api 在 sharepoint online 中创建多选字段的 POST 正文是什么？

我正在尝试使用 Microsoft Graph 创建新的 SharePoint ListItem 要创建包含标题等简单字段的列表项我的 POST 正文如下所示 fields Title Ehsan s REST 但是一旦我添加一个具有多选
使用 Ionic core 4 时不会显示离子含量

我正在开发一个使用 Vue js 和 Ionic 的应用程序但我不明白为什么更新我的 Ionic 核心版本会破坏 ion content 标签我尝试谷歌搜索该标签是否已停用但似乎没有是这样的为了说明这一点我制作了一个使用 Ioni
如何测试模块的运行块

我希望我的 AngularJS 应用程序发出 http 请求以从服务器检索用户信息或重定向到登录屏幕我在应用程序主模块的运行块中实现了这一点但是如何在运行块中测试代码呢或者我应该将此初始化代码移到控制器中以使其可测试我正在使用 Ka
从 Excel 到 SQL Server 的数据导入无法导入所有数据

我在使用导入和导出数据工具将数据从 Excel 导入到 SQL Server 时发生了一件奇怪的事情缺点是我可以在Excel中看到数据但所有数据都没有导入我有一本 Excel 工作簿其中包含一个电子表格我可以看到列中的数据一切看
如果没有收到请求的响应，会发生什么情况？我看到重试

我认为我遇到的问题可能更多是与浏览器相关的问题但它是一个非常基本的问题当我冒险构建一个 Web 应用程序时我也想找到答案在我的客户端代码中我正在做一个 ajax称呼这篇文章可能需要一段时间才能回复我看到的是在一段时间后再次发送请
在选定的数据范围内创建数据分区，将其输入到 caret::train 函数中以进行交叉验证

我想为下面的数据框创建折刀数据分区这些分区将用于caret train 像caret groupKFold 产生然而问题是我想将测试点限制为超过 16 天同时使用这些数据的其余部分作为训练集 df lt data frame Eff
如何用Python为ElasticSearch创建只读客户端？

我想从 ES 读取数据但不想意外向其中写入数据无索引操作这只是一种安全措施以便以后修改查询函数的其他人不允许插入数据当你说你想要只读客户端时客户端强调您系统中的同一集群可能有其他客户端然后阻止整个索引为只读将会阻止所有客户端的
在Linux上运行MFC程序

我有一个相当大的基于 MFC 的程序我的任务是让它在 Linux 上运行我已经解释过这需要将程序重新编写为带有 STL 的直接 C 更多工作或者重新编写为 Qt C 更少工作现在我被告知我需要编写包装器以使每个 MFC 类在 L
如何在 Jupyter 中启用 R 语法突出显示？

我希望为 Jupyter 编写的 R 代码添加语法突出显示准确地说语法高亮超出了数字文本等已有的语法高亮我的设置 Packges 康达R 3 2 4 康达版本 4 0 6 Jupyter版本4 1 0 在带有 Chrome 的 Wi
如何更改Exception对象的异常消息？

所以我捕获了一个异常 Exception 类的实例我想要做的是更改其异常消息我可以得到这样的异常消息 e gt getMessage 但如何设置异常消息呢这是行不通的 e gt setMessage hello 对于几乎所有的情况您
SelectSingleNode 返回 null - 即使有命名空间

我知道以前曾以类似的方式问过这个问题但我似乎无法解决这个问题我有一些 xml
如何允许多个参数为空值

我在 SSRS 报表生成器中的报表有多个参数如果不需要选择我希望所有参数都允许空白值但是当我尝试运行报告时第一个参数将允许空空白值并且它将提示我输入其余参数有没有办法解决 Set Allow Blank Value and o
如何遵守自制协议？

我有一个带有委托属性的类任何想成为代表的人都必须遵守协议我这样定义一切 import
Android 调用另一个类的方法

我知道这个问题重复了但我在互联网上找不到答案我想调用另一个类的方法我有Class1和Class2 在第2类中我有这个方法 public void UpdateEmployee some code 我想从Class1调用上面的方法感谢
理解 scala 中参与者的线程性

有人告诉我 Scala Actors 实际上从来不会同时执行两个操作这表明 act 或 React 或 receive 方法本质上是同步的我知道 act 方法中的长操作可能会导致阻塞问题并且我假设对消息队列的访问必须以某种方式同步但
Rails 路由中的“mount”指令是什么意思？

我找不到关键字 mount 的含义轨道布线系统 http api rubyonrails org classes ActionDispatch Routing html 我已经设置了Mercury http jejacks0n github
如何使用multiple属性在Android上上传多个文件？

I got a
在 python 上使用 TensorRT .engine 文件进行推理

我使用 Nvidia 的迁移学习工具包 TLT 进行训练然后使用 tlt converter 将 etlt 模型转换为 engine 文件我想使用这个 engine 文件在 python 中进行推理但由于我使用 TLT 进行训练因此

在 python 上使用 TensorRT .engine 文件进行推理

在 python 上使用 TensorRT .engine 文件进行推理 的相关文章

随机推荐

热门标签

在 python 上使用 TensorRT .engine 文件进行推理的相关文章