TensorRT 多线程

2024-05-06

我正在尝试使用 python API 来使用 TensorRt。我试图在多个线程中使用它，其中 Cuda 上下文与所有线程一起使用（在单个线程中一切正常）。我使用 docker 和 tensorrt:20.06-py3 图像、onnx 模型和 Nvidia 1070 GPU。

应该允许多线程方法，如此处所述TensorRT 最佳实践 https://docs.nvidia.com/deeplearning/tensorrt/best-practices/index.html#thread-safety.

我在主线程中创建了上下文：

cuda.init()
device = cuda.Device(0)
ctx = device.make_context()

我尝试了两种方法，首先在主线程中构建引擎并在执行线程中使用它。这个案例给出了这个错误。

[TensorRT] ERROR: ../rtSafe/cuda/caskConvolutionRunner.cpp (373) - Cask Error in checkCaskExecError<false>: 10 (Cask Convolution execution)
[TensorRT] ERROR: FAILED_EXECUTION: std::exception

其次，我尝试在线程中构建模型，但它给了我这个错误：

pycuda._driver.LogicError: explicit_context_dependent failed: invalid device context - no currently active context?

当我调用“cuda.Stream()”时出现错误

我确信我可以在同一 Cuda 上下文下并行运行多个 Cuda 流，但我不知道该怎么做。

我找到了解决方案。这个想法是建立一个正常的全球ctx = device.make_context()然后在每个执行线程中执行以下操作：

ctx.push()
---
Execute Inference Code
---
ctx.pop()

源代码和完整示例的链接是here https://forums.developer.nvidia.com/t/how-to-use-tensorrt-by-the-multi-threading-package-of-python/123085

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

TensorRT 多线程的相关文章

如果未返回，则在一段时间后终止线程

我有一个线程从网络或串行端口获取一些数据如果 5 秒内没有收到数据则线程必须终止或返回 false 换句话说如果线程运行时间超过 5 秒则必须停止我用 C 编写但任何 NET 语言都可以有两种方法 1 封装超时从网络或串行
CPU Relax 指令和 C++11 原语

我注意到许多使用特定于操作系统的原语实现的无锁算法例如所描述的自旋锁here http locklessinc com articles locks 使用 Linux 特定的原子原语经常使用 cpurelax 指令使用 GCC 可以通
返回一个dispatch_async获取的变量[重复]

这个问题在这里已经有答案了基本上一个方法需要返回一个在dispatch async中获取的NSDictionary 这是我尝试过的 NSDictionary fetchNSDictionary dispatch queue t Queu
我对线程失去了理智

我想要这个类的对象 public class Chromosome implements Runnable Comparable
线程池，C++

我正在使用 C 开发一个网络程序我想实现一个 pthread 池每当我从接收套接字接收到一个事件时我都会将数据放入线程池中的队列中我正在考虑创建 5 个独立的线程并将持续检查队列以查看是否有任何传入数据需要完成这是一个非常简单的
为什么Apache MPM prefork.c 使用互斥体来保护accept()？

我坐下来读书Apache 的 MPM prefork c http code metager de source xref apache httpd server mpm prefork prefork c这段代码使用了一个名为accept
无法在内存位置找到异常源：cudaError_enum

我正在尝试确定 Microsoft C 异常的来源 test fft exe 中 0x770ab9bc 处的第一次机会异常 Microsoft C 异常内存位置 0x016cf234 处的 cudaError enum 我的构建环境是 I
Java 和/C++ 在多线程方面的差异

我读过一些提示多线程实现很大程度上取决于您正在使用的目标操作系统操作系统最终提供了多线程能力比如Linux有POSIX标准实现而windows32有另一种方式但我想知道编程语言水平的主要不同 C似乎为同步提供了更多选择例如互斥锁
Erlang 如何睡觉（晚上？）

我想在 Erlang 服务器上每隔几个小时运行一次小型清理过程我知道计时器模块我在教程中看到一个示例使用链式计时器睡眠命令来等待几天后发生的事件我觉得这很奇怪我知道 Erlang 进程与其他语言中的进程相比是独一无二的但是进程
异步回调在哪个线程上运行？

我正在做几个HttpWebRequest BeginGetResponse调用并在回调方法中BeginGetResponse 我正在调用一个事件处理程序在EventHandler中有测试下载是否成功的逻辑如果没有它会尝试重新下载
奇怪的跨线程 UI 错误

我正在编写一个 WinForms 应用程序它有两种模式控制台或 GUI 同一解决方案中的三个项目一个用于控制台应用程序一个用于 UI 表单第三个用于保存两个界面也将连接的逻辑控制台应用程序运行绝对流畅保存用户选择的模型它有一
为什么 Web Worker 性能在 30 秒后急剧下降？

我正在尝试提高在网络工作人员中执行时脚本的性能它旨在解析浏览器中的大型文本文件而不会崩溃一切都运行得很好但我注意到使用网络工作者时大文件的性能存在严重差异于是我做了一个简单的实验我在同一输入上运行脚本两次第一次运行在页面的主线程
VB - 以隐式方式链接 DLL

我正在开发 VB6 图形界面并且需要隐式链接到 DLL 这样做的动机来自于我上一个问题 https stackoverflow com questions 5194573 有问题的 DLL 使用静态 TLS declspec thread
pthread_cond_timedwait() 和 pthread_cond_broadcast() 解释

因此我在堆栈溢出和其他资源上进行了大量搜索但我无法理解有关上述函数的一些内容具体来说 1 当pthread cond timedwait 因为定时器值用完而返回时它如何自动重新获取互斥锁互斥锁可能被锁定在其他地方例如在生产者
Meteor.setTimeout 和 Meteor.methods 之间的并发

在我的 Meteor 应用程序中实现回合制多人游戏服务器客户端通过发布订阅接收游戏状态并且可以调用 Meteor 方法sendTurn将回合数据发送到服务器他们无法直接更新游戏状态集合 var endRound function g
从库中捕获主线程 SynchronizationContext 或 Dispatcher

我有一个 C 库希望能够将工作发送发布到主 ui 线程如果存在该库可供以下人员使用一个winforms应用程序本机应用程序带 UI 控制台应用程序没有 UI 在库中我想在初始化期间捕获一些东西 Synchronizati
无法初始化 NVML：几个小时后 Docker 中出现未知错误

我遇到有趣而奇怪的问题当我使用 GPU 启动 docker 容器时它工作正常并且我看到 docker 中的所有 GPU 然而几个小时或几天后我无法在docker中使用GPU 当我做nvidia smi在泊坞窗机器中我看到这条消息
为什么 gcc 链接时没有 lpthread 标志？

我当时正在做一个业余爱好项目其中互斥体的行为很神秘我将其归结为这个显然应该陷入僵局的测试用例 include
ThreadPool.SetMinThreads 不创建任何新线程

我想弄清楚到底有什么影响ThreadPool SetMinThreads makes 根据官方文档 https learn microsoft com en us dotnet api system threading threadpool
通过 cuFFT 进行逆 FFT 缩放

每当我使用 cuFFT 绘制程序获得的值并将结果与 Matlab 的结果进行比较时我都会得到相同形状的图形并且最大值和最小值位于相同的点然而 cuFFT 得到的值比 Matlab 得到的值大得多 Matlab代码是 fs 1000 s

随机推荐

什么时候应该首选 Loader 而不是 createQmlObject，反之亦然 - QML？

两者都可以动态创建对象什么时候应该Loader优先于Qt createQmlObjectQML 中反之亦然吗 The Loader可以被视为特定对象的占位符它还使您能够通过Loader s id Qt createQmlObject通常
将 R 中的向量按特定顺序转换为下三角矩阵

我有一个向量其中元素的顺序很重要比如说 x lt c 1 2 3 4 我想将我的向量排列成具有特定顺序的下三角矩阵其中每行包含向量的前一个元素我的目标是获得以下矩阵 lower diag matrix 1 2 3 4 1 4 0 0
当路由器处于历史模式时，PWA 不会加载（基于 Vue CLI 3 的项目）

我有一个基于 Vue CLI 3 的应用程序我想将其用作 PWA 我需要它在历史模式下工作因为哈希会介入我正在执行的基于 OAuth 的身份验证过程的一部分的重定向当路由处于哈希模式时可以像 PWA 一样正常加载一旦我将模式更改为
如何在ngDialog中加载数据

我有一个要求我需要从 jsp 页面打开一个对话框并且在打开该对话框时我需要从服务器加载一些预填充的数据使用 AJAX 调用如果我在打开对话框之前进行 AJAX 调用我会获取数据但对话框会像新页面一样加载如果我尝试在新控制器中
应用程序更新后，辅助功能权限会重置

我制作了一个应用程序要求用户授予访问功能的权限当应用程序首次启动并请求可访问性时它的工作方式如下 const void keys kAXTrustedCheckOptionPrompt const void values force
如何在不重建镜像的情况下更新源代码

我在 GitLab 上创建了一个新的存储库在其中为我的 Angular 项目构建了一个 docker 镜像现在我在本地对源代码做了一些修改有没有办法可以更新 docker 映像而不重建它 None
如何使用 wamp 在 Windows 上烘焙 cakephp 2.0 应用程序

我想在Windows系统上烤蛋糕php项目我正在使用 wamp 服务器来运行 PHP mysql 我已经浏览过 cakephp 网站上的视频投射并设置了环境设置按照演示给出命令蛋糕后最后我收到一条消息说 php 不被识别为内部或
为什么乘法后很长时间都会出现负值？ [复制]

这个问题在这里已经有答案了为什么java中的这段代码给出负值 long ttt 60 60 1000 24 26 System out println ttt 结果出现在 Eclipse 控制台上 2134967296 我在做的任何愚蠢的
在 Github 提交中强制执行 PEP-8'ish 格式

是否有任何预制解决方案可以在 Git 提交挂钩中强制执行良好的 Python 标准有没有办法在本地结帐中自动执行此过程类似于 Bazaar 可以将提交挂钩推送给客户端当您签出存储库时它会安装提交挂钩这应该足够了无需运行进一步的工
有没有办法检测 Android 上使用的是哪个蜂窝网络？

我的应用程序将提供实时视频流我想知道是否有办法检测用户设备上是否有2G 3G或4G 以及当前连接属于哪个类别我的问题专门针对 Android 设备这里有一个课程要点 https gist github com emil2k 51303
Google 的 Page Speed 无损图像压缩如何工作？

当您在网站上运行适用于 Firebug Firefox 的 Google PageSpeed 插件时它会建议可以无损压缩图像的情况并提供下载此较小图像的链接例如无损压缩http farm3 static flickr com 266
如何使用 Hibernate 3.3.2GA 将 TIMESTAMP WITH TIME ZONE 映射到 Java 数据类型？

如何映射 Oracle 列类型TIMESTAMP WITH TIME ZONE http download oracle com docs cd B19306 01 server 102 b14225 ch4datetime htm i10
如何在无 null 设计中实现 List、Set 和 Map？

当您在大多数情况下可以返回 null 空对象以避免 null 时这很好但是像 Collection 这样的对象呢在爪哇 Map回报null if key in get key 地图上没有找到我能想到的最好的避免方法null在这种情况
在 Mojarra 2.2.5 的复合组件中使用 Omnifaces EL 函数

升级到 JSF Mojarra 2 2 5 后在使用 Omnifaces 的 el 函数 formatNumber 时出现以下异常这仅发生在复合组件内普通 Facelet 工作正常 javax el E LException 找不到函
带有 --rule 选项的 ESLint CLI

我在使用 ESLint CLI 时遇到问题 rule option This is what I tried eslint rule no console error fix dry run 导致出现以下错误选项规则的值无效预期类型
如何使用 RSpec & Rails 4 测试子域约束

我正在尝试编写一个测试子域约束的控制器测试但是我无法让 RSpec 设置子域并且如果子域不准确则返回错误我正在使用 Rails 4 2 6 和 RSpec 3 4 路线 rb namespace frontend api do c
Spring实体应该在服务中转换为Dto吗？

对此发表评论后question https stackoverflow com questions 34058238 spring service and repository layer convention 34066805 nored
在 Emacs Paredit 中交换括号和方括号

如何在 paredit 模式下定义交换括号和方括号的命令所以任务就是把它变成这样例如 blah a b c 进入这个 blah a b c 使用 paredit 模式移至表达式的开头 a 进而 C M SPC
在 bootstrap 4 中将页脚刷新到页面底部

我正在使用引导程序4 我的模板结构是这样的 div div div div
TensorRT 多线程

我正在尝试使用 python API 来使用 TensorRt 我试图在多个线程中使用它其中 Cuda 上下文与所有线程一起使用在单个线程中一切正常我使用 docker 和 tensorrt 20 06 py3 图像 onnx 模型和

TensorRT 多线程

TensorRT 多线程 的相关文章

随机推荐

热门标签

TensorRT 多线程的相关文章