如何在C++中的cudaDeviceReset()之后重用tensorflow？

2024-04-17

我正在使用 C++ 开发一个大型 CUDA 应用程序，该应用程序运行各种模型，需要完全释放所有 GPU 内存，否则其他操作将失败。

我能够在关闭所有 tf 会话并运行 cudaDeviceReset() 后释放所有内存，但之后我无法运行任何新的张量流代码，并且会话创建将返回 nullptrs。我之前和之后都尝试过 cudaDeviceSynchronize() ，认为这会有所帮助，但我没有运气。

我认为对 InitMain 的调用会重新初始化张量流，但如果我在重置后再次调用，似乎不会。是否有一个特定的入口点我可以调用来基本上“重新开始”并使 TensorFlow 再次能够使用 GPU 并生成会话？

我使用的是 C++，而不是 Python。下面的示例显示了我运行 cudeDeviceReset() 然后尝试用 C++ 打开新的 TensorFlow 会话后 TensorFlow 所显示的内容。

2018-10-04 17:01:19.225505: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1435] Adding visible gpu devices: 0
2018-10-04 17:01:19.326074: I tensorflow/core/common_runtime/gpu/gpu_device.cc:923] Device interconnect StreamExecutor with strength 1 edge matrix:
2018-10-04 17:01:19.326091: I tensorflow/core/common_runtime/gpu/gpu_device.cc:929]      0 
2018-10-04 17:01:19.326095: I tensorflow/core/common_runtime/gpu/gpu_device.cc:942] 0:   N 
2018-10-04 17:01:19.326215: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1053] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 9446 MB memory) -> physical GPU (device: 0, name: GeForce GTX 1080 Ti, pci bus id: 0000:01:00.0, compute capability: 6.1)
2018-10-04 17:01:19.326554: E tensorflow/stream_executor/cuda/cuda_driver.cc:785] failed to memset memory: CUDA_ERROR_INVALID_VALUE
2018-10-04 17:01:19.326593: E tensorflow/core/common_runtime/direct_session.cc:154] Failed precondition: Failed to memcopy into scratch buffer for device 0

它可能是相关的，但第一次运行在开始时有额外的行，就好像一次性初始化可能已经运行一样。第二轮缺少这些线条。下面是第一个的样子。

2018-10-04 17:01:17.253809: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:898] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero
2018-10-04 17:01:17.254173: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1356] Found device 0 with properties: 
name: GeForce GTX 1080 Ti major: 6 minor: 1 memoryClockRate(GHz): 1.6325
pciBusID: 0000:01:00.0
totalMemory: 10.92GiB freeMemory: 9.76GiB
2018-10-04 17:01:17.254185: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1435] Adding visible gpu devices: 0
2018-10-04 17:01:17.413712: I tensorflow/core/common_runtime/gpu/gpu_device.cc:923] Device interconnect StreamExecutor with strength 1 edge matrix:
2018-10-04 17:01:17.413733: I tensorflow/core/common_runtime/gpu/gpu_device.cc:929]      0 
2018-10-04 17:01:17.413737: I tensorflow/core/common_runtime/gpu/gpu_device.cc:942] 0:   N 
2018-10-04 17:01:17.413888: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1053] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 9446 MB memory) -> physical GPU (device: 0, name: GeForce GTX 1080 Ti, pci bus id: 0000:01:00.0, compute capability: 6.1)

我至少已经弄清楚如何正确释放内存，并且 nvidia-smi 显示我的应用程序在重置后按预期删除内存，但如果我之后无法执行任何操作，它仍然没有用。

我有一个关于我使用哪个代码来建立会话的问题。我没有使用任何自定义会话选项。

tensorflow::NewSession(tensorflow::SessionOptions());

基本的复制是简单地将图形加载到会话中，关闭会话和图形，释放指针，调用 cudaDeviceReset() 并再次尝试打开另一个会话，这将抛出 nullptrs 和上述错误消息。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在C++中的cudaDeviceReset()之后重用tensorflow？的相关文章

访问特征矩阵的行向量时复制或引用

我正在使用的代码Eigen http eigen tuxfamily org index php title Main Page矩阵库我注意到在整个代码中有如下访问器 RowVector3f V size t vertex index
为什么模板类的静态成员不唯一

看一下下面的代码 include
Xamarin 测试记录器选项有错误。无法记录自动化测试

选项 gt Xamarin gt Xamarin Test Recorder 中的所有设置都有错误我的桌面上安装了 Visual Studio 2015 企业版以及 Xamarin 和 Xamarin Test Recorder 插件
ASP.NET 如何在 Web API 中读取多部分表单数据？

我将多部分表单数据发送到我的 Web API 如下所示 string example my string HttpContent stringContent new StringContent example HttpContent fil
基于多线程的 RabbitMQ 消费者

我们有一个 Windows 服务它监听单个 RabbitMQ 队列并处理消息我们希望扩展相同的 Windows 服务以便它可以监听 RabbitMQ 的多个队列并处理消息不确定使用多线程是否可以实现这一点因为每个线程都必须侦听阻
Python 相当于 Bit Twiddling Hacks 中的 C 代码？

我有一个位计数方法我正在尝试尽可能快地实现我想尝试下面的算法位摆弄黑客 http graphics stanford edu seander bithacks html CountBitsSetParallel 但我不知道 C 什么是
弹出 x86 堆栈以访问函数 arg 时出现分段错误

我正在尝试链接 x86 程序集和 C 我的C程序 extern int plus 10 int include
如何使用 libclang 判断成员函数是 const 还是 volatile？

我有一个实例CXCursor同类CXCursor CXXMethod 我想知道这个函数是否是const or volatile 例如 class Foo public void bar const void baz volatile voi
我们什么时候应该在.NET中使用NativeMemory.Alloc()？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案 NET6 C 引入NativeMemory类但我不知道什么时候应该使用NativeMemory Alloc 而不是普通的数组实例化
如何在 C# 中创建 PKCS12 .p12 文件？

这可能是一个n00b问题但我在这方面确实没有任何经验我需要创建一个包含 X509 证书和私钥的 p12 捆绑包我当前有两个对象 X509Certificate2 和包含关键信息的 RSAParameters 对象如何将它们合并到 p
如何使用 Selenium Webdriver .NET 绑定设置 Chrome 首选项？

这是我正在使用的用户代理可以成功设置而下载首选项则不能 Windows 7 Chrome 26 Selenium dotnet 2 31 2 chromedriver win 26 0 1383 0 ChromeOptions chro
代码块 - 使用大地址感知标志进行编译

如何使用以下命令在 64 位系统上编译 32 位应用程序LARGE ADRESS AWARE使用代码块标记我需要使用超过 2GB 的内存应该是添加的情况 Wl large address aware到链接标志我不使用 CodeBloc
指向 VLA 的指针

你可能知道 VLA 的优点和缺点 https stackoverflow com a 3082302 1606345在 C11 中它们是可选的我认为使 VLA 成为可选的主要原因是堆栈可能会爆炸 int arr n where n 10
我应该使用 Helgrind 还是 DRD 进行线程错误检测？

好像Valgrind http valgrind org docs manual manual html有两个工具都可以进行线程错误检测 Helgrind http valgrind org docs manual hg manual ht
张量流急切模块错误

我的操作系统是 Ubuntu 16 04 Python版本是3 5 张量流版本是14 0 当我尝试为 TF Eager 模块编写简单代码时 import tensorflow as tf import tensorflow contrib
如何使用 MongoDB 实现 ASP.NET Core 3.1 Identity？

是一个 API 用于简化后端和逻辑代码来管理用户密码个人资料数据角色声明令牌电子邮件确认等对于 Visual Studio 来说支撑脚手架 https learn microsoft com en us aspnet cor
C# XML 反序列化。将节点中的所有内部文本读取到字符串属性中

我目前正在尝试修改我的类以便我的模型上的文本属性包含某个节点的所有内部文本 text node 给我带来问题的 xml 示例是
在 C++ 中什么时候首选传递指针而不是引用传递？

我可以想象一种情况其中输入参数可以为 NULL 以便首选传递指针而不是传递引用有人可以添加更多案例吗在传递的对象实际上将被修改的情况下有些人更喜欢传递指针当对象通过引用传递时它们使用 pass by const referenc
如何编写完全可移植的 4 字节字符常量的编译时初始化

遗留代码大致如下所示 define MAKEID a b c d UInt32 a lt lt 24 UInt32 b lt lt 16 UInt32 c lt lt 8 UInt32 d define ID FORM MAKEID F
使用 List.Contains 方法为 LINQ 构建表达式树

Problem 我正在重构一些LINQ查询我们的 Web 应用程序中的多个报告并且我尝试将一些重复的查询谓词移至它们自己的中IQueryable扩展方法以便我们可以将它们重新用于这些报告以及将来的报告正如您可能推断的那样我已经重构了

随机推荐

Symfony：解析 web.xml 时出现 InvalidArgumentException

最近我将 Symfony 系统移动到另一台服务器从那时起就出现错误技术细节是 Windows Server 2012 上的 apache 2 4 服务器 apache可以通过本地网络访问的文件服务器当我移动 Symfony 页面时
ERC721：转账调用者不是所有者也不是批准的

我有一个 nftToken 合约可以将代币铸造到 msg sender 然后我在市场合约中有一个函数可以将 nft 从所有者转移到市场合约但是我收到一条错误消息 ERC721 转账调用者不是所有者也不是批准的这是我的 nftCon
ReplaceAll 性能秘诀是什么？ [HTML 转义]

我花了一些时间寻找转义 html 字符串的最佳方法并发现了一些相关讨论讨论1 https stackoverflow com questions 24816 escaping html strings with jquery 讨论2 h
Android获取recyclerview项目和位置上选定的文本部分

在我的适配器中可以选择显示弹出窗口的项目例如copy cut或等等现在我怎样才能获得所选的文本部分recyclerView项目和位置我阅读了更多有关找到此解决方案的文档但我不知道该怎么做这是我的适配器我想获取文本和位置的选定部
Python .localize 和 tzinfo 之间的日期时间差异

为什么这两行会产生不同的结果 gt gt gt import pytz gt gt gt from datetime import datetime gt gt gt local tz pytz timezone America Los A
UICollectionView cellForItemAt indexPath 在 iOS 10 中跳过行索引

I have UICollectionView具有水平滚动和分页功能当我第一次滚动到下一页或上一页或从左到右更改滚动方向时 indexPath row 的值cellForItemAtIndexPath改变了 3 而不是 1 然后它就可以正
css 100%宽度div不占据父级的整个宽度

我在一个页面上有两个 div 一个带有背景的网格容器和一个需要放置在另一个网格中心的内部网格我的CSS html body margin 0 padding 0 width 100 grid container background f8
什么是“3D语法”？

在编写 Racket 宏的上下文中 3D 语法是什么意思这句话我听过好几次了包含一次对宏的引用I正在写作但那是不久前的事了我修复了它现在我不记得我最初做错了什么另外是 3D 语法吗always坏的或者是像eval 如果你认
是否可以将 CSS Scroll Snap 应用于 HTML 标签而不是 Body 标签

CSS Scroll Snap 允许浏览器捕捉滚动到容器中的元素要将相同的逻辑应用于垂直页面滚动我发现它必须应用于而不是见下文这不是一个主要问题但它确实有效地创建了一个滚动区域而不是使用窗口滚动虽然这看起来不错但它有一些副作用
在 Xcode Interface Builder 中对场景进行排序

所以我不知道该怎么称呼它但它是 Xcode 中 Storyboard Editor 左侧的那个栏显示所有不同的场景我喜欢使用故事板但我对它们最大的不满是场景以完全随机的方式组织在该列表中每次我向故事板添加新的视图控制器时它都会被
阻止 Chrome 扩展程序在我的网站上运行

作为一名网络开发人员有什么方法可以阻止用户的 Chrome 扩展应用到我的网站吗即标题元标记等等此外如果有的话是否还有一种方法可以将特定扩展列入白名单这是不可能的在网络服务器端您只能控制浏览器允许您控制的内容简单来说这
Derby 还是 MySQL 或者...？

对于什么类型的需求您会选择 Apache Derby 或 Java DB 而不是 MySQL 反之亦然我环顾四周人们只是比较两者但没有人谈论何时考虑每一个我正在使用 Glassfish Java Restlet MySQL 开发一
sql从多个记录中仅选择最新的

我有一个名为客户年龄的表如下所示 ID 1 2 3 4 5 6 7 8 9 NAME JIM JIM JIM NICK NICK NICK Paul Paul Paul VALUE 20 13 12 10 20 8 4 24 14 我
我们可以让 selenium webdriver 在运行时等待用户点击网页链接而不使用隐式等待吗？

我正在使用 Firefox 驱动程序和 java 并尝试从网站上抓取一些数据其中涉及人工交互我必须要求用户输入搜索字符串然后相应地用户必须通过人眼分析来选择打开哪个搜索结果我们的努力只是为了通过脚本让一些零碎的东西更快地工作我的问
检查记录是否存在数据库 - 错误显示

如何检查用户名或电子邮件是否存在然后将错误消息放入错误数组中现在我有 sql SELECT username email FROM users WHERE username username OR email email query m
如何在 ios、swift 中生成公钥/私钥对，如下所示

这就是我生成公钥私钥对的方式 var statusCode OSStatus var publicKey SecKey var privateKey SecKey let publicKeyAttribute NSObject NSObj
扫描仪无法读取整个句子 - 扫描仪类的 next() 和 nextLine() 之间的区别

我正在编写一个程序允许用户输入数据然后输出它它的 3 4 正确但当它到达输出地址时它只打印一个单词让我们只说 Archbishop Street 的 Archbishop 我该如何解决 import java util class
静态初始化顺序惨败

我在一本书中读到有关 SIOF 的内容它给出了一个例子 file1 cpp extern int y int x y 1 file2 cpp extern int x int y x 1 现在我的问题是在上面的代码中会发生以下情况吗
为什么 CAP_NET_RAW 不能与 SO_BINDTODEVICE 一起使用？

我有以下简单的测试程序来创建 UDP 套接字并将其绑定到特定接口SO BINDTODEVICE这样我就可以bind it so INADDR ANY专门接收该接口上的 UDP 广播 filename bindtest c include
如何在C++中的cudaDeviceReset()之后重用tensorflow？

我正在使用 C 开发一个大型 CUDA 应用程序该应用程序运行各种模型需要完全释放所有 GPU 内存否则其他操作将失败我能够在关闭所有 tf 会话并运行 cudaDeviceReset 后释放所有内存但之后我无法运行任何新的张量流

如何在C++中的cudaDeviceReset()之后重用tensorflow？

如何在C++中的cudaDeviceReset()之后重用tensorflow？ 的相关文章

随机推荐

热门标签

如何在C++中的cudaDeviceReset()之后重用tensorflow？的相关文章