iterator.get_next() 导致在抛出 'std::system_error 实例后调用终止

2023-12-21

我正在使用张量流训练 resNet50，使用具有以下属性的共享服务器：

ubuntu 16.04 3 个 GTX 1080 GPU 张量流1.3 蟒蛇2.7 但总是在两个纪元之后，在第三个纪元期间，我遇到这个错误：

terminate called after throwing an instance of 'std::system_error' 
what():
Resource temporarily unavailable
Aborted

这是将 tfrecord 转换为数据集的代码：

filenames = ["balanced_t.tfrecords"]
dataset = tf.contrib.data.TFRecordDataset(filenames)
def parser(record):
keys_to_features = {
    "mhot_label_raw": tf.FixedLenFeature((), tf.string, 
default_value=""),
    "mel_spec_raw": tf.FixedLenFeature((), tf.string, 
default_value=""),
}
parsed = tf.parse_single_example(record, keys_to_features)

mel_spec1d = tf.decode_raw(parsed['mel_spec_raw'], tf.float64)
# label = tf.cast(parsed["label"], tf.string)
mhot_label = tf.decode_raw(parsed['mhot_label_raw'], tf.float64)
mel_spec = tf.reshape(mel_spec1d, [96, 64])
return {"mel_data": mel_spec}, mhot_label
dataset = dataset.map(parser)
dataset = dataset.batch(batch_size)
dataset = dataset.repeat(3)
iterator = dataset.make_one_shot_iterator()

这是输入管道：

while True:
        try:
           (features, labels) = sess.run(iterator.get_next())
        except tf.errors.OutOfRangeError:
           print("end of training dataset")

在我的代码中插入一些打印消息后，我发现以下行导致此错误：

(features, labels) = sess.run(iterator.get_next())

但是，我无法解决它

您的代码存在（微妙的）内存泄漏，因此该进程可能会耗尽内存并被终止。问题是调用iterator.get_next()在每次循环迭代中都会向 TensorFlow 图中添加一个新节点，这最终会消耗大量内存。

要阻止内存泄漏，请重写您的while循环如下：

# Call `get_next()` once outside the loop to create the TensorFlow operations once.
next_element = iterator.get_next()

while True:
    try:
        (features, labels) = sess.run(next_element)
    except tf.errors.OutOfRangeError:
        print("end of training dataset")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

tensorflowdatasets

iterator.get_next() 导致在抛出 'std::system_error 实例后调用终止的相关文章

使用 Keras Tuner 调整模型时如何跳过有问题的超参数组合？

使用 Keras Tuner 时似乎没有办法允许跳过有问题的超参数组合例如 Conv1D 层中的过滤器数量可能与后续 MaxPooling1D 层中的池大小的所有值不兼容从而导致模型构建错误然而在运行调谐器之前可能不知道这一点一
如何在 Tensorflow 中使用预训练的 Word2Vec 模型

我有一个Word2Vec训练过的模型Gensim 我如何使用它Tensorflow for Word Embeddings 我不想在 Tensorflow 中从头开始训练嵌入有人可以告诉我如何用一些示例代码来做到这一点吗假设您有一个字典
有没有办法在bigquery中使用kmeans、tensorflow保存的模型？

我知道这有点愚蠢因为 BigQueryML 现在为 Kmeans 提供了良好的初始化尽管如此我还是需要在张量流中训练一个模型然后将其传递给 BigQuery 进行预测我保存了模型一切正常直到我尝试将其上传到 bigquery
Tensorflow 到 ONNX 的转换

我目前正在尝试转换我使用本教程创建的已保存且正在工作的 pb 文件 https github com thtrieu darkflow https github com thtrieu darkflow 到 onnx 文件中我目前正在
Tensorboard——High-level节点的计算时间与其子节点计算时间的总和不同

继tutorial https www tensorflow org programmers guide graph viz在 TensorFlow 上我试图使用张量板来理解运行时统计数据我发现代表名称范围的高级节点的计算时间不等于其子
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
如何解释tf.map_fn的结果？

看代码 import tensorflow as tf import numpy as np elems tf ones 1 2 3 dtype tf int64 alternates tf map fn lambda x x x x el
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe
无法使用 tf.data.Dataset 对组件 0 中具有不同形状的张量进行批处理

我的输入管道中出现以下错误 tensorflow python framework errors impl InvalidArgumentError 不能分量 0 中具有不同形状的批量张量第一个元素有形状为 2 48 48 3 元素
ValueError：形状（无，1）和（无，2）不兼容

我正在训练面部表情愤怒与快乐模型最后一个密集输出层以前为 1 但当我预测图像时它的输出始终为 1 准确度为 64 所以我将其更改为 2 表示 2 个输出但现在我收到这个错误 Epoch 1 15 ValueError Traceb
我无法使用 scikeras.wrappers.KerasRegressor 执行 cross_val_score

from tensorflow import keras from sklearn model selection import cross val score from sklearn datasets import make regre
Tensorflow 检查点模型被删除

我使用以下代码每 10 个时期后使用张量流检查点 checkpoint dir os path abspath os path join out dir checkpoints checkpoint prefix os path join
在 TensorFlow 中调试 python 测试

我们想要在 TensorFlow 中调试 Python 测试例如稀疏分割操作测试 and string to hash bucket op test 我们可以使用 gdb 调试其他 C 测试但是我们找不到调试 python 测试的方法
损失、准确性、验证损失、验证准确性之间有什么区别？

在每个纪元结束时我会得到以下输出 Epoch 1 25 2018 08 06 14 54 12 555511 2 2 86s 43s step loss 6 0767 acc 0 0469 val loss 4 1037 val acc
如何使用 keras/tensorflow 构建无监督 CNN 模型？

我正在尝试为图像到图像转换应用程序构建 CNN 模型的输入是图像输出是置信图训练期间没有标记的置信度作为基本事实但设计了损失函数来引导模型获得正确的输出我在用 keras 构建神经网络时遇到困难因为 model fit 函数需要训
模型返回错误 - ValueError：logits 和标签必须具有相同的形状 ((None, 18) vs (None, 1))

我正在使用基于 keras 的多标签分类器我创建了一个加载训练和测试数据的函数然后在函数本身内处理拆分 X Y 我在运行模型时遇到错误但不太确定其含义这是我的代码 def KerasClassifer df train df te
Tensorflow 保存子类模型，该模型具有 call() 方法的多个参数

我正在关注张量流神经机器翻译教程 https www tensorflow org tutorials text nmt with attention https www tensorflow org tutorials text nmt
为什么我的 GradientDescentOptimizer 会产生 NaN？

我目前正在修改 Andrew Ng 教授在 Coursera 上的机器学习课程作业但我陷入了逻辑回归部分 filename data ex2data1 txt data np loadtxt filename delimiter un
PyCharm 中的 TensorFlow Python 警告 - 在 __init__.py 中找不到引用 __version__

我正在使用 if tf version lt x x x PyCharm 中的声明可以在许多 TensorFlow GitHub 示例中找到如下所示 tensorflow version test py import tensorflo
TensorFlow 的 Print 或 K.print_tensor 不会在损失函数中打印中间张量

我为 Keras 模型编写了一个相当复杂的损失函数并且它不断返回nan训练时因此我需要在训练时打印中间张量我知道你不能在损失函数中执行 K eval 因为张量未初始化不过我都尝试过K print tensor and tf Pr

随机推荐

JDK 对实体扩展的限制

我在转换大型 XML 文档期间收到此错误消息 JAXP00010001 解析器在本文档中遇到了超过 64000 个实体扩展这是 JDK 施加的限制 Googled and learned about limits http docs or
如何在 Maven 中启动单个目标/执行

目前我正在调试 Android 应用程序的签名如果我可以执行这个唯一的插件这会容易得多
Java openCV - 将位图转换为 Mat 时出错

我正在使用 Java openCV 我尝试加载一张照片并对其运行模板匹配模板匹配方法处理Mat对象所以我需要加载图像并将它们转换为Mat 我这样做的方法是 Bitmap i BitmapFactory decodeFile sdcard
将 JSplitPane 与 AWT 组件结合使用

我有一个 AWT 画布无法将其转换为 Swing 组件它来自VTK http www vtk org 我希望在 JSplitPane 中显示其中一些画布我读过有关在 Java 中混合重型和轻型组件的内容并且知道这是一件令人痛苦的事情
Google Apps 脚本在 Javascript 中获取 iFrame 的父 URL

我搜索了很多论坛并且非常有信心这将是否但我想我会将其向社区开放以防万一我的任务是在 Google 协作平台页面上创建一个工具用于记录员工访问页面后的访问时间它有助于确认文档访问和活动日志的合规性如果 iFrame 与其托管页
Bitbucket 服务器：在推送修改特定文件夹内文件的提交时发送电子邮件

当有人推送一个或多个修改文件夹内文件的提交时有什么方法可以发送电子邮件吗我有一个文件夹其中包含的文件包含在大多数提交中不应更改的通用代码但是如果有人对这些文件进行更改我想触发电子邮件松弛通知可以用BitBucket服务器来做
这在xsl中代表什么？匹配=“@*|节点（）”

谁能解释一下这在xsl中意味着什么每个表达式到底代表什么
你能通过javascript检测PC上是否启用了Cleartype吗？

一些 font face字体在非cleartype设置下效果不佳边缘变得非常不稳定有没有办法通过 javascript 检测到这一点以便我可以在清除类型关闭的情况下向正文添加现代化风格的类以便我可以在 CSS 中使用它在 IE 6
无法在 Firebase 中注册用户错误不变违规：“new NativeEventEmitter()”需要非空参数。，js 引擎：hermes

我正在尝试构建一个使用 React Native 创建的应用程序并且我使用了 react native firebase app 17 5 0 react native firebase auth 17 5 0 react native
在 Python 3 中导入 .dat 文件

我想导入一个 dat文件包括 lines header numbers lines 像这个例子 start using data to calculate something x y z g h 1 4 6 8 3 4 5 6 8 9 2
Chrome 中“transform-origin”无效？

我的 Chrome 控制台返回Invalid CSS property name to a transform origin站点加载时的 CCS 属性即使它可以工作并且我有一个 webkit 带前缀的版本目标 CSS 如下所示 webk
基于时间间隔 + 或 - 日期列表的子集 data.frame

我有一个大型 20 000 个 obs data frame 其中包含每小时值并按唯一 id 分组我还有一个日期列表每个日期都出现在 data frame 中我试图将日期与 data frame 匹配然后从匹配日期中提取或某个时
公共静态变量和Android Activity生命周期管理

根据文档 Android 操作系统可以终止后台堆栈后部的活动因此假设我有一个应用程序并打开主活动我们称之为活动 A 在这个公共活动类中我声明并初始化一个公共静态变量我们称之为 foo 然后在 Activity A 的 onCre
React 默认 create-react-app App 组件渲染两次

我通过命令启动了新的 React 项目 npx create react app my app template typescript 然后我将 App 组件更改为如下所示 import as React from react expor
Android - 将位图图像保存在移动存储上而不压缩

从远程 URL 保存位图图像的典型方法基于研究是 Bitmap bmImage null InputStream in new java net URL imageUrl openStream bmImage BitmapFactory
追加如果该项目不存在于另一个表中？

我有一个表记录源包含大量信息并且我有一个包含 1200 条记录的表我想将当前不存在的任何记录附加到此目标表包含 1200 条记录中我的附加项目的标准是 Not In TABLE To Work Item Number 问题是它
CSS 溢出会破坏 Galaxy Tab 上的点击事件

我觉得我错过了一些基本的东西 On 三星 Galaxy Tab 10 1 在其他 Android 设备上可能是这样不确定 Dolphin 或内置默认浏览器任何使用 overflow auto 或 overflow y auto 设置
JSLint：在定义之前使用

你好我有 3 个 javascript 文件 jquery js 实用程序 js file1 js 在 file1 js 我有 jQuery noConflict jQuery document ready function 我收到错误
如何修复 Mercurial 变更集注释中的错误？

有没有办法重写hg commit如果输入了错误的信息会出现消息吗当我们提交变更集时我们总是包含 Bug ID 例如 hg commit m Bug 14585 LastName field should be mandatory 但是
iterator.get_next() 导致在抛出 'std::system_error 实例后调用终止

我正在使用张量流训练 resNet50 使用具有以下属性的共享服务器 ubuntu 16 04 3 个 GTX 1080 GPU 张量流1 3 蟒蛇2 7 但总是在两个纪元之后在第三个纪元期间我遇到这个错误 terminate call

iterator.get_next() 导致在抛出 'std::system_error 实例后调用终止

iterator.get_next() 导致在抛出 'std::system_error 实例后调用终止 的相关文章

随机推荐

热门标签

iterator.get_next() 导致在抛出 'std::system_error 实例后调用终止的相关文章