Tensorflow：“GraphDef 不能大于 2GB。”分配变量后保存模型时出错

2024-02-28

我想用一个预训练的模型来热启动另一个有一点差异的模型。简而言之，我创建一个新模型，并使用预训练的模型权重分配具有相同名称的变量。但是，在保存模型时，出现错误。

Traceback (most recent call last): File "tf_test.py", line 23, in <module> save_path = saver.save(sess, "./model.ckpt") File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/training/saver.py", line 1308, in save self.export_meta_graph(meta_graph_filename) File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/training/saver.py", line 1331, in export_meta_graph graph_def=ops.get_default_graph().as_graph_def(add_shapes=True), File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/framework/ops.py", line 2268, in as_graph_def result, _ = self._as_graph_def(from_version, add_shapes) File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/framework/ops.py", line 2231, in _as_graph_def raise ValueError("GraphDef cannot be larger than 2GB.") ValueError: GraphDef cannot be larger than 2GB.

示例代码如下：

import tensorflow as tf
import numpy as np

v1 = tf.get_variable("L_enc", [400000, 1024])
v2 = tf.get_variable("L_dec", [400000, 1024])

init_op = tf.initialize_all_variables()

saver = tf.train.Saver(tf.all_variables())

with tf.Session() as sess:
  sess.run(init_op)
  for v in tf.trainable_variables():
    embedding = np.random.uniform(-1, 1, (400000, 1024))
    sess.run(v.assign(embedding))
  # Save the variables to disk.
  save_path = saver.save(sess, "./model.ckpt")
  print("Model saved in file: %s" % save_path)

法布里奇奥正确地指出 https://stackoverflow.com/a/42401742/3574081协议缓冲区的大小有 2GB 的硬性限制，但您可能想知道why你的程序达到了这个限制。问题源于这些行：

for v in tf.trainable_variables():
  embedding = np.random.uniform(-1, 1, (400000, 1024))
  sess.run(v.assign(embedding))

当执行命中时v.assign(embedding)，新节点将添加到 TensorFlow 图中。特别是，每个embedding数组被转换为tf.constant() https://www.tensorflow.org/api_docs/python/tf/constant张量，会很大（我估计大约 328MB）。

避免这种情况的最佳方法是使用以下命令将先前模型中的变量直接加载到新模型中：tf.train.Saver https://www.tensorflow.org/api_docs/python/tf/train/Saver。由于模型可能具有不同的结构，因此您可能需要指定从旧模型中的变量名称到新模型的映射。tf.Variable新模型中的对象。

解决问题的另一种方法是预先创建一个tf.placeholder() https://www.tensorflow.org/api_docs/python/tf/placeholderop 用于为每个变量分配一个值。这可能需要对实际代码进行更多重组，但以下内容对我有用：

v1 = tf.get_variable("L_enc", [400000, 1024])
v2 = tf.get_variable("L_dec", [400000, 1024])

# Define a separate placeholder and assign op for each variable, so
# that we can feed the initial value without adding it to the graph.
vars = [v1, v2]
placeholders = [tf.placeholder(tf.float32, shape=[400000, 1024]) for v in vars]
assign_ops = [v.assign(p) for (v, p) in zip(vars, placeholders)]

init_op = tf.global_variables_initializer()

saver = tf.train.Saver(tf.all_variables())

with tf.Session() as sess:
  sess.run(init_op)
  for p, assign_op in zip(placeholders, assign_ops):
    embedding = np.random.uniform(-1, 1, (400000, 1024))
    sess.run(assign_op, {p: embedding})

  # Save the variables to disk.
  save_path = saver.save(sess, "./model.ckpt")
  print("Model saved in file: %s" % save_path)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow：“GraphDef 不能大于 2GB。”分配变量后保存模型时出错的相关文章

如何计算总和的平方和？

我有一笔款项需要加快处理速度在一种情况下是 S x y k l Fu ku Fv lv Fx kx Fy ly 另一种情况是 S x y S k l Fu ku Fv lv Fx kx Fy ly 2 注意 S indices 是这些索引
用于在 Windows 中自动执行桌面活动的 Python 代码

我想使用 Python 在 Windows 环境中自动化桌面活动怎样才能做到呢一些例子也会有帮助我所说的桌面活动是指控制鼠标和键盘访问活动窗口属性双击桌面上的图标最小化和最大化窗口通过键盘向输入弹出窗口输入数据等操作看一下S
如何将一组重叠范围划分为不重叠范围？

假设您有一组范围 0 100 一 0 75 b 95 150 c 120 130 d 显然这些范围在某些点上重叠您将如何剖析这些范围以生成不重叠范围的列表同时保留与其原始范围相关的信息在本例中为范围后面的字母例如运行算法后的上述
无法在 python 中导入名称 GoogleMaps

我使用下面的代码来获取地址的纬度和经度 from googlemaps import GoogleMaps gmaps GoogleMaps api key address Constitution Ave NW 10th St NW Wa
Spark问题中读取大文件 - python

我已经使用 python 在本地安装了 Spark 并在运行以下代码时 data sc textFile C Users xxxx Desktop train csv data first 我收到以下错误 Py4JJavaError Tra
AttributeError：模块“pandas”没有属性“read_csv”Python3.5

我已经成功使用pandas read csv很久以来当我尝试读取 csv 文件时突然开始出现错误 df pd read csv file csv encoding utf 8 错误是 AttributeError module pand
如何使用scrapy抓取xml url

你好我正在使用 scrapy 来抓取 xml url 假设下面是我的 Spider py 代码 class TestSpider BaseSpider name test allowed domains www example com s
Twython - 如何使用媒体 url 更新状态

在我的应用程序中我允许用户在 Twitter 上发帖现在我想让他们通过媒体更新他们的状态 In twython py我看到一个方法update status with media从文件系统读取图像并上传到 Twitter 我的图像不在文
Scrapy 未通过请求回调从项目中的已抓取链接返回附加信息

基本上下面的代码会抓取表格的前 5 项其中一个字段是另一个 href 单击该 href 会提供更多信息我想收集这些信息并将其添加到原始项目中所以parse应该将半填充的项目传递给parse next page然后刮掉下一位并返回完成
使用 PRAW 帮助获取 Reddit 帖子链接到的 URL

我正在尝试使用 Praw 获取 Reddit 提交标题中链接的帖子例如提交 http www reddit com r AdviceAnimals comments 1adu71 apparently people still need
如何使用 tweepy 仅提取主题标签中的文本？

我想为我的情感分析项目提取主题标签但是我得到了一个字典列表其中包含所有主题标签及其在推文中的索引我只想要文字我的代码 data tweepy Cursor api search q since a i until b i items
Scrapy 仅抓取每个页面的第一个结果

我目前正在尝试运行以下代码但它只保留每个页面的第一个结果知道可能是什么问题吗 from scrapy contrib spiders import CrawlSpider Rule from scrapy contrib linkext
尽管 Matplotlib FuncAnimation(...,repeat=False) 保存的动画图不断循环

我想使用制作动画matplotlib进行 Powerpoint 演示动画应该只播放一次在我的代码中参数repeat of FuncAnimation 被设置为 false 因为我需要将图导入到powerpoint中所以我使用保存它a
如何从分组数据创建直方图

我正在尝试根据 pandas 中的分组数据创建直方图到目前为止我已经能够创建标准线图但我不知道如何做同样的事情来获取直方图条形图我想获得泰坦尼克号事故中幸存者和未幸存者的 2 个年龄直方图看看年龄分布是否存在差异来源数据 ht
Jupyter 笔记本中未显示绘图

我正在尝试为 Anscombe 数据集创建 2x2 图加载数据集并分离数据集中的每个类 import seaborn as sns import matplotlib pyplot as plt anscombe sns load dat
在 Python 中快速确定小于 10 亿的数字是否为素数

我目前在 python 中检查数字素数的算法对于 1000 万到 10 亿之间的数字来说速度很慢我希望它能够得到改进因为我知道我永远不会得到超过 10 亿的数字背景是我无法获得足够快的实现来解决项目 Euler 的问题 60 我在 7
仅获取图像中的外部轮廓

我有这段代码可以在图像中绘制轮廓但我只需要外部轮廓 import cv2 import numpy as np camino C Users Usuario Documents Deteccion de Objetos 123 jpg
在python中打开带有重音符号的文本文件

我尝试使用 Python 2 7 打开法语文本文件我使用了命令 f open textfr r 但是当我使用 f read 我失去了重音字符我明白了u J xc3 xa9tais xc3 xa0巴黎而不是J tais 巴黎等当在lin
如何在 VS Code 宏中将焦点返回到编辑器，将 Python 文本发送到调试控制台？

我尝试按键绑定宏以将 python 文本发送到调试控制台并将焦点返回到 Visual Studio Code 中的编辑器这是我尝试过的安装了vscode python https marketplace visualstudio com
从受密码保护的 Excel 文件到 pandas DataFrame

我可以使用以下命令打开受密码保护的 Excel 文件 import sys import win32com client xlApp win32com client Dispatch Excel Application print Exce

随机推荐

浏览器对 CSS :first-child 和 :last-child 的支持

有谁知道哪些浏览器版本支持它们使用它们是否安全或者我应该诉诸 PHP javascript 来生成第一个最后一个类 first child and last child http www quirksmode org css fir
PHP 5.3 中自动加载命名空间？

如何在 PHP 5 3 中使用 autoload 和命名空间我在与脚本分开的命名空间中有一个主要的自动加载函数我还调用具有不同名称空间的类这并不奇怪但是它没有找到自动加载功能我是否必须为每个命名空间重新创建自动加载函数这似乎不
“Office 2010 加载项：图标库” - 如何从后台选项卡中提取图标 (docx)

我下载了 Office 2010 加载项图标库 https www microsoft com en in download confirmation aspx id 21103 这是一个 docx 文件有两个包含图标的后台选项卡如何
在c#中将bool表达式转换为char

当我遇到如下问题时我通过了 NET 测验 Char ch Convert ToChar a e c a 在控制台中我们可以看到输出ch变量是g 有人可以描述发生了什么吗谢谢是二元或运算符 a binary representation
将重复值复制粘贴到大型 Excel 文件的列中

我遇到了一个问题希望得到一些帮助这是我现在正在处理的内容我想要的是 B C 和 D 列复制到其下面的空白行直到它到达新客户端如下所示非常感谢任何和所有的帮助 Thanks 非VBA解决方案 Select entire range
使用 jQuery 按住 Shift + 鼠标悬停

我试图检测当光标移动到特定元素上时是否按下了 Shift 键该函数会触发但仅after我首先单击另一个元素有什么方法可以解决这个问题吗我尝试将焦点设置为文档和元素并尝试创建伪单击功能但到目前为止没有任何效果例如以下代码仅在我
OpenCL clGetPlatformIDs 异常

我使用此包安装附带的示例中的 HelloWorld 示例 AMD 套件 http developer amd com tools and sdks heterogeneous computing amd accelerated parall
SQL 调用临时表中的最大行数

在临时表中只有两列可用我想获取每次加载的最新ID 如下图所示我已经尝试过但它没有给我我需要的答案 select max rn plus 1 a load a id from select a load a id ROW NUMBER
交互式 lua：命令行参数

我想做 lua prog lua arg1 arg2 从命令行在prog lua里面我想说比如 print arg1 arg2 n Lua 似乎没有 argv 1 等而且我见过的处理命令行参数的方法似乎不成熟和或麻烦我错过了什么
在 Express 中使用“jade”模板引擎时渲染“html”

你如何渲染一个html文件同时保持模板引擎为jade app set view engine jade 是我将模板引擎设置为jade我想做一些类似的事情 app get world function req res res render
Android：ScrollView 内的 HorizontalScrollView

我有多个水平滚动视图里面一个滚动视图水平滚动一点也不流畅我必须几乎完全水平滚动才能滚动才能工作有没有一个简单的修复方法可以调整这个谢谢您可以将 Recycler 视图与交错布局管理器一起使用 StaggeredGridLayout
如何为 TFS 上的 dockerized F# Expecto 测试配置 CI

我有一些码头化的由 Expecto 和 fscheck 框架编写的 F 测试作为 dotnet 核心独立可执行文件如何在 Team Foundation Server 上配置持续集成以运行它们并在每次运行后获取相应的报告如果您的意思是
Play Framework：合并多模块项目中的多个全局对象

我正在使用 Play 2 3 和 Java 8 构建一个多模块项目根应用程序和每个模块都有一个全局对象但我们如何知道 Play 仅使用根应用程序中的一个全局对象简化的文件夹结构 root app Global java conf ap
SAS 中的“auto.arima”？

我曾经使用 auto arima 在 R 中运行 arima 模型来识别适合数据的最佳 arima 模型即使没有它在 R 中编写一个函数来执行类似的任务也很容易然而我这几天google了一下在SAS中找不到类似的过程有谁知道SA
在Python中应用PMML预测模型

Knime 为我生成了PMML http en wikipedia org wiki Predictive Model Markup Language模型这时候我想把这个模型应用到一个python进程中这样做的正确方法是什么更深入我
在应用程序浏览器中将 Instagram 转义至 Safari

我的网站中有一个链接可以重定向到 Instagram 登录以获取一些照片但该页面无法在 iOS 设备上的 Instagram 应用内浏览器上运行我的想法是放置一个链接以便用户可以单击它并重定向到 safari 或默认浏览器中的页面
有没有一种好方法可以让 Map get 和 put 忽略大小写？ [复制]

这个问题在这里已经有答案了有没有好的方法可以有一个Map
如何使用离线设备捕获地理位置 - cordova

我正在使用 cordova 开发一个应用程序并发现需要获取用户的纬度和经度数据但我的应用程序将离线使用无需互联网访问我有两个问题 1 如何检查设备是否启用 GPS 2 如何在没有互联网连接的情况下离线获取纬度和经度这是可能的我会
在 React 中设置单选按钮值

我正在制作一个简单的反应应用程序其表单具有单选按钮这里有一个可用的默认数据例如 const defaultData ContactMode 3 ContactMode 2 ContactMode 2 要求 gt 需要迭代这个defau
Tensorflow：“GraphDef 不能大于 2GB。”分配变量后保存模型时出错

我想用一个预训练的模型来热启动另一个有一点差异的模型简而言之我创建一个新模型并使用预训练的模型权重分配具有相同名称的变量但是在保存模型时出现错误 Traceback most recent call last File tf t

Tensorflow：“GraphDef 不能大于 2GB。”分配变量后保存模型时出错

Tensorflow：“GraphDef 不能大于 2GB。”分配变量后保存模型时出错 的相关文章

随机推荐

热门标签

Tensorflow：“GraphDef 不能大于 2GB。”分配变量后保存模型时出错的相关文章