如何冻结设备特定的已保存模型？

2024-03-26

我需要冻结保存的模型以供服务，但某些保存的模型是特定于设备的，如何解决此问题？

with tf.Session(config=tf.ConfigProto(allow_soft_placement=True)) as sess:
    sess.run(tf.tables_initializer())

    tf.saved_model.loader.load(sess, [tag_constants.SERVING], saved_model_dir)
    inference_graph_def=tf.get_default_graph().as_graph_def()

    for node in inference_graph_def.node:
        node.device = ''

    frozen_graph_path = os.path.join(frozen_dir, 'frozen_inference_graph.pb')
    output_keys = ['ToInt64', 'ToInt32', 'while/Exit_5']
    output_node_names = ','.join(["%s/%s" % ('NmtModel', output_key) for output_key in output_keys])
    _ = freeze_graph.freeze_graph(
            input_graph=inference_graph_def,
            input_saver=None,
            input_binary=True,
            input_saved_model_dir=saved_model_dir,
            input_checkpoint=None,
            output_node_names=output_node_names,
            restore_op_name=None,
            filename_tensor_name=None,
            output_graph=frozen_graph_path,
            clear_devices=True,
            initializer_nodes='')
    logging.info("export frozen_inference_graph.pb success!!!")

Cannot assign a device for operation NmtModel/transpose/Rank: Operation was explicitly assigned to /device:GPU:4 but available devices are [ /job:localhost/replica:0/task:0/device:CPU:0, /job:localhost/replica:0/task:0/device:GPU:0, /job:localhost/replica:0/task:0/device:GPU:1, /job:localhost/replica:0/task:0/device:XLA_CPU:0, /job:localhost/replica:0/task:0/device:XLA_GPU:0 ]. Make sure the device specification refers to a valid device.
     [[node NmtModel/transpose/Rank (defined at /home/yongxian.zyx/alitranx4Corp/mtprime/transformer_sync/saved_model2frozen.py:16)  = Rank[T=DT_INT64, _device="/device:GPU:4"](NmtModel/Placeholder)]]

Caused by op u'NmtModel/transpose/Rank', defined at:
  File "/home/yongxian.zyx/alitranx4Corp/mtprime/transformer_sync/saved_model2frozen.py", line 55, in <module>
    absl_app.run(main)
  File "/home/yongxian.zyx/alitranx4Corp/.venv/lib/python2.7/site-packages/absl/app.py", line 300, in run
    _run_main(main, args)
  File "/home/yongxian.zyx/alitranx4Corp/.venv/lib/python2.7/site-packages/absl/app.py", line 251, in _run_main
    sys.exit(main(argv))
  File "/home/yongxian.zyx/alitranx4Corp/mtprime/transformer_sync/saved_model2frozen.py", line 50, in main
    saved_model2frozen(FLAGS.saved_model_dir, FLAGS.frozen_dir)
  File "/home/yongxian.zyx/alitranx4Corp/mtprime/transformer_sync/saved_model2frozen.py", line 16, in saved_model2frozen
    tf.saved_model.loader.load(sess, [tag_constants.SERVING], saved_model_dir)
  File "/home/yongxian.zyx/alitranx4Corp/.venv/lib/python2.7/site-packages/tensorflow/python/saved_model/loader_impl.py", line 197, in load
    return loader.load(sess, tags, import_scope, **saver_kwargs)
  File "/home/yongxian.zyx/alitranx4Corp/.venv/lib/python2.7/site-packages/tensorflow/python/saved_model/loader_impl.py", line 350, in load
    **saver_kwargs)
  File "/home/yongxian.zyx/alitranx4Corp/.venv/lib/python2.7/site-packages/tensorflow/python/saved_model/loader_impl.py", line 278, in load_graph
    meta_graph_def, import_scope=import_scope, **saver_kwargs)
  File "/home/yongxian.zyx/alitranx4Corp/.venv/lib/python2.7/site-packages/tensorflow/python/training/saver.py", line 1696, in _import_meta_graph_with_return_elements
    **kwargs))
  File "/home/yongxian.zyx/alitranx4Corp/.venv/lib/python2.7/site-packages/tensorflow/python/framework/meta_graph.py", line 806, in import_scoped_meta_graph_with_return_elements
    return_elements=return_elements)
  File "/home/yongxian.zyx/alitranx4Corp/.venv/lib/python2.7/site-packages/tensorflow/python/util/deprecation.py", line 488, in new_func
    return func(*args, **kwargs)
  File "/home/yongxian.zyx/alitranx4Corp/.venv/lib/python2.7/site-packages/tensorflow/python/framework/importer.py", line 442, in import_graph_def
    _ProcessNewOps(graph)
  File "/home/yongxian.zyx/alitranx4Corp/.venv/lib/python2.7/site-packages/tensorflow/python/framework/importer.py", line 234, in _ProcessNewOps
    for new_op in graph._add_new_tf_operations(compute_devices=False):  # pylint: disable=protected-access
  File "/home/yongxian.zyx/alitranx4Corp/.venv/lib/python2.7/site-packages/tensorflow/python/framework/ops.py", line 3440, in _add_new_tf_operations
    for c_op in c_api_util.new_tf_operations(self)
  File "/home/yongxian.zyx/alitranx4Corp/.venv/lib/python2.7/site-packages/tensorflow/python/framework/ops.py", line 3299, in _create_op_from_tf_operation
    ret = Operation(c_op, self)
  File "/home/yongxian.zyx/alitranx4Corp/.venv/lib/python2.7/site-packages/tensorflow/python/framework/ops.py", line 1770, in __init__
    self._traceback = tf_stack.extract_stack()

InvalidArgumentError (see above for traceback): Restoring from checkpoint failed. This is most likely due to a mismatch between the current graph and the graph from the checkpoint. Please ensure that you have not altered the graph expected based on the checkpoint. Original error:

Cannot assign a device for operation NmtModel/transpose/Rank: Operation was explicitly assigned to /device:GPU:4 but available devices are [ /job:localhost/replica:0/task:0/device:CPU:0, /job:localhost/replica:0/task:0/device:GPU:0, /job:localhost/replica:0/task:0/device:GPU:1, /job:localhost/replica:0/task:0/device:XLA_CPU:0, /job:localhost/replica:0/task:0/device:XLA_GPU:0 ]. Make sure the device specification refers to a valid device.
     [[node NmtModel/transpose/Rank (defined at /home/yongxian.zyx/alitranx4Corp/mtprime/transformer_sync/saved_model2frozen.py:16)  = Rank[T=DT_INT64, _device="/device:GPU:4"](NmtModel/Placeholder)]]

似乎某些模型是在多 GPU 中训练的，但导出到保存的模型时没有明确的设备信息。

我不确定是否有更好的方法来解决这个问题，但一种可能性是简单地编辑保存的型号信息以删除设备规格。下面的代码片段应该可以做到这一点，尽管您应该在使用之前备份保存的模型以防万一。

from pathlib import Path
import tensorflow as tf
from tensorflow.core.protobuf.saved_model_pb2 import SavedModel

# Read the model file
model_path = saved_model_dir
graph_path = Path(model_path, 'saved_model.pb')
sm = SavedModel()
with graph_path.open('rb') as f:
    sm.ParseFromString(f.read())
# Go through graph and functions to remove every device specification
for mg in sm.meta_graphs:
    for node in mg.graph_def.node:
        node.device = ''
    for func in mg.graph_def.library.function:
        for node in func.node_def:
            node.device = ''
# Write over file
with graph_path.open('wb') as f:
    f.write(sm.SerializeToString())

# Now load model as usual
# ...

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

tensorflowserving

如何冻结设备特定的已保存模型？的相关文章

Tensorflow：logits 和标签必须具有相同的第一维

我是张量流新手我想改编 MNIST 教程https www tensorflow org tutorials layers https www tensorflow org tutorials layers用我自己的数据 40x40 的图
在tensorflow .ckpt文件中使用预训练模型

我有一个 ckpt 文件我只想得到 cnn 的权重我已经从 ckpt 检查点文件中进行了训练 inception resnet v2 2016 08 30 import tensorflow as tf saver tf train S
张量流急切模块错误

我的操作系统是 Ubuntu 16 04 Python版本是3 5 张量流版本是14 0 当我尝试为 TF Eager 模块编写简单代码时 import tensorflow as tf import tensorflow contrib
访问 AWS 上的 Tensorboard

我正在尝试访问 AWS 上的 Tensorboard 这是我的设置张量板 tensorboard host 0 0 0 0 logdir train 在端口 6006 上启动 TensorBoard b 39 您可以导航到http 172
使用批量乘法的tensorflow的tensordot中的障碍

我正在张量流中实现 RBM 使用小批量实现参数更新存在障碍有2个张量第一个张量的形状是 100 3 1 第二个张量的形状是 100 1 4 数字 100 是批次大小所以我想将这些张量相乘得到 100 3 4 张量但是当我实现这样的
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
PIL.Image.open和tf.image.decode_jpeg返回值的区别

我使用 PIL Image open 和 tf image decode jpeg 将图像文件解析为数组但发现PIL Image open 中的像素值与tf image decode jpeg不一样为什么会出现这种情况 Thanks 代
阻止 TensorFlow 访问 GPU？ [复制]

这个问题在这里已经有答案了有没有一种方法可以纯粹在CPU上运行TensorFlow 我机器上的所有内存都被运行 TensorFlow 的单独进程占用我尝试将 per process memory fraction 设置为 0 但未成功
pip：需要将包名称tensorflow-gpu更改为tensorflow

我正在尝试将具有 GPU 支持的张量流安装到 conda 环境中我使用命令 pip install ignore installed upgrade https storage googleapis com tensorflow linu
如何手动计算分类交叉熵？

当我手动计算二元交叉熵时我应用 sigmoid 来获取概率然后使用交叉熵公式并平均结果 logits tf constant 1 1 0 1 2 labels tf constant 0 0 1 1 1 probs tf nn sigm
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
使用预训练的 word2vec 初始化 Seq2seq 嵌入

我对使用预训练的 word2vec 初始化tensorflow seq2seq 实现感兴趣我已经看过代码了嵌入似乎已初始化 with tf variable scope scope or embedding attention deco
使用大数据集在 Google Colab TPU 上训练 seq2seq 模型 - Keras

我正在尝试使用 Google Colab TPU 上的 Keras 训练用于机器翻译的序列到序列模型我有一个可以加载到内存中的数据集但我必须对其进行预处理才能将其提供给模型特别是我需要将目标单词转换为一个热向量并且在许多示例中我
TensorFlow 无法编译

尝试从源代码编译 TensorFlow 时出现以下错误任何想法都会有帮助 bazel out host bin solib local U S Stensorflow Spython Cgen Unn Uops Upy Uwrappers
Ray：如何在一个 GPU 上运行多个 Actor？

我只有一个 GPU 我想在该 GPU 上运行许多 Actor 这是我使用的方法ray 下列的https ray readthedocs io en latest actors html https ray readthedocs io en
错误：分配具有形状的张量时出现 OOM

在使用 Apache JMeter 进行性能测试期间我面临着初始模型的问题错误分配形状为 800 1280 3 和类型的张量时出现 OOM 通过分配器浮动在 job localhost replica 0 task 0 device

随机推荐

pdf-writer 无效的多字节字符 (US-ASCII) 期望 keywords_end 内容 = "%PDF-#{@version}\n%âãÏÓ\n" Rails 3

我在尝试运行的协作项目中遇到了 pdf writer gem 的问题我正在使用RVM Ruby 1 9 2p180 Rails 3 1 0 on Ubuntu 10 10 我创建了一个新的gemset使用 Bundler 安装所需的 ge
如何模拟 Object.getClass？

我正在开发一个 Java 项目想要为 DTO 中的 equals 方法编写单元测试在 equals 方法中有一个 getClass 方法由两个被测试对象调用我想模拟这个但我不知道它想要什么类型的对象我试过 when mockRo
带有窗口服务的网络打印

我有一个朋友用窗口窗体做了同样的事情我需要的是将其作为窗口服务 Window 服务程序打印控制器服务将用作中央打印机控制器根据情况我将打印作业发送到网络上的不同打印机打印机安装在USB上已经可以进行测试打印但是当我列出已安装
HttpContext.Current.User.Identity.Name 始终为 string.Empty

您好我使用自定义 MembershipProvider 我想在应用程序场景中知道当前用户名但是当我尝试访问 HttpContext Current User Identity Name 时它总是返回 string Empty if
限制事件队列中的事件

In a 最近的问题 https stackoverflow com questions 36492268 nodejs running out of memory processing csv files 我概述了在处理大量 csv 文件
用于搜索某个单词/字符串是否包含在实体字段之一的 JPQL 查询

基本上这类似于查看句子中是否存在某个单词有实体帖子 public class Post implements Serializable Id GeneratedValue strategy IDENTITY Column name po
将公式向下填充到列中的最后一行

我试图将单元格 M3 中的公式绘制到数据集的末尾我使用 L 列作为基础来确定最后一个包含数据的单元格我的公式是两个单元格的串联它们之间有一个文本逗号我的公式是 G3 L3 我希望Excel能画出这个公式单元格 M4 将是 G4 L
注释 Lambda 表达式的函数接口

Java 8 引入了两者拉姆达表达式 http docs oracle com javase tutorial java javaOO lambdaexpressions html and 类型注释 http docs oracle com
正斜杠还是反斜杠？

我希望分别向与我的程序不同的目录写入和读取文本文件当我指定要写入或读取的目录时是否应该使用正斜杠或反斜杠来标识文件路径使用正斜杠将使其与系统无关为了简单起见我会坚持这一点考虑使用java io File separator ht
如果在 JQuery 中未选中所有子节点，则取消选中父节点

如果所有子节点都未选中我想取消选中父节点 ul li li ul
判断服务器是否支持resume get请求

如何确定服务器是否支持恢复文件传输或获取请求我的想法是设置标头以在字节 2 而不是 0 处启动 get 请求如果给出正确的结果则立即关闭 http 请求但我想知道服务器对另一种探针的响应是否会向我透露此信息要探测服务器的下载恢复功
VB.Net Excel Automation如何处理敏感度标签

当我在 VB Net 中为用户创建 Excel 文件时当我尝试保存文件时出现错误当文件为只读时您无法执行此操作并且似乎是因为尚未选择敏感度标签我无法找到任何有关在执行 Excel 自动化时处理敏感度标签的文档因此我想知道是否有人
服务器端处理的数据表上的“列索引”

有谁知道如何添加列索引 to a 服务器端处理数据表 http www datatables net 基本上喜欢http www datatables net examples api counter columns html http w
用c#在asp.net中发送邮件脚本

请建议我一个代码发送邮件asp net 中的脚本C 我想建造调查表我想发送我的电子邮件 ID 上的所有信息包括附件主题和正文 try Assign a sender recipient and subject to new mail m
Windows XP 上的 Java 最大内存

我一直能够为在 32 位 Windows XP Java 1 4 1 5 和 1 6 上运行的 Java SE 分配 1400 MB 的空间 java Xmx1400m 今天我在使用 Java 1 5 16 和 1 6 0 07 的新 W
Javascript字符串nodejs流实现

我需要一个将数据发送到字符串的nodejs 流 http nodejs org api stream html 实现你认识什么人吗直接地说我正在尝试通过管道传输请求响应如下所示请求 http google com doodle p
检查字符串变量是否具有整数值

我正在开发一个项目允许孩子们向圣诞老人发送消息不幸的是如果他们在 AGE 字段中输入字符串而不是整数则程序会崩溃并返回 Conversion from string exampleString to type Double is n
使用 RSA AES 提供程序生成自签名 1024 位 X509Certificate2 时出现问题

我正在尝试使用以下命令生成 X509Certificate2 对象Microsoft AES 加密提供程序 https msdn microsoft com en us library windows desktop aa386979 28
.External2(C_dataviewer, x, title) 中的错误：无法启动数据查看器

在 R 中每次点击时都会出现以下错误View or data frame我不明白为什么事情发生得很突然 gt View Fhat all Error in External2 C dataviewer x title unable to
如何冻结设备特定的已保存模型？

我需要冻结保存的模型以供服务但某些保存的模型是特定于设备的如何解决此问题 with tf Session config tf ConfigProto allow soft placement True as sess sess run

如何冻结设备特定的已保存模型？

如何冻结设备特定的已保存模型？ 的相关文章

随机推荐

热门标签

如何冻结设备特定的已保存模型？的相关文章