键盘中断张量流运行并在此时保存

2024-04-16

有没有办法通过键盘中断来中断张量流会话，并可以选择在此时保存模型？我目前让会话运行过夜，但需要停止它，以便我可以释放内存供电脑在白天使用。随着训练的进行，每个时期都会变慢，因此有时我可能需要等待几个小时才能进行程序中的下一个计划保存。我想要能够随时进入运行并从该点保存的功能。我什至不知道这是否可能。希望能得到指点。

一种选择是子类化tf.Session对象并创建一个__exit__当键盘中断通过时保存当前状态的函数。仅当新对象作为对象的一部分被调用时，这才有效。with block.

这是子类：

import tensorflow as tf

class SessionWithExitSave(tf.Session):
    def __init__(self, *args, saver=None, exit_save_path=None, **kwargs):
        self.saver = saver
        self.exit_save_path = exit_save_path
        super().__init__(*args, **kwargs)

    def __exit__(self, exc_type, exc_value, exc_tb):
        if exc_type is KeyboardInterrupt:
            if self.saver:
                self.saver.save(self, self.exit_save_path)
                print('Output saved to: "{}./*"'.format(self.exit_save_path))
        super().__exit__(exc_type, exc_value, exc_tb)

TensorFlow mnist 演练中的示例用法。

import tensorflow as tf
import datetime as dt
from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets('U:/mnist/', one_hot=True)
x = tf.placeholder(tf.float32, [None, 784])
W = tf.Variable(tf.zeros([784, 10]))
b = tf.Variable(tf.zeros([10]))
y = tf.matmul(x, W) + b
# Define loss and optimizer
y_ = tf.placeholder(tf.float32, [None, 10])
cross_entropy = tf.reduce_mean(
    tf.nn.softmax_cross_entropy_with_logits(labels=y_, logits=y))
train_step = tf.train.GradientDescentOptimizer(0.2).minimize(cross_entropy)

saver = tf.train.Saver()

with SessionWithExitSave(
        saver=saver, 
        exit_save_path='./tf-saves/_lastest.ckpt') as sess:
    sess.run(tf.global_variables_initializer())
    total_epochs = 50
    for epoch in range(1, total_epochs+1):
        for _ in range(1000):
            batch_xs, batch_ys = mnist.train.next_batch(100)
            sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})
        # Test trained model
        correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
        accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

        print(f'Epoch {epoch} of {total_epochs} :: accuracy = ', end='')
        print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_: mnist.test.labels}))
        save_time = dt.datetime.now().strftime('%Y%m%d-%H.%M.%S')
        saver.save(sess, f'./tf-saves/mnist-{save_time}.ckpt')

在从键盘发送中断信号之前，我让它运行 10 个纪元。这是输出：

Epoch 1 of 50 :: accuracy = 0.9169
Epoch 2 of 50 :: accuracy = 0.919
Epoch 3 of 50 :: accuracy = 0.9205
Epoch 4 of 50 :: accuracy = 0.9221
Epoch 5 of 50 :: accuracy = 0.92
Epoch 6 of 50 :: accuracy = 0.9229
Epoch 7 of 50 :: accuracy = 0.9234
Epoch 8 of 50 :: accuracy = 0.9234
Epoch 9 of 50 :: accuracy = 0.9252
Epoch 10 of 50 :: accuracy = 0.9248
Output saved to: "./tf-saves/_lastest.ckpt./*"
---------------------------------------------------------------------------
KeyboardInterrupt                         Traceback (most recent call last)
...
--> 768   elif item[0].cpp_type == _FieldDescriptor.CPPTYPE_MESSAGE:
    769     return item[1]._is_present_in_parent
    770   else:
KeyboardInterrupt:

事实上，我确实拥有所有保存的文件，包括发送到系统的键盘中断的保存。

import os

os.listdir('./tf-saves/')
# returns:
['checkpoint',
 'mnist-20171207-23.05.18.ckpt.data-00000-of-00001',
 'mnist-20171207-23.05.18.ckpt.index',
 'mnist-20171207-23.05.18.ckpt.meta',
 'mnist-20171207-23.05.22.ckpt.data-00000-of-00001',
 'mnist-20171207-23.05.22.ckpt.index',
 'mnist-20171207-23.05.22.ckpt.meta',
 'mnist-20171207-23.05.26.ckpt.data-00000-of-00001',
 'mnist-20171207-23.05.26.ckpt.index',
 'mnist-20171207-23.05.26.ckpt.meta',
 'mnist-20171207-23.05.31.ckpt.data-00000-of-00001',
 'mnist-20171207-23.05.31.ckpt.index',
 '_lastest.ckpt.data-00000-of-00001',
 '_lastest.ckpt.index',
 '_lastest.ckpt.meta']

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

键盘中断张量流运行并在此时保存的相关文章

如何在groupby之后将pandas数据框拆分为许多列

我希望能够在 pandas 中使用 groupby 按列对数据进行分组然后将其拆分以便每个组都是数据框中自己的列 e g time data 0 1 2 0 1 2 3 0 2 3 4 0 3 1 2 1 4 2 3 1 5 3 4 1
如何 json_normalize() df 中的特定字段并保留其他列？ [复制]

这个问题在这里已经有答案了这是我的简单示例我的实际数据集中的 json 字段非常嵌套因此我一次解压一层我需要在 json normalize 之后保留数据集上的某些列 https pandas pydata org docs ref
无法将 datetime.datetime 与 datetime.date 进行比较

我有以下代码并收到上述错误由于我是 python 新手我无法理解这里的语法以及如何修复错误 if not start or date lt start start date 有一个datetime date 从日期时间转换为日期的方法
为 PyCharm 中的所有配置设置相同的环境变量

我有一个与 Celery 和很多不同的工作人员一起的项目如何避免每次将 PyCharm 中的环境变量复制粘贴到每个运行调试配置有什么方法可以在项目设置中设置它们吗找到解决方案here https stackoverflow com
multiprocessing.freeze_support()

为什么多处理模块需要调用特定的function http docs python org dev library multiprocessing html multiprocessing freeze support在被冻结以生成 Wi
Python 相当于 Bit Twiddling Hacks 中的 C 代码？

我有一个位计数方法我正在尝试尽可能快地实现我想尝试下面的算法位摆弄黑客 http graphics stanford edu seander bithacks html CountBitsSetParallel 但我不知道 C 什么是
如何将同步函数包装在异步协程中？

我在用着aiohttp https github com aio libs aiohttp构建一个 API 服务器将 TCP 请求发送到单独的服务器发送 TCP 请求的模块是同步的对于我来说是一个黑匣子所以我的问题是这些请求阻塞了整
如何解码 dtype=numpy.string_ 的 numpy 数组？

我需要使用 Python 3 解码按以下方式编码的字符串 gt gt gt s numpy asarray numpy string hello nworld gt gt gt s array b hello nworld dtype S1
Pandas，按最大返回值进行分组 AssertionError：

熊猫有问题我想听听你的意见我有这个数据框我需要在其中获取最大值代码就在下面 df stack pd DataFrame 1 0 2016 0 NonResidential Hotel 98101 0 DOWNTOWN 47 6122
如何将reportlab与Google应用程序引擎一起使用

我无法在谷歌应用程序引擎下正确导入reportlab 根据以下guide http blog notdot net 2010 04 Generating PDFs on App Engine Python and introducing M
与函数复合 UniqueConstraint

一个快速的 SQLAlchemy 问题我有一个文档类其属性为数字和日期我需要确保没有重复的号码同年是有没有办法对数字年份日期进行UniqueConstraint 我应该使用唯一索引吗我如何声明功能部分 SQLA
从 Apache 运行 python 脚本的最简单方法

我花了很长时间试图弄清楚这一点我基本上正在尝试开发一个网站当用户单击特定按钮时我必须在其中执行 python 脚本在研究了 Stack Overflow 和 Google 之后我需要配置 Apache 以便能够运行 CGI 脚本
dask allocate() 或 apply() 中的变量列名

我有适用于pandas 但我在将其转换为使用时遇到问题dask 有一个部分解决方案here https stackoverflow com questions 32363114 how do i change rows and column
python csv按列转换为字典

是否可以将 csv 文件中的数据读取到字典中使得列的第一行是键同一列的其余行构成列表的值例如我有一个 csv 文件 strings numbers colors string1 1 blue string2 2 red string
DRF：以编程方式从 TextChoices 字段获取默认选择

我们的网站是 Vue 前端 DRF 后端在一个serializer validate 方法我需要以编程方式确定哪个选项TextChoices类已被指定为模型字段的默认值 TextChoices 类缩写示例 class PaymentM
Windows 与 Linux 文本文件读取

问题是我最近从 Windows 切换到 Ubuntu 我的一些用于分析数据文件的 python 脚本给了我错误我不确定如何正确解决我当前仪器的数据文件输出如下 Header 有关仪器等的各种信息 Data 状态代码温度字段等 0
SpaCy 中的自定义句子边界检测

我正在尝试在 spaCy 中编写一个自定义句子分段器它将整个文档作为单个句子返回我编写了一个自定义管道组件它使用以下代码来执行此操作here https github com explosion spaCy issues 1850 但
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
scrapy python 请求未定义

我在这里找到了答案 code for site in sites Link site xpath a href extract CompleteLink urlparse urljoin response url Link yield Re
Django - 缺少 1 个必需的位置参数：'request'

我收到错误 get indiceComercioVarejista 缺少 1 个必需的位置参数要求当尝试访问 get indiceComercioVarejista 方法时我不知道这是怎么回事 views from django ht

随机推荐

我的 Qt5 可执行文件无法在 Visual Studio 2010 之外运行

我用 Qt5 和 Visual Studio 2010 完成了一个大项目使用运行按钮一切都在 Visual Studio 内部但我的目标当然是在没有视觉工作室的情况下将其发布给其他人我的问题是我无法在 Visual Studio
Vue.js 中的 $t 是什么

第一次与Vue js并且不知道是什么 t 例如我有一个人的代码是这样的 li class category filter back li
如何使用 SVM 预测多类情感分析问题中的所有类？

好吧我正在制作一个情感分析分类器我有三个类别标签积极中性和消极我的训练数据的形状是 14640 15 其中 negative 9178 neutral 3099 positive 2363 我对数据进行了预处理使其标准化并将
如何使用swagger-codegen-maven-plugin生成spring cloud feign客户端

我想使用 swagger codegen 生成我的假客户端代码但我找不到可以引导我执行此操作的文档我有一个使用 spring cloud 的微服务几个使用 spring cloud feign 接口来请求数据的 api 服务我希望我
“require(x)”和“import x”之间的区别

我刚刚开始开发一个将与 MongoDB 交互的小型节点项目但是我似乎无法正确导入相关的节点模块即使我已经通过以下方式正确安装了它们npm 例如以下代码会抛出错误告诉我 express 没有默认导出 import express f
java中如何将一个线程与另一个线程连接起来？

我有一个主线程启动其他 10 个线程我希望只有在所有其他线程停止后主线程才会完成那么我应该在其他 10 个线程启动之前或启动之后调用 join 吗例如 in the main method of Main thread Thread
如何设置 nginx 以允许在 LAN 上使用 HTTP，并在外部连接上进行重定向和授权

我正在尝试为我在家庭服务器上运行的一些个人 Web 服务设置 Nginx 网络在服务器和互联网之间设置了路由器该路由器运行着动态 DNS 服务以便我可以在不在家时连接到它我希望 Nginx 能够处理来自本地网络的连接以便它能够通过以
为一个参数指定多个接口

我有一个实现两个接口的对象接口是 public interface IObject string Name get string Class get IEnumerable
像 c# 中的列表一样用括号初始化元素

我正在考虑数组和列表想知道类是否以及如何获得像它们一样可初始化的实现让我们以这个类为基础 class TestClass private List
Symfony 2.* 中漂亮的转储变量/对象？

在开发东西时我需要输出某个实例的状态以便检查它在使用 CakePHP 时我总是有一个 debug 函数它在 html 元素内执行某种 var dump 因此内容是可读的 Symfony 2 x 中也有类似的东西吗 exit Doct
没有权限从任务计划程序写入文件？

我得到了一个批处理文件它将运行 C 程序并输出到带有 gt 重定向的文件该文件将由任务调度程序运行我发现当从任务计划程序运行批处理文件时它声称访问被拒绝批处理文件运行良好直到到达 gt 重定向部分我看到整个批次可以在没有 g
XCode - 架构 armv7 arm64 的未定义符号

我参与了一个较旧的项目该项目需要为其使用的扫描仪更新 SDK 新的 SDK 已支持 64 位因此应用程序需要更新 SDK是通过拖放到项目中安装的但之后在构建时出现以下错误注意我收到一个错误指的是arm64但这目前说armv7因为
是否可以托管 Java Web 服务而不将其部署在 Tomcat/JBoss 等服务器上？

据我所知需要 Apache Tomcat 或像 JBoss 这样的应用服务器来部署和运行用 java 实现的 Web 服务我的经理问我是否有其他方法可以在不配置或设置 Apache Tomcat JBoss 的情况下部署 Web 服务
即使在 .NET 4.5 中，ObservableCollection 也不是线程安全的？

这几天我一直在用头撞虚拟墙 BindingOperations EnableSynchronization 方法似乎仅在 NET 4 5 中部分工作我写了一个有时会失败的测试 object blah new object Applicat
Pycharm错误：无法确定模块类型（“WEB_MODULE”）

我正在使用 Pycharm Professional 4 5 4 开发一个 javascript 项目在浏览器中打开该项目时发现一些奇怪的行为项目结构是这样的 MyProject data images python etc webap
为什么不是 obj.style.left = "200px";在这段代码中工作？

为什么不会 style top 200px 在这段代码中工作使用以下方式调用元素内的事件oclick this style left 200px 也不行 div The Div div
如何更改 php 错误电子邮件的主题？

我有以下内容 error log big error 1 my email address 消息发送后主题行中会显示 PHP error log message 有人可以告诉我如何自定义消息主题吗 error log Error mess
如何在Python 3.6中安装Keras？

我在安装 Python 3 6 的 Keras 库时遇到问题每当我尝试安装 Keras 时它都会抛出错误当我在互联网上搜索时 Keras 已发布到 Python 3 5 有人有解决方案吗如果您有 Anaconda 和 Python
当启用删除、插入或更新操作时，LinqDataSource 不支持 Select 属性

我在单击删除按钮链接时收到此错误GridView控制 LinqDataSource DataSource 不支持 Select 属性删除插入或更新操作已启用我真的不明白为什么会收到此错误因为我已经在网站的不同网页上做了同样的事情
键盘中断张量流运行并在此时保存

有没有办法通过键盘中断来中断张量流会话并可以选择在此时保存模型我目前让会话运行过夜但需要停止它以便我可以释放内存供电脑在白天使用随着训练的进行每个时期都会变慢因此有时我可能需要等待几个小时才能进行程序中的下一个计划保存我想要

键盘中断张量流运行并在此时保存

键盘中断张量流运行并在此时保存 的相关文章

随机推荐

热门标签

键盘中断张量流运行并在此时保存的相关文章