使用可用的训练挂钩在 tf.estimator.DNNRegressor 中实现提前停止

2024-01-08

我是张量流新手，想要实现提前停止tf.estimator.DNNRegressor带有可用的训练挂钩训练挂钩 https://www.tensorflow.org/api_guides/python/train#Training_Hooks对于 MNIST 数据集。如果在指定的步数内损失没有改善，早期停止钩子将停止训练。 Tensorflow 文档仅提供示例记录钩子 https://www.tensorflow.org/tutorials/layers#set_up_a_logging_hook。有人可以编写一个代码片段来实现它吗？

这里有一个EarlyStoppingHook示例实现：

import numpy as np
import tensorflow as tf
import logging
from tensorflow.python.training import session_run_hook


class EarlyStoppingHook(session_run_hook.SessionRunHook):
    """Hook that requests stop at a specified step."""

    def __init__(self, monitor='val_loss', min_delta=0, patience=0,
                 mode='auto'):
        """
        """
        self.monitor = monitor
        self.patience = patience
        self.min_delta = min_delta
        self.wait = 0
        if mode not in ['auto', 'min', 'max']:
            logging.warning('EarlyStopping mode %s is unknown, '
                            'fallback to auto mode.', mode, RuntimeWarning)
            mode = 'auto'

        if mode == 'min':
            self.monitor_op = np.less
        elif mode == 'max':
            self.monitor_op = np.greater
        else:
            if 'acc' in self.monitor:
                self.monitor_op = np.greater
            else:
                self.monitor_op = np.less

        if self.monitor_op == np.greater:
            self.min_delta *= 1
        else:
            self.min_delta *= -1

        self.best = np.Inf if self.monitor_op == np.less else -np.Inf

    def begin(self):
        # Convert names to tensors if given
        graph = tf.get_default_graph()
        self.monitor = graph.as_graph_element(self.monitor)
        if isinstance(self.monitor, tf.Operation):
            self.monitor = self.monitor.outputs[0]

    def before_run(self, run_context):  # pylint: disable=unused-argument
        return session_run_hook.SessionRunArgs(self.monitor)

    def after_run(self, run_context, run_values):
        current = run_values.results

        if self.monitor_op(current - self.min_delta, self.best):
            self.best = current
            self.wait = 0
        else:
            self.wait += 1
            if self.wait >= self.patience:
                run_context.request_stop()

这个实现是基于Keras 实现 https://github.com/tensorflow/tensorflow/blob/r1.6/tensorflow/python/keras/_impl/keras/callbacks.py.

与 CNN MNIST 一起使用example https://github.com/tensorflow/tensorflow/blob/r1.6/tensorflow/examples/tutorials/layers/cnn_mnist.py创建钩子并将其传递给train.

early_stopping_hook = EarlyStoppingHook(monitor='sparse_softmax_cross_entropy_loss/value', patience=10)

mnist_classifier.train(
  input_fn=train_input_fn,
  steps=20000,
  hooks=[logging_hook, early_stopping_hook])

Here sparse_softmax_cross_entropy_loss/value是该示例中损失操作的名称。

EDIT 1:

使用估计器时似乎没有“官方”方法来查找损失节点（或者我找不到它）。

For the DNNRegressor该节点有名称dnn/head/weighted_loss/Sum.

以下是如何在图中找到它：

在模型目录中启动tensorboard。就我而言，我没有设置任何目录，因此估算器使用临时目录并打印此行：
WARNING:tensorflow:Using temporary folder as model directory: /tmp/tmpInj8SC
启动张量板：
```
tensorboard --logdir /tmp/tmpInj8SC
```
Open it in browser and navigate to GRAPHS tab.
Find loss in the graph. Expand blocks in the sequence: dnn → head → weighted_loss and click on the Sum node (note that there is summary node named loss connected to it).
右侧信息“窗口”中显示的名称是所选节点的名称，需要传递给monitor参数pfEarlyStoppingHook.

的损失节点DNNClassifier默认情况下具有相同的名称。两个都DNNClassifier and DNNRegressor有可选参数loss_reduction影响丢失节点名称和行为（默认为losses.Reduction.SUM).

EDIT 2:

有一种不看图表就能找到损失的方法。
您可以使用GraphKeys.LOSSES收集以获得损失。但这种方式只有在训练开始后才有效。所以你只能在钩子中使用它。

例如，您可以删除monitor论证来自EarlyStoppingHook类并改变它的begin函数始终使用集合中的第一个损失：

self.monitor = tf.get_default_graph().get_collection(tf.GraphKeys.LOSSES)[0]

您可能还需要检查集合中是否存在丢失。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

neuralnetwork

使用可用的训练挂钩在 tf.estimator.DNNRegressor 中实现提前停止的相关文章

使用 Tensorflow 查找 2D 张量中的唯一值

tf unique 目前仅适用于一维张量如何在二维张量中找到唯一值 ip tf constant 1 2 1 3 4 1 5 6 1 1 2 1 op should be 1 2 1 3 4 1 5 6 1 2022年4月答复从 2 2
Keras 自定义损失函数：访问当前输入模式

在 Keras 带有 Tensorflow 后端中当前输入模式可用于我的自定义损失函数吗当前输入模式被定义为用于产生预测的输入向量例如请考虑以下情况 X train X test y train y test train test
如何将急切执行中的模型转换为静态图并保存在 .pb 文件中？

想象一下我有模型 tf keras Model class ContextExtractor tf keras Model def init self super init self model self get model def cal
Tensorflow：np数组的next_batch函数

我的火车数据为 xTrain numpy asarray 100 1 5 6 yTrain numpy asarray 200 2 10 12 如何定义 next batch size 方法以从训练数据中获取随机元素的 size 个数您可
神经网络的局部逆

我有一个带有 N 个输入节点和 N 个输出节点的神经网络可能还有多个隐藏层和循环但让我们先忘记这些神经网络的目标是学习一个N维变量Y 给定N维值X 假设神经网络的输出是Y 学习后应该接近Y 我的问题是是否有可能得到输出 Y 的神经网
了解 Tensorflow 中的 while 循环

我正在使用用于 Tensorflow 的 Python API https www tensorflow org api docs python 我正在努力实施罗森布罗克函数 https www sfu ca ssurjano rosen
tf.data.Dataset 迭代器返回 Tensor("IteratorGetNext:1", shape=(None, 16), dtype=int32) 但无法获取张量的值

我正在尝试编写一个自定义模型其中我正在编写一个自定义train step功能我正在从自定义数据生成器创建 tf data Dataset 例如 tds tf data Dataset from generator tdg iter ar
为什么在线预测失败并显示“无法从 feed 中获取元素作为字节”？

在线预测失败并显示无法从源中获取字节形式的元素这是什么意思以及如何解决它我使用以下代码生成预测 request data examples pickup longitude 73 885262 pickup latitude 40
如何制作 U 矩阵？

为了可视化一个 U 矩阵到底是如何构建的自组织映射 http en wikipedia org wiki Self organizing map 更具体地说假设我有一个 3x3 节点的输出网格已经经过训练我如何从中构造一个 U 矩阵
R中的神经网络包出现大错误

我正在尝试弄清楚如何使神经网络包发挥作用我用我创建的数据及其结果大约 50 行数据和三列第四列是我想要的结果它是通过简单的数学执行如对其他三列求和得出的进行了一些测试到目前为止一切顺利然后我决定将这个包应用到真实数据上我
tf.keras.utils.image_dataset_from_directory，但标签来自 csv？

请告诉我哪里出错了我正在研究 Kaggle 狗品种分类挑战我想尝试 one hot 编码与标签编码图像未在图像目录中拆分因此我无法将推断与 tf keras utils image dataset from directory
从tensorflow 2.0 beta中的tf.data.Dataset检索下一个元素

在tensorflow 2 0 beta之前要从tf data Dataset中检索第一个元素我们可以使用迭代器如下所示 usr bin python import tensorflow as tf train dataset tf
Keras Maxpooling2d 层给出 ValueError

我正在尝试在 keras 中复制 VGG16 模型以下是我的代码 model Sequential model add ZeroPadding2D 1 1 input shape 3 224 224 model add Convoluti
随机梯度下降可以与 TensorFlow 一起使用吗？

我设计了一个全连接 MLP 具有 2 个隐藏层和 1 个输出层如果我使用批量或小批量梯度下降我会得到一个很好的学习曲线 But a straight line while performing Stochastic Gradient D
我可以在反向传播期间（有选择地）反转 Theano 梯度吗？

我热衷于利用最近论文中提出的架构通过反向传播进行无监督域适应 http arxiv org pdf 1409 7495 pdf 在 Lasagne Theano 框架中这篇论文的有点不同寻常之处在于它包含了一个梯度反转层 invert
在 TensorFlow 中对伯努利随机变量进行采样

给定一个包含伯努利分布均值的一维张量如何使用给定的均值对相应的一维张量进行采样 TensorFlow 似乎只有random normal and random uniform实现的功能我可以使用一些复杂的东西例如 tf ceil tf
如何修复：AttributeError：模块“neat”没有属性“config”

我正在浏览使用发现的 NEAT 神经网络 API 玩 flappybird 的 AI 的指南当我运行从 Github 下载的代码时出现错误 Traceback most recent call last File test py lin
如何在Pycharm中运行Tensorflow GPU？

我想在 Linux Mint 上的 Pycharm 中运行 Tensorflow GPU 我尝试了一些像这样的指南 https medium com p venkata kishore install anaconda tenserflow
分布式张量流 tf.train.SyncReplicasOptimizer 似乎不同步

我使用两个工作程序副本和一个参数服务器喜欢 ps hosts hosta com 2222 worker hosts hosta com 2223 hostb com 2223 使用tf train SyncReplicasOptimi
如何在 Caffe 的网络中出现多次损失？

如果我在网络中定义多个损失层从这些末端到网络的开头是否会发生多个反向传播我的意思是他们真的是这样工作的吗假设我有这样的事情 Layer1 Layer2 Layer n Layer cls1 bottom layer n top cl

随机推荐

通过 Visual Studio 运行应用程序时出现“访问冲突”

当我从 Visual Studio 中运行命令行应用程序时一个命令总是失败并出现以下错误 The program 7316 MyProgram vshost exe has exited with code 1073741819 0xc0
如何删除文件夹中的所有文件，但不删除文件夹本身？

我尝试删除文件夹中的所有文件包括子目录 NSFileManager deleteMgr NSFileManager defaultManager NSString path test deleteMgr removeItemAtPath
UISearchBar纯色

我想要一个带有纯色而不是渐变的 UISearchBar 我有这个 UISearchBar mySearchBar UISearchBar alloc initWithFrame self tableView bounds mySearchB
MVC4 是否已融入 .NET 4.5？

Visual Studio 2012 的许多发行说明都谈到 NET 4 5 和 MVC4 但我无法判断 MVC4 是否实际上是 NET 4 5 版本的一部分有人确切知道吗我希望不必在我的服务器上单独安装 MVC 不 ASP NET MV
我应该使用什么列类型/长度来在数据库中存储 Bcrypt 哈希密码？

我想在数据库中存储散列密码使用 BCrypt 哪种类型比较合适哪种长度合适使用 BCrypt 散列的密码是否始终具有相同的长度 EDIT 哈希示例 2a 10 KssILxWNR6k62B7yiX0GAe2Q7wwHlrzhF3Lqt
调用基函数，然后调用继承函数

我有一个基类和一个继承基类的类基类有几个虚函数继承类可以重写这些虚函数但是基类中的虚拟函数具有必须在调用继承类重写之前运行的代码有什么方法可以让我先调用基类虚函数然后再调用继承的类重写无需调用base function 我知道
如何从XML文件读取数据并将其存储到数据库（MySQL）中？

我需要从 XML 文件获取数据并将其存储到 MySQL 数据库中我正在考虑使用 SAX 解析器来解析数据但我不确定如何将数据有效地存储到数据库中我正在考虑一些技术例如JDBC http en wikipedia org wiki J
Python、Selenium 和 Beautiful Soup for URL

我正在尝试使用 Selenium 编写一个脚本来访问 Pastebin 进行搜索并以文本形式打印 URL 结果我需要可见的 URL 结果仅此而已 div class gs bidi start align gs visibleUrl g
监控应用程序对 DLL 的调用

简而言之我想监视从应用程序到 DLL 的选定调用我们有一个旧的 VB6 应用程序我们丢失了它的源代码当时公司没有使用源代码控制此应用程序使用第 3 方 DLL 我想在新的 C 应用程序中使用这个 DLL 不幸的是 DLL API
如果存储过程中参数为空，则选择全部

我想在 SQL Server 中创建一个过程来选择并连接两个表参数 company from 和 to 始终被设置但 serie type 可以为NULL 如果 serie type不为NULL我只想包含指定的类型简单AND S Ty
我们什么时候应该将 String 更改为 Stringbuilder？

在应用程序中字符串是一种常用的数据类型我们知道字符串的突变会占用大量内存所以我们能做的就是使用 StringBuilder StringBuffer 但什么时候我们应该改用 StringBuilder 呢当我们必须拆分它或替换其中
使用 apache ant 构建时未找到属性“hardwareAccelerated”的资源标识符

我的应用程序针对 android API 级别 7 2 1 在 Eclipse 下一切正常生成的 APK 在 2 1 设备上也可以正常工作我尝试使用 apache ant 构建应用程序并收到此错误相同问题的所有解决方案都告诉我必须设置
YouTube API - 通过播放列表查询获取所有视频的标签

我正在查询 YouTube 频道以检索播放列表元数据如下所示 https www googleapis com youtube v3 playlistItems part snippet 2CcontentDetails maxResul
getEdgeFlags 总是返回 0？

为什么我无法获取getEdgeFlags 是否能够检测到边缘触摸我延长了DrawerLayout 然后做了 Override public boolean onInterceptTouchEvent MotionEvent ev int
有什么方法可以在 Swift 中逐渐加快游戏速度吗？

我目前正在使用 Spritekit 开发一款游戏游戏中的物体会在屏幕顶部产生并落向玩家角色当玩家角色与任何物体碰撞时游戏结束我正在尝试找到一种方法随着时间的推移逐渐加快游戏速度使游戏变得更加困难即游戏开始时物体以正常速度下落 5
php 会话在服务器中存储多长时间？

我想知道 php 会话在服务器内存中存储多长时间如果用户登录在服务器中设置会话变量并且他使浏览器长时间打开假设 30 天并且他在第 31 天重新加载页面该怎么办浏览器可以访问会话变量浏览器仍然有会话cookie 吗默认 p
如何在 Ubuntu 14.04 上安装 php7 (zts) + pthreads

我需要完整安装 PHP7 ZTS Pthreads 的帮助我已尝试以下安装但无法使其工作 sudo i apt get update apt get install y git bison autoconf build essential
transformClassesWithJarMergingForDebug，com.android.build.api.transform.TransformException：java.util.zip.ZipException：重复条目：

尝试在设备上运行应用程序时出现此错误但是gradle同步总是成功的错误任务执行失败 EmployeeManager transformClassesWithJarMergingForDebug gt com android build
Chrome/V8 不会垃圾收集循环引用吗？

看一下 Chrome 堆快照的这一部分它显示了堆中对象的保留器据我所知和所见该对象应该是垃圾但尽管如此该对象仍未被收集毕竟到根的最短路径是一条循环路径它实际上从未到达根这让人想知道快照查看器如何能够为其分配 12 的
使用可用的训练挂钩在 tf.estimator.DNNRegressor 中实现提前停止

我是张量流新手想要实现提前停止tf estimator DNNRegressor带有可用的训练挂钩训练挂钩 https www tensorflow org api guides python train Training Hooks对于

使用可用的训练挂钩在 tf.estimator.DNNRegressor 中实现提前停止

使用可用的训练挂钩在 tf.estimator.DNNRegressor 中实现提前停止 的相关文章

随机推荐

热门标签

使用可用的训练挂钩在 tf.estimator.DNNRegressor 中实现提前停止的相关文章