TensorFlow的静态图机制和Tensorboard中手动添加监控数据(scalar/simple_value...)的方法

2023-10-27

说明

本文将介绍如何向tensorboard中添加sclar的方法,但会先尽量简要介绍一下tensorflow的静态图机制,查看添加方法可以直接去这一部分

TensorFlow的静态计算图机制

关于并非众所周知的静态计算图,唯一能说的是,这肯定是TensorFlow不太容易上手的原因之一。与PyTorch的动态计算图的简洁直观不同,TensorFlow的静态图将计算图的定义与运行分开进行,导致读和写TF程序都很不直观。

整体流程为,先定义好网络结构,再分别定义好Loss函数和数据生成器(dataloader),然后再通过运行session的方法,向网络中送入数据并得到返回值;最后根据返回值计算Loss,并通过定义好的optimizer反传梯度(gradient),优化网络参数(weight)。

下面通过预测“超级英雄使用各自武器能完成到底多少任务”来简单讲一下静态计算图。

  • 首先我们按照需求定义好我们想要的网络结构,如各种Conv层,激活层,dense层等等;下面伪代码,定义了三位超级英雄,通过使用各自的武器完成了各自的任务,返回的是任务的完成度:
class Avengers(object):
    def __init__(self,a1,a2,a3):
        self.ironman = a1
        self.captain = a2
        self.thor = a3
    def __call__(self, suit, sheild, hammer):
        """similar to forward() function in PyTorch"""
        task1 = assign_weapon_and_perform_task(self.ironman, suit)
        task2 = assign_weapon_and_perform_task(self.captain, sheild)
        task3 = assign_weapon_and_perform_task(self.thor, hammer)
        return task1, task2, task3
    def assign_weapon_and_perform_task(self, hero, weapon):
        """This layer defines how the hero use weapon to perform a task"""
        # do some task, return percentage of the completion of the task
        return percent

  • 然后我们再组建一个复联队伍(将模型实例化):
def build_avengers_team(name1,name2, name3, w1, w2, w3):
    founder_avengers = Avengers(name1, name2,name3)
    task1, task2, task3 = founder_avengers(w1, w2, w3)
    return task1, task2, task3
  • 然后就可以在主函数中定义训练过程和Loss的计算。这里是静态图不直观的地方了,定义好的模型不是直接使用,而是通过运行session来送入数据和返回结果:
def Loss(task_pred, task_gt):
    loss_value = some_method_to_compute_loss(task_pred, task_gt)
    return loss_value
def train_avengers():
    num_epochs = 10
    w1, w2, w3, gt1, gt2, gt3 = predefined_data_iterator.get_next()
    t1, t2, t3 = build_avengers_team(tony, steve, thor, w1, w2, w3)
    loss1, loss2, loss3 = Loss(t1, gt1), Loss(task2, gt2), Loss(task3, gt3)
    optimizer   =
    loss_backprobgate_and_optimizer(loss1+loss2+loss3)
    with tf.Session() as sess:
        for i in range(num_epochs):
            t1, t2, t3 = sess.run(optimizer, t1, t2, t3, w1, w2, w3 )
            ...

可以发现, 所有的通过网络生成的数据就通过session的run取回了,后面可以再进行任何想要的操作。这里的session就是不直观的地方,原因就是建模型、数据生成和模型运行生成结果是分开的。

相当于,我们先在A地生产了汽车的外壳,在B地生产了轮胎,然后一起运送到C地组装并测试驾驶情况

Tensorboard中添加任意scalar

在TensorFlow 1.9以前的版本不能很方便地直接添加自己想要的scalar,也是要像上面定义模型和模型的返回值一样,先定义好summary的数据,然后传入session并取回;

通过阅读相当不完整的官方文档,可以发现也有办法手动添加scalar(或者其他数据结构,如simple_value, image,histogram等), 方法为自己手动将想要添加到tensorboard中监控的数据转换为tf.Summary格式的数据:

# official method
tf.summary.scalar("loss1", loss1)
tf.summary.scalar("loss2", loss2)
# 将merged_summary送入session.run中可以返回需要的数据
merged_summary = tf.summary.merge_all()
train_writer = tf.summary.FileWriter("/log_dir",sess.graph)

...
...

merged_summary, other_data =sess.run([merged_summary, other_data], feed_dict = {...})
# 官方添加监控信息方法
train_writer.add_summary(merged_summary, global_step)

...
...

# 手动添加数据: 将数据转换为tf.Summary格式
train_writer.add_summary(tf.Summary(value=[tf.Summary.Value(tag='name_you_want',simple_value=data_you_want)]),global_step)
train_writer.flush() # 写入文件

其中数据格式(simple_value这里可供替换的数据格式)可以参考源代码定义,是的,要参考源代码定义…

在tensorboard中同时显示多组数据(如train和validation同时显示)

需要建立多个writer,并放在不同文件夹中,尤其需要注意,在val_writer中不要再加sess.graph:

train_writer = tf.summary.FileWriter("/log_dir/tarin",sess.graph)
val_writer = tf.summary.FileWriter("/log_dir/val")

不同阶段产生的数据分开记录,比如training阶段产生的监控数据就用train_writer写入,validation同理;在查看监控数据的时候就在/log_dir根目录下执行:

tensorboard --log_dir='/log_dir'

这样就会在最终tensorboard中出现两组分别为trainval的数据了,并且可以通过勾选,将相同名字的数据显示在同一个表格上。

其他参考

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

TensorFlow的静态图机制和Tensorboard中手动添加监控数据(scalar/simple_value...)的方法 的相关文章

随机推荐

  • HBase 比较过滤器

    一 行过滤器 RowFilter 测试RowFilter过滤器 Test public void testRowFilter throws IOException Configuration conf HBaseConfiguration
  • echars-all.js 2.2.7组织结构图及自定义右键菜单的实现思路及源码

    组织结构图一般是树图结构 echars是一个很好的开源数据工具 2 x版本也有对树图的定义 要做组织结构图的需求拿到手里后 在网上也翻阅了很多echarts的官网资料及网友的实现思路 最终在网友及自身的努力下完成了这项任务 以上 先上最终结
  • Linux下gdb attach的使用(调试已在运行的进程)

    在Linux上 执行有多线程的程序时 当程序执行退出操作时有时会遇到卡死现象 如果程序模块多 代码量大 很难快速定位 此时可试试gdb attach方法 测试代码main cpp如下 这里为了使程序退出时产生卡死现象 在第51行时push线
  • 服务器连接超时是怎么回事呢?

    服务器连接超时就是在程序默认的等待时间内没有得到服务器的响应 网络连接超时可能的原因有那些呢 1 网络断开 不过经常显示无法连接 网络阻塞 导致你不能在程序默认等待时间内得到回复数据包 2 网络不稳定 网络无法完整传送服务器信息 系统问题
  • MySQL服务状态查看和监控方式

    运行中的MySQL状态查看可以通过以下方式进行监控和衡量不同指标 show global status like Uptime 服务器已运行的秒数 重启服务器后会置零 以下内容使用的Uptime均为此字段 1 QPS 每秒查询量 查询命令
  • WEB工程师和设计师必学的10个IOS 8新鲜改变

    概述 简介 iOS 8 上的 Safari 的更新 iPhone 6 和 iPhone 6 Plus 新 Api 支持 Safari 新功能和支持 iOS 8 原生优化 Safari 插件 新的设计 视频增强 iOS 8上的JS Bug 和
  • 【数学模型】基于Matlab模拟超市排队系统

    1 内容介绍 日常生活的超市购物中往往在收银台处排队等待 收银台过少 则会造成排队过长 收银台过多 又占用过多超市空间资源和人力资源 将整个超市购物过程所耗费的时间可抽象为若干个随机过程和排队系统 其中 消费者到达超市的时间是随机的 消费者
  • 学习Segformer语义分割模型并训练测试cityscapes数据集

    官方的segformer源码是基于MMCV框架 整体包装较多 自己不便于阅读和学习 我这里使用的是Bubbliiiing大佬github复现的segformer版本 Bubbliiiing大佬代码下载链接 https github com
  • QT 创建主窗口 MainWindow 实例

    1 2 mainwindow h ifndef MAINWINDOW H define MAINWINDOW H include
  • GMII,RGMII,SGMII,TBI,RTBI接口信号及时序介绍

    GMII RGMII SGMII TBI RTBI接口信号及时序介绍 千兆以太网MII接口类型主要有GMII RGMII SGMII TBI和RTBI 五种 GMII接 如下图 与MII接口相比 GMII的TX RX数据宽度由4位变为8位
  • XSSLab学习笔记-第1到5关

    写在最前面 仅供学习使用 前端三件套自学的不是很好 所以很多地方可能有点不清楚 有疑惑 请大佬带带 第一关 这关考察的是反射型xss 在这关学到的是在 h1 h1 等文本类标签里插入可以执行 只要没有额外条件过滤 观察网页和url可以看到n
  • numpy中的布尔型索引

    内容来自 利用Python进行数据分析 先创建一个names一维数组 再用numpy random中的randn函数生成一个7 4数组 gt gt names np array Bob Joe Will Bob Will Joe Joe g
  • 深圳 经济环境

    谁来锻造经济环境生态链条中的DNA 戴欣明走访深圳科技园 金融基地随想 现在有个现象不得不引起社会的深思 那就是满眼都是房地产 满地都是开发商 这在任何一个发达国家是不多见的 这起码可以说明 一方面是房地产的发展在未来有非常大的空间 另一方
  • U盘做启动盘之后容量变小了,咋办呢?

    有U盘的可能会遇到U盘容量不正常的情况 比如U盘做了启动盘后 U盘量产过 U盘用其他软件格式化过后导致U盘容量变小了 那么其他容量去哪里了呢 如果分成了2个区 那么为什么只识别一个呢 怎么才能恢复容量呢 一般U盘容量变小了 但实际上还是正常
  • IDM下载工具下载教程

    转自 13条消息 怎样通过其他下载工具下载某盘文件 发呆哥o o 的博客 CSDN博客
  • Qt多线程自定义结构体变量无法通过信号槽的方式传递的解决办法

    需要在子线程的头文件中包含 include
  • 用JS在html页面实现打印功能

    有时候我们做页面的时候 会要求有打印页面的按钮 而且有的时候会要求只打印页面中的某一部分而不是全打印 首先在head里面加入下面一段js代码
  • 七大常见排序,你究竟懂几个?(上)

    幼儿园的小朋友会排队做操 小学生们会排队打饭 大妈购物也会抢着 排队 付账 作为程序猿的你 会以下的排序算法吗 本节目标 1 排序的概念及意义 2 直接插入和希尔排序的实现及分析 3 直接选择和堆排序的实现及分析 首先我们先来看一下基本的七
  • 【UE4_笔记】————人物的基本移动

    人物的基本移动 1 键盘控制移动 2 鼠标控制视角 3 人物的转向 4 跳 说明 完成了人物的创建之后 接下来就是要完成人物的移动了 下面是我的丑丑的主角 1 键盘控制移动 1 编辑 项目设置 点击引擎列表中的输入 2 在轴映射中添加如下属
  • TensorFlow的静态图机制和Tensorboard中手动添加监控数据(scalar/simple_value...)的方法

    说明 本文将介绍如何向tensorboard中添加sclar的方法 但会先尽量简要介绍一下tensorflow的静态图机制 查看添加方法可以直接去这一部分 TensorFlow的静态计算图机制 关于并非众所周知的静态计算图 唯一能说的是 这