TF2 对象检测 API：model_main_tf2.py - 验证丢失？

2024-04-11

过去两个月我一直在尝试训练一个对象检测模型，并最终通过以下方法成功了tutorial https://tensorflow-object-detection-api-tutorial.readthedocs.io/en/latest/.

这是我的colab https://colab.research.google.com/drive/1Dn3bgYkialkPXImM1XWaYqjgVNTGI9Fn?usp=sharing其中包含我所有的工作。

问题是，训练损失已显示出来，并且平均在下降，但验证损失却没有。

In the pipeline.config文件中，我确实输入了评估 TFRecord 文件（我假设它是验证数据输入），如下所示：

评估配置{

指标集：“coco_detection_metrics”

use_moving_averages: false

}

eval_input_reader {

label_map_path: "注释/label_map.pbtxt"

随机播放：假

纪元数：1

tf_record_input_reader {

input_path: "注释/test.record"

}

}

我通读了model_main_tf2.py https://github.com/tensorflow/models/blob/master/research/object_detection/model_main_tf2.py，它似乎在训练时不进行评估，而仅在提到 checkpoint_dir 时进行评估。

因此，我只能监控训练集上的损失，而不能监控验证集上的损失。

结果，我不知道过度拟合或拟合不足。

你们中有人成功地使用 model_main_tf2.py 来查看验证损失吗？

另外，如果能看到训练后的 mAP 分数那就太好了。

我知道 keras 训练允许在张量板上看到所有这些东西，但 OD API 似乎要困难得多。

感谢您抽出宝贵的时间，如果您仍然对某些事情感到困惑，请告诉我。

你必须打开另一个航站楼并运行这个命令

python model_main_tf2.py \
   --model_dir=models/my_ssd_resnet50_v1_fpn \
   --pipeline_config_path=models/my_ssd_resnet50_v1_fpn/pipeline.config \
   --checkpoint_dir=models/my_ssd_resnet50_v1_fpn

This API教程 https://tensorflow-object-detection-api-tutorial.readthedocs.io/en/latest/training.html#evaluating-the-model-optional关于该主题尚不清楚。我有完全相同的问题。

事实证明，评估过程不包含在训练循环中，您必须在parallel.

它会等待并说waiting for new checkpoint，这意味着您将开始以下培训：

python model_main_tf2.py --model_dir=models/my_ssd_resnet50_v1_fpn --pipeline_config_path=models/my_ssd_resnet50_v1_fpn/pipeline.config # note that the checkpoint_dir argument is not there

它将每隔一次运行评估eval_interval_secs在你的eval_config.

根据文档，评估指标将存储在 eval_0 目录中的检查点旁边，然后您可以在张量板上绘制该目录。

我确实同意这有点难以理解，因为它在文档中不是很清楚，而且也不是很方便，因为我必须分配另一个 GPU 来进行评估以避免 CUDA 内存不足问题。

祝你今天过得愉快

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

TF2 对象检测 API：model_main_tf2.py - 验证丢失？的相关文章

Keras ZeroDivisionError：整数除法或以零为模

我正在尝试使用 Keras 和 Tensorflow 实现卷积神经网络我有以下代码 from keras models import Sequential from keras layers import Conv2D MaxPoolin
在推送到容器注册表之前如何对构建的映像运行测试？

从 gitlab 文档中可以看出如何使用 kaniko 创建 docker 镜像 build stage build image name gcr io kaniko project executor debug entrypoint sc
如何检索分配给 Django 中的组的所有权限

我正在执行一项任务来检索分配给 Django 中的组的一组权限我可以使用以下代码获取创建的组但无法使用它来获取分配给它们的权限 from django contrib auth models import Group Permissio
绝对导入不起作用，但相对导入起作用

这是我的应用程序结构 foodo setup py foodo init py foodo py models py foodo foodo foodo py从导入类models py module from foodo models im
如何使用 python、openCV 计算图像中的行数

我想数纸张所以我正在考虑使用线条检测我尝试过一些方法例如Canny HoughLines and FLD 但我只得到处理过的照片我不知道如何计算有一些小线段就是我们想要的线我用过len lines or len contours
计算熊猫数据帧几个月的总和

我有一个 pandas 数据框如下所示 ID Year R1 R1 f KAR1 20201001 1 5 KAR1 20201101 2 6 KAR1 20201201 3 7 KAR1 20210101 4 8 KAR1 202102
检查子字符串是否在字符串列表中？

我之前已经找到了这个问题的一些答案但它们对于当前的Python版本来说似乎已经过时了或者至少它们对我不起作用我想检查字符串列表中是否包含子字符串我只需要布尔结果我找到了这个解决方案 word to check or wordlis
如果另一列中的值为空，则删除重复项 - Pandas

我拥有的 df Name Vehicle Dave Car Mark Bike Steve Car Dave Steve 我想从名称列中删除重复项但前提是车辆列中的相应值为空我知道我可以使用 df dropduplicates
从字典中绘制直方图

我创建了一个dictionary计算 a 中出现的次数list每个键的内容我现在想绘制其内容的直方图这是我想要绘制的字典的内容 1 27 34 1 3 72 4 62 5 33 6 36 7 20 8 12 9 9 10 6 11 5
一个类似 dict 的 Python 类

我想编写一个自定义类其行为类似于dict 所以我继承自dict 不过我的问题是我是否需要创建一个私有的dict我的成员 init 方法我不明白这个有什么意义因为我已经有了dict如果我只是继承自的行为dict 谁能指出为什么大多
Django 1.7 应用程序配置导入错误：没有名为 appname.apps 的模块

我正在尝试按照以下文档为我的一个名为文章的 Django 应用程序设置自定义应用程序配置https docs djangoproject com en dev ref applications https docs djangoproj
错误：尝试使用 scrappy 登录时出现 raise ValueError("No element found in %s" % response)

问题描述我想从我大学的bbs上抓取一些信息这是地址 http bbs byr cn http bbs byr cn下面是我的蜘蛛的代码 from lxml import etree import scrapy try from scra
预测测试图像时出现错误 - 无法重塑大小数组

我正在尝试使用 TensorFlow 和 Keras 在 Python 中进行图像识别并且我已经关注了下面的博客 https stackabuse com image recognition in python with tensorfl
如何全局安装 Python（开发）依赖项，以便我不必在每个 venv 中重新安装它们？

我希望在为每个项目创建的每个 venv 虚拟环境中都可以使用一些 Python 依赖项例如 black flake8 和 pytest 这可能吗如果可以如何实现我想安装这三个once在我的主要 Python 安装下我必须在启动新
操作错误：尝试在 ubuntu 服务器中写入只读数据库

我正在使用 FlaskApp 运行mod wsgi and apache2在 Ubuntu 服务器上我尝试运行烧瓶应用程序localhost成功然后部署到ubuntu服务器上但是当我尝试更新数据库时出现错误 Failed to up
更改用作函数全局作用域的字典

我想做一个 purePython 的装饰器其中一部分是能够有选择地禁止访问函数的全局范围有没有一种方法可以以编程方式更改哪个字典事物充当函数的全局外部作用域因此例如在下面我希望能够拦截对f in h并抛出错误但我想允许访问g因为
RuntimeError(f"目录 '{directory}' 不存在") RuntimeError: 目录 'app/static' 不存在

当我运行 server py 文件时出现错误 File C Users nawin AppData Local Programs Python Python38 lib site packages starlette staticfiles
在 for 循环中访问 itertools 产品的元素

我有一个列表列表是附加 itertools 产品的一些其他结果的结果我想要的是能够使用 for 循环访问列表列表中列表的每个元素但我无法访问所有元素我只能访问最后一个列表的元素结果是一个非常巨大的列表列表例如 1 2 4 3 6
有没有办法拉伸整个显示图像以适应给定的分辨率？

我最近一直在使用pygame制作游戏遇到了一个小问题基本上我希望能够将屏幕上的整个图像我已经传输到它的所有内容拉伸到用户将窗口大小调整到的分辨率我在 pygame 和堆栈溢出的文档中搜索了很多但我似乎找不到答案这可能吗我的
旧版本的 spaCy 在尝试安装模型时抛出“KeyError: 'package'”错误

我在 Ubuntu 14 04 4 LTS x64 上使用 spaCy 1 6 0 和 python3 5 为了安装 spaCy 的英文版本我尝试运行这给了我错误消息 ubun ner 3 NeuroNER master src pyt

随机推荐

onSaveInstanceState 会在返回堆栈中的片段上调用吗？

当 Activity 被销毁时 FragmentManager 返回堆栈中的每个片段是否都会调用 onSaveInstanceState 即使这些片段不可见这种行为正常吗 None
带有自签名证书的 Mongo URI

我正在尝试让 Mongo URI 连接与自签名证书一起使用命令行工作正常因此连接如下 mongo mongodb Qlik P email protected cdn cgi l email protection 27017 ssl s
我可以使用子模块制作 git 存储库的“深层副本”吗？

克隆整个项目及其所有子模块很容易 git clone recursive email protected cdn cgi l email protection homer powerplant git 但是如何创建一个克隆将所有这些子模
获取网格顶点的最佳方法 Three.js

我是 Three js 的新手所以也许我不会以最佳方式解决这个问题我创建的几何图形如下 const geo new THREE PlaneBufferGeometry 10 0 然后我对其进行旋转 geo applyMatrix new
GridSearchCV 在 scikit-learn 中的小数据集上速度极慢

这很奇怪我可以成功运行该示例grid search digits py 但是我无法对自己的数据进行网格搜索我有以下设置 import sklearn from sklearn svm import SVC from sklearn g
使用 MyBatis 动态选择 SQL 语句

我想在 Oracle 12g 数据库中使用 mybatis 进行动态 sql 语句我可以利用哈希映射来添加如下条件
Lighthouse：无法在本地主机上运行生成报告

正如标题所示我正在尝试为本地提供的 nuxt 应用程序生成报告如果我通过 DevTools 生成报告则需要非常长的时间并且给我的评分非常差与在部署的同一站点上生成报告相比如果我尝试使用灯塔扩展生成报告按钮将被禁用我是否会犯
如何制作跨越两列的情节图例

我正在使用绘图来绘制大量数据的比较描述每一行的字符串往往会变长所以我需要将它们设置为多行然而在许多情节中传说可能会消失在屏幕之外我想将图例分成两列有没有办法在情节上做到这一点看着help plotly graph objs
未捕获的异常“DOMException”，消息为“未找到错误”

基本上我正在为我的 CMS 编写一个模板系统我希望有一个模块化结构其中涉及人们放入以下标签
如何以正确的方式将很长的表格布局放入水平滚动视图中？

我尝试查看大量示例和帖子但没有一个符合我的问题我需要制作一个非常长水平的表格其中有很多列因此无法在单个屏幕中显示我不想弄乱桌子因为以这种方式展示我的桌子很重要我在下面粘贴了我的 XML 布局包括主要的重要的问题是如果我
Clojure：在 let 绑定中展开 var

我想在let不同功能的形式比方说 def common assign x 10 y 20 一种方法是用eval eval defn foo let common assign hello world balala 问题是现在你必须引用所有
需要采取的行动：您的应用不符合 Google Play 政策，解决方案是什么？

发现问题数据安全部分无效我们审核了您应用在 Play 管理中心内的数据安全部分发现它与应用收集和共享用户数据的方式之间存在差异所有应用程序都需要完成准确的数据安全部分披露其数据收集和共享实践即使您的应用程序不收集任何用户数据这
RichTextBox 控件中的表格损坏（自动换行）[重复]

这个问题在这里已经有答案了可能的重复为什么 Richtextbox 无法正确显示该表格 https stackoverflow com questions 1928853 why isnt the richtextbox display
在 R 中结合 head 和 tail 方法

我经常使用 R 包 utils 中的 head d 和 tail d 方法经常一个接一个所以我为这两个函数编写了一个简单的包装器 ht lt function d m 5 n m print the head and tail toge
限制从 AWS SQS 触发的 AWS Lambda 的并发调用（忽略保留并发）？

对我来说一开始这似乎是一个简单的用例但结果比我预期的要困难得多 Problem 我有一个 AWS SQS 作为作业队列触发工作线程 AWS Lambda 然而由于工作人员 lambda 共享不可扩展的资源因此将并发运行的 lamb
按列名称对矩阵进行排序

我有以下矩阵 z 0 1 2 3 4 5 8 9 11 12 15 16 17 1 0 9992149 0 0001345895 4 486317e 05 2 243158e 05 6 729475e 05 8 972633e 05 2 2
Android 谷歌地图无法获取连接工厂客户端

我们开始吧去掉问题中的多余部分现在我将添加你想要的任何内容请快点几个问题 1 更改这些行中的包名称
如何自动设置 Watchkit 应用程序目标的版本和内部版本号

Watchkit 应用程序和扩展的版本和内部版本号或版本和短版本必须设置为与包含应用程序相同的值我使用环境变量来设置应用程序版本Info plist在构建时动态地这对于 Watchkit 扩展也适用但不适用于 Watchkit 应
ID3v2.3：ETCO 框架事件格式澄清

根据非正式标准 https web archive org web 20220311010154 https id3 org id3v2 3 0 sec4 6 an ETCO框架是帧头十个字节后面是 a 时间戳格式一个字节接下来是
TF2 对象检测 API：model_main_tf2.py - 验证丢失？

过去两个月我一直在尝试训练一个对象检测模型并最终通过以下方法成功了tutorial https tensorflow object detection api tutorial readthedocs io en latest 这是我的c

TF2 对象检测 API：model_main_tf2.py - 验证丢失？

TF2 对象检测 API：model_main_tf2.py - 验证丢失？ 的相关文章

随机推荐

热门标签

TF2 对象检测 API：model_main_tf2.py - 验证丢失？的相关文章