如何确定更快的 RCNN (PyTorch) 的验证损失？

2023-12-31

我按照本教程进行对象检测：https://pytorch.org/tutorials/intermediate/torchvision_tutorial.html https://pytorch.org/tutorials/intermediate/torchvision_tutorial.html

及其 GitHub 存储库，其中包含以下内容train_one_epoch and evaluate功能：

https://github.com/pytorch/vision/blob/main/references/detection/engine.py https://github.com/pytorch/vision/blob/main/references/detection/engine.py

但是，我想计算验证期间的损失。我这样做是为了评估损失，本质上是为了获得损失，model.train()需要开启：

@torch.no_grad()
def evaluate_loss(model, data_loader, device):
    val_loss = 0
    model.train()
    for images, targets in data_loader:
        images = list(image.to(device) for image in images)
        targets = [{k: v.to(device) for k, v in t.items()} for t in targets]

        loss_dict = model(images, targets)

        losses = sum(loss for loss in loss_dict.values())

        # reduce losses over all GPUs for logging purposes
        loss_dict_reduced = utils.reduce_dict(loss_dict)
        losses_reduced = sum(loss for loss in loss_dict_reduced.values())
        val_loss += losses_reduced
  
  validation_loss = val_loss/ len(data_loader)    
  return validation_loss

然后我将其放在 for 循环中的学习率调度程序步骤之后：

 for epoch in range(args.num_epochs):
        # train for one epoch, printing every 10 iterations
        train_one_epoch(model, optimizer, train_data_loader, device, epoch, print_freq=10)
    
        # update the learning rate
        lr_scheduler.step()

        validation_loss = evaluate_loss(model, valid_data_loader, device=device)

        # evaluate on the test dataset
        evaluate(model, valid_data_loader, device=device)

这看起来正确吗？或者它会干扰训练或产生不准确的验证损失吗？

如果可以，通过使用这个，是否有一种简单的方法可以应用提前停止验证损失？

我正在考虑在上面显示的评估模型函数之后添加类似的内容：

torch.save({
            'epoch': epoch,
            'model_state_dict': net.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'validation loss': valid_loss,
            }, PATH)

我还旨在在每个时期保存模型以用于检查点目的。但是，我需要确定保存“最佳”模型的验证“损失”。

所以事实证明，当 pytorch fastrcnn 没有任何阶段的回波损耗时model.eval()已设置。但是，您可以手动使用forward在评估模式下生成损失的代码：

from typing import Tuple, List, Dict, Optional
import torch
from torch import Tensor
from collections import OrderedDict
from torchvision.models.detection.roi_heads import fastrcnn_loss
from torchvision.models.detection.rpn import concat_box_prediction_layers
def eval_forward(model, images, targets):
    # type: (List[Tensor], Optional[List[Dict[str, Tensor]]]) -> Tuple[Dict[str, Tensor], List[Dict[str, Tensor]]]
    """
    Args:
        images (list[Tensor]): images to be processed
        targets (list[Dict[str, Tensor]]): ground-truth boxes present in the image (optional)
    Returns:
        result (list[BoxList] or dict[Tensor]): the output from the model.
            It returns list[BoxList] contains additional fields
            like `scores`, `labels` and `mask` (for Mask R-CNN models).
    """
    model.eval()

    original_image_sizes: List[Tuple[int, int]] = []
    for img in images:
        val = img.shape[-2:]
        assert len(val) == 2
        original_image_sizes.append((val[0], val[1]))

    images, targets = model.transform(images, targets)

    # Check for degenerate boxes
    # TODO: Move this to a function
    if targets is not None:
        for target_idx, target in enumerate(targets):
            boxes = target["boxes"]
            degenerate_boxes = boxes[:, 2:] <= boxes[:, :2]
            if degenerate_boxes.any():
                # print the first degenerate box
                bb_idx = torch.where(degenerate_boxes.any(dim=1))[0][0]
                degen_bb: List[float] = boxes[bb_idx].tolist()
                raise ValueError(
                    "All bounding boxes should have positive height and width."
                    f" Found invalid box {degen_bb} for target at index {target_idx}."
                )

    features = model.backbone(images.tensors)
    if isinstance(features, torch.Tensor):
        features = OrderedDict([("0", features)])
    model.rpn.training=True
    #model.roi_heads.training=True


    #####proposals, proposal_losses = model.rpn(images, features, targets)
    features_rpn = list(features.values())
    objectness, pred_bbox_deltas = model.rpn.head(features_rpn)
    anchors = model.rpn.anchor_generator(images, features_rpn)

    num_images = len(anchors)
    num_anchors_per_level_shape_tensors = [o[0].shape for o in objectness]
    num_anchors_per_level = [s[0] * s[1] * s[2] for s in num_anchors_per_level_shape_tensors]
    objectness, pred_bbox_deltas = concat_box_prediction_layers(objectness, pred_bbox_deltas)
    # apply pred_bbox_deltas to anchors to obtain the decoded proposals
    # note that we detach the deltas because Faster R-CNN do not backprop through
    # the proposals
    proposals = model.rpn.box_coder.decode(pred_bbox_deltas.detach(), anchors)
    proposals = proposals.view(num_images, -1, 4)
    proposals, scores = model.rpn.filter_proposals(proposals, objectness, images.image_sizes, num_anchors_per_level)

    proposal_losses = {}
    assert targets is not None
    labels, matched_gt_boxes = model.rpn.assign_targets_to_anchors(anchors, targets)
    regression_targets = model.rpn.box_coder.encode(matched_gt_boxes, anchors)
    loss_objectness, loss_rpn_box_reg = model.rpn.compute_loss(
        objectness, pred_bbox_deltas, labels, regression_targets
    )
    proposal_losses = {
        "loss_objectness": loss_objectness,
        "loss_rpn_box_reg": loss_rpn_box_reg,
    }

    #####detections, detector_losses = model.roi_heads(features, proposals, images.image_sizes, targets)
    image_shapes = images.image_sizes
    proposals, matched_idxs, labels, regression_targets = model.roi_heads.select_training_samples(proposals, targets)
    box_features = model.roi_heads.box_roi_pool(features, proposals, image_shapes)
    box_features = model.roi_heads.box_head(box_features)
    class_logits, box_regression = model.roi_heads.box_predictor(box_features)

    result: List[Dict[str, torch.Tensor]] = []
    detector_losses = {}
    loss_classifier, loss_box_reg = fastrcnn_loss(class_logits, box_regression, labels, regression_targets)
    detector_losses = {"loss_classifier": loss_classifier, "loss_box_reg": loss_box_reg}
    boxes, scores, labels = model.roi_heads.postprocess_detections(class_logits, box_regression, proposals, image_shapes)
    num_images = len(boxes)
    for i in range(num_images):
        result.append(
            {
                "boxes": boxes[i],
                "labels": labels[i],
                "scores": scores[i],
            }
        )
    detections = result
    detections = model.transform.postprocess(detections, images.image_sizes, original_image_sizes)  # type: ignore[operator]
    model.rpn.training=False
    model.roi_heads.training=False
    losses = {}
    losses.update(detector_losses)
    losses.update(proposal_losses)
    return losses, detections

测试这段代码给了我：

import torchvision
from torchvision.models.detection.faster_rcnn import FastRCNNPredictor

# load a model pre-trained on COCO
model = torchvision.models.detection.fasterrcnn_resnet50_fpn(pretrained=True)

# replace the classifier with a new one, that has
# num_classes which is user-defined
num_classes = 2  # 1 class (person) + background
# get number of input features for the classifier
in_features = model.roi_heads.box_predictor.cls_score.in_features
# replace the pre-trained head with a new one
model.roi_heads.box_predictor = FastRCNNPredictor(in_features, num_classes)
losses, detections = eval_forward(model,torch.randn([1,3,300,300]),[{'boxes':torch.tensor([[100,100,200,200]]),'labels':torch.tensor([0])}])

{'loss_classifier': tensor(0.6594, grad_fn=<NllLossBackward0>),
'loss_box_reg': tensor(0., grad_fn=<DivBackward0>),
 'loss_objectness': tensor(0.5108, grad_fn=<BinaryCrossEntropyWithLogitsBackward0>),
 'loss_rpn_box_reg': tensor(0.0160, grad_fn=<DivBackward0>)}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

deeplearning

Pytorch

ComputerVision

objectdetection

如何确定更快的 RCNN (PyTorch) 的验证损失？的相关文章

获取 pandas 中各列具有相同值的行

在 pandas 中给定一个 DataFrame D 1 2 3 0 apple banana banana 1 orange orange orange 2 banana apple orange 3 NaN NaN NaN 4 app
如何从Python中的阿拉伯字符串中删除英文文本？

我有一个带有英文文本和标点符号的阿拉伯字符串我需要过滤阿拉伯文本我尝试使用 sting 删除标点符号和英语单词但是我失去了阿拉伯语单词之间的空格我哪里错了 import string exclude set string punc
将 3d NumPy 数组重塑为 2d NumPy 数组时遇到问题

我正在研究图像处理问题我的数据以 3 维 NumPy 数组的形式呈现其中 x y z 条目是图像 z 的 x y 像素数值强度值有 100000 张图像每张图像为 25x25 因此数据矩阵的大小为 25x25x10000 我试图
有没有办法在 Altair 箱线图中格式化工具提示值

是否可以格式化箱线图工具提示中的值由此织女星文档 https vega github io vega lite docs boxplot html tooltip encoding channels 看起来是这样但我不太清楚如何使用 A
pandas DataFrame：获取上个月缺少交易且无法移位（）的值

有没有办法在不生成虚拟行的情况下实现这一点这是我的数据源 Group Store Month Revenue Group1 A 201611 10 Group1 A 201612 20 Group1 A 201701 30 Group1
numpy：与索引数组有效求和

假设我有 2 个矩阵 M 和 N 都有 gt 1 列我还有一个索引矩阵 I 有 2 列 1 列代表 M 一列代表 N N 的索引是唯一的但 M 的索引可能出现多次我想要执行的操作是 for i j in w M i N j 除了 fo
来自 Pandas DataFrame 的用户定义的 Json 格式

我有一个 pandas dataFrame 打印 pandas DataFrame 后结果如下所示 country branch no of employee total salary count DOB count email x a
为什么 Numpy 创建零数组比用零替换现有数组的值要快得多？

我有一个用于跟踪各种值的数组数组是2500x1700尺寸上所以不是很大在会话结束时我需要将该数组中的所有值重置为零我尝试创建一个新的零数组并将数组中的所有值替换为零并且创建一个全新的数组要快得多代码示例 for in sess
Python：当为变量分配新内容时，“旧”内存是否被释放？

如果为变量分配了任何新内容为旧内容分配的内存是否会正确释放例如在以下脚本中在为 a 分配一些新内容后变量 a 作为零数组的内存是否会被释放 import numpy a numpy zeros 1000 a a 1 我想象
忽略覆盖率报告中的空文件

覆盖率 py https github com nedbat coveragepy会包括 init py在其报告中并将其显示为 0 行但覆盖率为 100 我想从覆盖率报告中排除所有空白文件我不能只添加 init py to omit作为
无法解析 ReferenceProperty -- App Engine

我遇到了一个错误无法找出其根本原因错误如下 ReferenceProperty 无法解析 u StatusLog STATUSLOGSID 此错误仅有时发生大约一天一次或两次生成此错误的脚本成功的次数多于失败的次数该错误最奇怪的事
更改散景图中选项卡的样式

我想知道是否有办法更改散景图上生成的选项卡的属性诸如增加文本字体更改制表符宽度等更改以下是用于生成具有两个选项卡的绘图的简单代码 from bokeh models widgets import Panel Tabs from bok
Python 特征向量：numpy.linalg、scipy.linalg 和 scipy.sparse.linalg 之间的差异

Scipy 和 Numpy 具有三个不同的函数来查找给定方阵的特征向量它们是 numpy linalg eig a http docs scipy org doc numpy reference generated numpy linal
iter(fp.readline, '') 中的行而不是 fp 中的行：

我读了内置函数iter的例子在内置函数 Python 3 7 0 文档 https docs python org 3 library functions html iter with open mydata txt as fp for l
Pandas 对 HDFStore 中的大数据进行“分组”查询？

我有大约 700 万行HDFStore有60多个柱子数据超出了我的记忆能力我希望根据 A 列的值将数据聚合到组中 pandas 的文档分割聚合组合 http pandas pydata org pandas docs stable
我以为 Python 通过引用传递了所有内容？

采取以下代码 module functions py def foo input new val input new val module main py input 5 functions foo input 10 print input
python生成器太慢，无法使用它。我为什么要使用它？什么时候？

最近我收到一个问题哪一个是最快的 iterator list comprehension iter list comprehension and generator 然后编写简单的代码如下 n 1000000 iter a iter ra
使用 Python PuLP 混合整数规划的时间限制

我一直在使用PuLP http pythonhosted org PuLP 解决我感兴趣的特定混合整数线性规划 MIP 但是随着问题规模的增长 PuLP 花费的时间太长我希望能够运行求解器一段时间并在需要很长时间的情况下提前终止它并
使用自定义层运行 Keras 模型时出现问题

我目前正在攻读学士学位论文FIIT STU https www fiit stuba sk en html page id 749 其主要目标是尝试复制和验证以下结果study http arxiv org abs 2006 00885 这
Python tkinter：在组合框中使用“文本变量”似乎没用

使用textvariable在 tkinter 中创建组合框时的属性似乎完全没用有人可以解释一下目的是什么吗我查看了 Tcl 文档它说textvariable用于设置默认值但看起来在 tkinter 中您只需使用 set方法来做到这

随机推荐

JavaScript 和/或 jQuery 中的函数侦听器

想知道是否有一种优雅的方式来监听 JavaScript 和或 jQuery 中的函数而不是聆听 mything click function blah 我想听听特定功能何时被触发我不想编辑该函数因为它位于我不想直接破解的库中我确实
同步框架：可以通过 http 同步吗

我们计划使用 ADO NET 同步服务将商店与总部同步建议我通过WCF代理通过 WCF 代理同步是否意味着我能够通过 http 同步如果没有是否可以使用同步服务通过 http 进行同步我不想更新我们的firewall每次我们有一家
在 Android 上，如何在不使用 createBitmap() 和 copy() 的情况下将位图复制到另一个位图？

我有两个位图我在 onCreate 中创建它们 Bitmap bmp1 BitmapFactory decodeResource getResources id Bitmap bmp2 BitmapFactory decodeResour
ReadOuterXml 正在抛出 OutOfMemoryException 读取大型 (1 GB) XML 文件的一部分

我正在处理一个大型 XML 文件并在运行应用程序时 XmlTextReader ReadOuterXml 方法抛出内存异常代码行就像 XmlTextReader xr null try xr new XmlTextReader file
使用 squirrel.windows 部署 WPF 应用程序，并且程序和功能中没有 Windows 10 条目

目标是使用 squirrel windows 进行部署以便可以安装更新卸载并在 Windows 10 的程序和功能中查看它如果还添加了 MyApp msi 文件将是一个优点 Case 1 我使用 Nuget Package Expl
在 Java 中播放 .wav 歌曲？

我正在尝试在我的 Java 游戏中播放 wav 格式的歌曲以下是一些代码SoundPlayer class private static HashMap
如何在 JavaScript 中从字符串中提取数字？

我想从字符串中间取出一个数字JavaScript http en wikipedia org wiki JavaScript In Ruby http en wikipedia org wiki Ruby 28programming lan
URLRewriteFilter HTTP 到 HTTPS 规则返回 net::ERR_TOO_MANY_REDIRECTS

我在具有 SSL 证书的 EC2 ELB 后面使用 URLRewriteFilter 运行 Tomcat ELB 将流量从端口 80 和 443 重定向到后端实例中的端口 8080 URLRewriteFilter 有这样的规则
如何从 group by 生成 html 字符串

这是我的 Assinantes 班级的名单 new Assinante City BAURU Num 112 ClientCode 3123 Phone 1412345675 new Assinante City BAURU Num 45
使用 constructor-arg 字段填充 spring bean

如何使用该字段注入包含要用作附加构造函数参数的 Map 的属性文件从属性文件加载地图该 bean 当前使用以下方式设置
Android 工作室 |如何缩放 ToggleButton 中的图像？

我已经实现了 ToggleButton 以使用图像而不是文本但如何缩放它们我尝试过使用scaleType但不工作 ic toggle xml 我尝试过使用scaleType这里也一样但不起作用
除非还设置了字体大小，否则通过 style.font 设置 font-family 不起作用

我想通过一些 JavaScript 设置一些文本的字体由于某种原因似乎我只能在设置时这样做font size以及所以这有效 el style font 10px arial serif 但这并不 el style font arial
自动铸造

我必须编写获取数字的程序n来自用户然后计算总和 s 1 1 1 2 1 n 我写了这段代码 import java util Scanner public class Test public static void main String
将 Android 中的全局声音静音

是否有一种方法可用于使应用程序按钮的全局声音静音他们让事情变得比本来应该的更加复杂你可以只使用AudioManager setStreamMute http developer android com reference android
基于角色的 Spring Boot 的 Keycloak 不起作用，这些角色在 keycloak 中分配给用户

我已经配置了使用Keycloak无需使用弹簧适配器因为它已被弃用我在控制台中创建了Keycloak a REALM a user 并添加roles对于用户来说用户然后我创建了一个用户并向他添加了我之前在此处创建的角色 docker
发送和接收opencv图像烧瓶

我正在尝试从客户端向服务器发送和接收 openCV 图像并在处理后返回客户端我无法理解服务器发回的数据类型 Server from flask import Flask request Response send file import
SQL Server：分割记录

我有一个这样的表 account check1 check2 1 100 200 300 101 209 305 2 401 502 404 511 3 600 601 我想将记录分成这样的内容 account check1 check2
如何更新 mongoose 默认字符串架构属性修剪？

我希望每个字符串属性默认都设置为 true 有办法吗 mongoose Schema String gt default trim true var schema new Schema p1 type String p2 type Stri
pandas groupby 日期在一个季度内

我有两家公司的年末不同 1 31 和 12 31 我想获得各自季度发生的指标的平均值在此示例中我创建了一个 DataFrame 其中包含两家公司 2016 2017 年的 8 个季度末日期 comp1 pd date range 1 3
如何确定更快的 RCNN (PyTorch) 的验证损失？

我按照本教程进行对象检测 https pytorch org tutorials intermediate torchvision tutorial html https pytorch org tutorials intermediate

如何确定更快的 RCNN (PyTorch) 的验证损失？

如何确定更快的 RCNN (PyTorch) 的验证损失？ 的相关文章

随机推荐

热门标签

如何确定更快的 RCNN (PyTorch) 的验证损失？的相关文章