运行时错误 - 张量的元素 0 不需要 grad 并且没有 grad_fn

2024-01-03

我正在使用 Unet 模型进行语义分割 - 我有一个自定义的图像数据集及其掩码，均为 .png 格式。我查看了在线论坛并尝试了一些东西，但没有多少效果？任何有关如何解决错误或改进代码的建议都会有所帮助。

model.eval()
with torch.no_grad():
    for xb, yb in val_dl:
        yb_pred = model(xb.to(device))
        # yb_pred = yb_pred["out"].cpu()
        print(yb_pred.shape)
        yb_pred = torch.argmax(yb_pred,axis = 1)     
        break
    
    print(yb_pred.shape)
    

criteron = nn.CrossEntropyLoss(reduction = 'sum')
opt = optim.Adam(model.parameters(), lr = 3e-4)

def loss_batch(loss_func, output, target, opt = None):
    loss = loss_func(output, target)
    
    if opt is not None:
        opt.zero_grad()
        loss.backward()
        opt.step()        
    return loss.item(), None

lr_scheduler = ReduceLROnPlateau(opt, mode = 'min', factor = 0.5, patience= 20, verbose = 1)

def get_lr(opt):
    for param_group in opt.param_groups:
        return param_group['lr']
    
current_lr = get_lr(opt)
print('current_lr = {}'.format(current_lr))


def loss_epoch(model, loss_func, dataset_dl, sanity_check = False, opt = None):
    running_loss = 0.0
    len_data = len(dataset_dl.dataset)
    
    for xb, yb in dataset_dl:
        xb = xb.to(device)
        yb = yb.to(device)
        
        # xb = torch.tensor(xbh, requires_grad=True)
                
        output = model(xb)
        
        loss_b, metric_b = loss_batch(loss_func, output, yb, opt)
        running_loss += loss_b
        if sanity_check is True:
            break
    loss = running_loss/float(len_data) 
    return loss, None

def train_val(model, params):
    num_epochs = params["num_epochs"]
    loss_func = params["loss_func"]
    opt = params["optimizer"]
    train_dl = params["train_dl"]
    val_dl = params["val_dl"]
    sanity_check = params["sanity_check"]
    lr_scheduler = params["lr_scheduler"]
    path2weights = params["path2weights"]
    
    loss_history = {"train": [],
                    "val": []}
    best_model_wts = copy.deepcopy(model.state_dict())
    best_loss = float('inf')
    
    for epoch in range(num_epochs):
        current_lr = get_lr(opt)
        print('Epoch {}/{}, current_lr = {}'.format(epoch, num_epochs - 1, current_lr))
        
        with torch.enable_grad():
            model.train()
            train_loss, _ = loss_epoch(model, loss_func, train_dl, sanity_check, opt)
        loss_history["train"].append(train_loss)
        model.eval()
        
        with torch.no_grad():
            val_loss, _ = loss_epoch(model, loss_func, val_dl, sanity_check, opt)
        loss_history["val"].append(val_loss)
        
        if val_loss < best_loss:
            best_loss = val_loss
            best_model_wts = copy.deepcopy(model.state_dict())
            torch.save(model.state_dict(), path2weights)
            print("copied best model weights!!")
    
        lr_scheduler.step(val_loss)
        if current_lr != get_lr(opt):
            print("Loading best model weights!!")
            model.load_state_dict(best_model_wts)
            print("train Loss: %.6f" %(train_loss))
            print("val_loss: %.6f" %(val_loss))
            print("-"*20)
            
        model.load_state_dict(best_model_wts)
        return model, loss_history, metric_history
    

path2models = "./models/"
if not os.path.exists(path2models):
    os.mkdir(path2models)
    
param_train = {
    "num_epochs": 10,
    "loss_func": criteron,
    "optimizer": opt,
    "train_dl": train_dl,
    "val_dl": val_dl,
    "sanity_check": False,
    "lr_scheduler": lr_scheduler,
    "path2weights": path2models + "weights.pt"
model, loss_hist, _ = train_val(model, param_train)

错误消息如下所示：

RuntimeError：张量的元素 0 不需要 grad 并且没有 grad_fn

这是回溯：

File "<ipython-input-108-1ef24c0b1593>", line 10, in <module>
    model, loss_hist, _ = train_val(model, param_train)

  File "<ipython-input-106-53830bafab8b>", line 27, in train_val
    val_loss, _ = loss_epoch(model, loss_func, val_dl, sanity_check, opt)

  File "<ipython-input-104-5fc229145602>", line 13, in loss_epoch
    loss_b, metric_b = loss_batch(loss_func, output, yb, opt)

  File "<ipython-input-100-68322a002c04>", line 6, in loss_batch
    loss.backward()

  File "C:\Users\W540\anaconda3\lib\site-packages\torch\tensor.py", line 198, in backward
    torch.autograd.backward(self, gradient, retain_graph, create_graph)

  File "C:\Users\W540\anaconda3\lib\site-packages\torch\autograd\__init__.py", line 100, in backward
    allow_unreachable=True)  # allow_unreachable flag

我不确定将哪个变量设置为 require_grad = True 或者我应该在哪里启用 grad...

你可以先试试这个loss.backward():

loss = Variable(loss, requires_grad = True)

或者，因为变量已从 PyTorch 中删除（仍然存在但已弃用），您可以简单地使用以下代码执行相同的操作：

loss.requires_grad = True

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Pytorch

semanticsegmentation

运行时错误 - 张量的元素 0 不需要 grad 并且没有 grad_fn 的相关文章

从正在运行的 python 脚本检测优化标志是否为 -O 或 -OO

有时我想生成一个子进程其优化标志与启动父进程时使用的优化标志相同我可以使用类似的东西 optimize not debug 但这样我就可以匹配两者 O and OO flags 是否有一些 python 内部状态包含该信息经过一番深
如何在Python中循环并存储自变量中的值

我对 python 很陌生所以这听起来可能很愚蠢我进行了搜索但没有找到解决方案我在 python 中有一个名为 ExcRng 的函数我可以对该函数执行什么样的 for 循环以便将值存储在独立变量中我不想将它们存储在列表中而是
Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法
Python 3 __getattribute__ 与点访问行为

我读了一些关于 python 的对象属性查找的内容这里 https blog ionelmc ro 2015 02 09 understanding python metaclasses object attribute lookup h
如何从 PyCharm 项目中获取我的“exe”[重复]

这个问题在这里已经有答案了通过 PyCharm 在 Python 上编写一些项目我想从中获取一个exe文件我尝试过另存为 gt XXX exe 但是当我尝试执行它时出现错误此类操作系统不支持该文件附注我有win7 x64 它
Python BeautifulSoup XML 解析

我编写了一个简单的脚本来使用 BeautifulSoup 模块解析 XML 聊天日志标准 soup prettify 工作正常只是聊天日志中有很多绒毛您可以在下面看到我正在使用的脚本代码和一些 XML 输入文件 Code import
PIL Image.size 返回相反的宽度/高度

使用PIL确定图像的宽度和高度在特定图像上幸运的是只有这一个但这很麻烦从 image size 返回的宽度高度是相反的图片 http storage googleapis com cookila 533ebf752b9d1f7c
Python igraph：从图中删除顶点

我正在使用安然电子邮件数据集并尝试删除没有 enron com 的电子邮件地址即我只想拥有安然电子邮件当我尝试删除那些没有 enron com 的地址时一些电子邮件由于某些原因被跳过下面显示了一个小图其中顶点是电子邮件地址这是
定义函数后对其进行修饰？

I think答案是否定的但我似乎找不到明确的说法我有以下情况 def decorated function function functools wraps function def my function print Hello s
Python：计算数据帧列中所有行中特定字符的实例数

我有一个包含列 toaddress ccaddress body 的数据框 df 我想迭代数据帧的索引以获取 toaddress 和 ccaddress 字段中电子邮件地址的最小最大和平均数量这是通过计算这两列中每个字段中的和的实
在可编辑的QSqlQueryModel中实现setEditStrategy

这是后续这个问题 https stackoverflow com questions 49752388 editable qtableview of complex sql query 在那里我们创建了 QSqlQueryModel 的可
为什么我用 beautifulSoup 刮的时候有桌子，但没有 pandas

尝试抓取条目页面转换为制表符分隔格式主要拉出序列和 UniProt 登录号当我跑步时 url www signalpeptide de index php sess m listspdb bacteria s details id 10
如何列出 python PDB 中的当前行？

在 perl 调试器中如果重复列出离开当前行的代码段可以通过输入命令返回到当前行点我无法使用 python PDB 模块找到任何类似的东西如果我list如果我自己离开当前行并想再次查看它似乎我必须记住当前正在执行的行号对我来说
conda-env list / conda info --envs 如何查找环境？

我一直在尝试 anaconda miniconda 因为我的用户使用随 miniconda 安装的结构生物学程序并且作者都没有 A 考虑到可能存在其他 miniconda 应用程序 B 他们的程序将在多用户环境中使用因此使用 Arch
查找给定节点的最高权重边

我在 NetworkX 中有一个有向图边缘的权重从 0 到 1 表示它们发生的概率网络连通性非常高所以我想修剪每个节点的边缘只保留最高概率的节点我不确定如何迭代每个节点并仅保留最高权重in edges在图中有没有一个networ
为什么我们应该在 def __init__(self, n) -> None: 中使用 -> ？

我们为什么要使用 gt in def init self n gt None 我读了以下摘录来自 PEP 484 https www python org dev peps pep 0484 the meaning of annotatio
如何禁止 celery 中的 pickle 序列化

Celery 默认使用 pickle 作为任务的序列化方法如中所述FAQ http ask github com celery faq html isn t using pickle a security concern 这代表一个安全漏
异步和协程与任务队列

我一直在阅读有关 python 3 中的 asyncio 模块的内容以及更广泛地了解 python 中的协程的内容但我不明白是什么让 asyncio 成为如此出色的工具我的感觉是你可以用协程做的所有事情通过使用基于多处理模块例如
Django South - 将 null=True 字段转换为 null=False 字段

我的问题是转变的最佳做法是什么null True场变成null False使用 Django South 的字段具体来说我正在与ForeignKey 你应该先写一个数据迁移 http south aeracode org docs t
无法在 Windows 10 上构建 Detectron2

尽管 Windows 上的 Detectron2 没有官方支持但有很多可用的说明我尝试按照这些说明进行操作但最终出现了相同的错误这是我的设置 OS Windows 10 专业版 19043 1466 微软视觉工作室 2019 CUD

随机推荐

使用逗号作为小数分隔符解析双精度的最佳方法？

因为comma https en wikipedia org wiki Comma用作小数点分隔符 https en wikipedia org wiki Decimal separator 这段代码抛出一个NumberFormatExce
Java 相当于 Python 列表

在 Python 中有一种称为列表的数据结构通过使用 Python 中的列表数据结构我们可以追加扩展插入删除弹出索引计数排序反转 Java 中有没有类似的数据结构我们可以像 Python List 一样获得所
sql查询添加列值

我想添加表的两列值并按降序排序例如 int id int test one int test 2 1 25 13 2 12 45 3 25 15 考虑到上表我想要一个 SQL 查询它给出如下结果 int id sum int test
我尝试从 laravel 7 升级到 laravel 9 但出现此错误：[重复]

这个问题在这里已经有答案了 macsidigital laravel api client 3 3 0 3 3 4 require macsidigital laravel oauth2 client 1 2 gt satisfiable
提醒表单中未保存的更改

我想在主文件中编写 Jquery 代码这样如果用户更改页面并且有任何未保存的更改用户应该收到警报我从中得到了一个答案 link https stackoverflow com questions 155739 detecting un
获取运行时缺少的依赖项的名称 - 找不到指定的模块

以下代码是我正在开发的插件系统的一部分基本上它会加载一个 DLL 如果失败则会显示一条错误消息 HMODULE loadPlugin LPTSTR path const auto module LoadLibraryEx path NU
Android 打开带有 ACTION_GET_CONTENT 结果的文件到不同的 Uri 中

I am trying to open files by using Intent ACTION GET CONTENT 根据 Android 版本设备品牌文件浏览器打开我得到以下结果从以下位置选择一个文件Downloads con
执行 bash 脚本时如何进入 Python virtualenv？

如果定义在 bash 脚本中使用哪个版本的 python 那么它将是 export PYTHON path python python 3 5 1 bin python 但对于 Python virtualenv 来说可以在命令行中执行这
我怎样才能捕捉到“Unicode非字符”警告？

我怎样才能捕捉到 Unicode非字符0xffff对于交换是非法的警告 usr bin env perl use warnings use 5 012 use Try Tiny use warnings FATAL gt qw all m
在 netcdf 文件中将时间轴单位从“年以来”更改为“天之后”

我有一个有人传给我的 netcdf 文件它使用自 DATE 以来的年数作为时间单位 double time time time standard name time time long name time time calendar
CMake如何检测更改的文件

我有一个 C C CMake 项目运行良好但是我有时会在时间略有不同的远程集群上重新构建这台机器运行 Linux 我正在使用make 我想知道是否有一些 make CMake 方法可以更改检测文件更改的方式例如MD5 或 di
为什么我收到“网站或应用程序上的数据泄露暴露了您的密码。Chrome 建议立即更改“SITENAME”上的密码。”

我创建了一个应用程序用 bcrypt 存储您的密码表单的输入类型是密码我不明白为什么我会收到此警报为什么我收到网站或应用程序上的数据泄露暴露了您的密码 Chrome 建议立即更改 SITENAME 上的密码 axios post
XML序列化结构

很抱歉无法更具体地表达标题但我只能通过举例来解释我正在尝试构建一个序列化为以下 XML 的类
使用 Azure Data Lake Analytics 与传统 ETL 方法的原因

我正在考虑使用我最近几周一直在研究的数据湖技术与我多年来一直使用的传统 ETL SSIS 场景进行比较我认为数据湖与大数据密切相关但是使用数据湖技术与 SSIS 之间的界限在哪里使用 Data Lake 技术处理 25MB 100M
全屏 Direct3D 应用程序中的 Web 浏览器

我需要在全屏 Direct3D 应用程序中拥有一个可以正常工作的 Web 浏览器例如当您加入服务器时 Valve 的基于源的游戏某种程度上会在 MotD 窗口中执行此操作关于去哪里看有什么建议吗第二人生使用 ubrowser
Flying Saucer 的 .NET 版本或端口

有没有类似的开源 NET项目或端口飞碟项目 http code google com p flying saucer which 使用 iText 将 HTML 渲染为 PDF http today java net pub a tod
sidekiq_mailer 尝试发送电子邮件时出错

我将 gem 添加到我的应用程序中sidekiq 2 15 0 和sidekiq mailer 0 0 6 当我尝试发送电子邮件时我收到 NoMethodError undefined method key for
Spring Boot使用多个数据源时如何设置多个连接池？

我有一个连接到两个独立数据库的 Spring Boot 应用程序一切正常我按照the docs https docs spring io spring boot docs current reference html howto dat
用于矩阵向量乘积的 Rcpp Parallel 或 openmp

我正在尝试对共轭梯度的朴素并行版本进行编程所以我从简单的维基百科算法开始我想改变dot products and MatrixVector产品通过其适当的并行版本 Rcppparallel 文档具有以下代码dot product使用并行
运行时错误 - 张量的元素 0 不需要 grad 并且没有 grad_fn

我正在使用 Unet 模型进行语义分割我有一个自定义的图像数据集及其掩码均为 png 格式我查看了在线论坛并尝试了一些东西但没有多少效果任何有关如何解决错误或改进代码的建议都会有所帮助 model eval with torch

运行时错误 - 张量的元素 0 不需要 grad 并且没有 grad_fn

运行时错误 - 张量的元素 0 不需要 grad 并且没有 grad_fn 的相关文章

随机推荐

热门标签