如何使用pytorch构建多任务DNN，例如超过100个任务？

2024-04-29

下面是使用 pytorch 为两个回归任务构建 DNN 的示例代码。这forward函数返回两个输出（x1，x2）。用于大量回归/分类任务的网络怎么样？例如，100 或 1000 个输出。对所有输出（例如 x1、x2、...、x100）进行硬编码绝对不是一个好主意。有一个简单的方法可以做到这一点吗？谢谢。

import torch
from torch import nn
import torch.nn.functional as F

class mynet(nn.Module):
    def __init__(self):
        super(mynet, self).__init__()
        self.lin1 = nn.Linear(5, 10)
        self.lin2 = nn.Linear(10, 3)
        self.lin3 = nn.Linear(10, 4)

    def forward(self, x):
        x = self.lin1(x)
        x1 = self.lin2(x)
        x2 = self.lin3(x)
        return x1, x2

if __name__ == '__main__':
    x = torch.randn(1000, 5)
    y1 = torch.randn(1000, 3)
    y2 = torch.randn(1000,  4)
    model = mynet()
    optimizer = torch.optim.Adam(model.parameters(), lr=0.001, weight_decay=1e-4)
    for epoch in range(100):
        model.train()
        optimizer.zero_grad()
        out1, out2 = model(x)
        loss = 0.2 * F.mse_loss(out1, y1) + 0.8 * F.mse_loss(out2, y2)
        loss.backward()
        optimizer.step()

您可以（并且应该）使用nn容器 https://pytorch.org/docs/stable/nn.html#containers例如nn.ModuleList https://pytorch.org/docs/stable/nn.html#modulelist or nn.ModuleDict https://pytorch.org/docs/stable/nn.html#moduledict管理任意数量的子模块。

例如（使用nn.ModuleList https://pytorch.org/docs/stable/nn.html#modulelist):

class MultiHeadNetwork(nn.Module):
    def __init__(self, list_with_number_of_outputs_of_each_head):
        super(MultiHeadNetwork, self).__init__()
        self.backbone = ...  # build the basic "backbone" on top of which all other heads come
        # all other "heads"
        self.heads = nn.ModuleList([])
        for nout in list_with_number_of_outputs_of_each_head:
            self.heads.append(nn.Sequential(
              nn.Linear(10, nout * 2),
              nn.ReLU(inplace=True),
              nn.Linear(nout * 2, nout)))

    def forward(self, x):
        common_features = self.backbone(x)  # compute the shared features
        outputs = []
        for head in self.heads:
            outputs.append(head(common_features))
        return outputs

请注意，在此示例中，每个头比单个头更复杂nn.Linear layer.
不同“头”的数量（以及输出的数量）由参数的长度决定list_with_number_of_outputs_of_each_head.

重要的提醒：使用是至关重要的nn容器 https://pytorch.org/docs/stable/nn.html#containers，而不是简单的 pythonic 列表/字典来存储所有子模块。否则 pytorch 将难以管理所有子模块。
参见，例如，这个答案 https://stackoverflow.com/a/59279872/1714410, 这个问题 https://stackoverflow.com/q/54678896/1714410 and this one https://stackoverflow.com/q/57320958/1714410.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用pytorch构建多任务DNN，例如超过100个任务？的相关文章

如何训练具有 2D 输出的网络？（蟒蛇，凯拉斯）

我想训练一个回归网络其输出是两个坐标 x1 y1 和 x2 y2 我的问题是如果我想训练网络我的输出应该分开吗我的意思是我的输出应该是这样的 x1 y1 x2 y2 或者有没有办法将它们堆叠起来例如 x1 y1 x2 y2 提前致
Pytorch ValueError：优化器得到一个空参数列表

当尝试创建神经网络并使用 Pytorch 对其进行优化时我得到了 ValueError 优化器得到一个空参数列表这是代码 import torch nn as nn import torch nn functional as F fro
现代 CNN（卷积神经网络）作为 DetectNet 旋转不变吗？

众所周知用于目标检测的 nVidia DetectNet CNN 卷积神经网络基于 Yolo DenseBox 的方法 https devblogs nvidia com parallelforall deep learning obj
用于多输入图像的 VGG16 网络

我正在尝试将 VGG16 网络用于多个输入图像使用具有 2 个输入的简单 CNN 训练该模型给了我一个 acc 大约 50 这就是为什么我想使用 VGG16 这样的既定模型进行尝试这是我尝试过的 imports from keras a
如何使用 TensorFlow 设置 Udacity 深度学习课程的学习环境 (Windows)

相信很多对深度学习感兴趣的人都听说过这门课程 https www udacity com course deep learning ud730 https www udacity com course deep learning ud730
检查输入时出错：预期 conv2d_1_input 有 4 个维度，但得到形状为 (800, 1000) 的数组

我正在尝试使用 CNN 进行情感分析我的代码我的数据具有 1000 1000 形状当我将数据传递给 convolution2D 时它会抛出一个错误我无法解决我尝试了以下解决方案但仍然面临问题在构建 CNN 时我收到 Kera
Pytorch CUDA 错误：没有内核映像可用于在带有 cuda 11.1 的 RTX 3090 设备上执行

如果我运行以下命令 import torch import sys print A sys version print B torch version print C torch cuda is available print D torc
如何加载 caffe 模型并转换为 numpy 数组？

我有一个 caffemodel 文件其中包含 ethereon 的 caffe tensorflow 转换实用程序不支持的层我想生成我的咖啡模型的 numpy 表示我的问题是如何将 caffemodel 文件我还有 prototx
torch.stack() 和 torch.cat() 函数有什么区别？

OpenAI 的强化学习 REINFORCE 和 actor critic 示例具有以下代码加强 https github com pytorch examples blob master reinforcement learning r
计算 scikit-learn 逻辑回归模型的残差偏差

有没有办法计算残差scikit learn 逻辑回归模型 http scikit learn org stable modules generated sklearn linear model LogisticRegression html
Google Colab：为什么 CPU 比 TPU 快？

我正在使用 Google colabTPU训练一个简单的Keras模型删除分布式strategy并在CPU比TPU 这怎么可能 import timeit import os import tensorflow as tf from sk
Scikit-learn 具有使用“特征”的自定义评分函数

我正在尝试使用一种名为 SERA 平方误差相关区域的新指标作为本文中提到的不平衡回归的自定义评分函数 https link springer com article 10 1007 s10994 020 05900 9 https lin
如何在 Caffe 的网络中出现多次损失？

如果我在网络中定义多个损失层从这些末端到网络的开头是否会发生多个反向传播我的意思是他们真的是这样工作的吗假设我有这样的事情 Layer1 Layer2 Layer n Layer cls1 bottom layer n top cl
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
如何组织循环神经网络？

我想模拟以下内容 y t F x t 1 x t 2 x t k 或者说一个函数其当前输出取决于最后 k 个输入 1 我知道一种方法是使用一个经典的神经网络其中 k 个输入为 x t 1 x t 2 x t k 对于每个y t 并训练它
Fine-Tuning DistilBertForSequenceClassification：不是学习，为什么loss没有变化？权重没有更新？

我对 PyTorch 和 Huggingface transformers 比较陌生并对此尝试了 DistillBertForSequenceClassificationKaggle 数据集 https www kaggle com c
样本（）和r样本（）有什么区别？

当我从 PyTorch 中的发行版中采样时两者sample and rsample似乎给出了类似的结果 import torch seaborn as sns x torch distributions Normal torch tens
Caffe 的 LSTM 模块

有谁知道 Caffe 是否有一个不错的 LSTM 模块我从 russel91 的 github 帐户中找到了一个但显然包含示例和解释的网页消失了以前是http apollo deepmatter io http apollo deep
预测测试图像时出现错误 - 无法重塑大小数组

我正在尝试使用 TensorFlow 和 Keras 在 Python 中进行图像识别并且我已经关注了下面的博客 https stackabuse com image recognition in python with tensorfl
了解 YOLO 是如何训练的

我试图了解 YOLO v2 是如何训练的为此我使用这个 keras 实现https github com experiencor keras yolo2 https github com experiencor keras yolo2在

随机推荐

AOP 使用 around 来避免执行方法

我在代码中使用 Spring AOP 来拦截某个方法的执行我正在尝试做的一个简化示例如下 public void someMethod does something Around execution someMethod public v
jqGrid 的排序/过滤问题

我正在使用jqGrid 4 5 3 版本我已经升级到免费 jqGrid 版本 4 13 6 升级后我面临以下问题排序不适用于所有列我想根据我设置的内容显示列大小autoResizable true and autoresizeOnLoa
在 Zend Framework 应用程序中，/views/filters 有什么用途？

我知道视图助手的作用 view helpers 但我不知道视图过滤器 view filters 是什么或者它的用途是什么有人可以解释一下这个问题吗谢谢你在渲染视图结束时 Zend View 将输出传递给您已注册的任何过滤器方法是调
无法在 Spark 中读取具有自定义一元转换器的管道模型

我在 Spark 中定义了一个新的自定义 UnaryTransformer 示例代码中的 cleanText 并在 Pipeline 中使用它当我保存安装的管道并尝试读回它时出现以下错误 java lang NoSuchMethodEx
将两个 HTML 文档嵌入到一页中

我想输出两个 HTML 文档包裹在一个 HTML 文档中是否可以用 HTML 来做这样的事情 First page here Second page here
android：检查应用程序中文件是否存在

我的应用程序的资产文件夹中有几个 html 文件我的应用程序根据设备语言加载这些文件当我检查文件是否存在时它说不存在但是当我使用 browser loadUrl filename 加载该文件时它加载得很好以下代码将帮助您理解我的
带代理的 PHP CURL 导致套接字上的 CLOSE_WAIT

我正在使用 PHPcurl 库来建立连接并从 WEB 检索内容通常我有多个 SOCKS5 代理服务器在 localhost 上运行端口从 10300 到 10350 PHP 随机选择一个端口 My code ch curl init
Lion：RVM 安装 rubies 时出现问题 - 与 openssl 相关的问题

我很绝望现在两天天都在摆弄以下问题但没有解决方案更新 Lion 后我想使用最新版本的 rvm 安装额外的 rubies 这是我之后调用捆绑器时发生的情况 Users felix rvm rubies ruby 1 9 2 p290
如何使用 v12+（12.0.0 及更高版本）向 Discord.js 中的所有公会发送消息

if command sendguildmessages if message author id 231956829159161856 var guildList client guilds array try guildList for
线程“main”中的异常 java.lang.NoSuchMethodError: scala.Product.$init$(Lscala/Product;)

我收到此错误的原因是什么最初 Scala 的 IDE 插件是 2 12 3 但由于我使用的是 Spark 2 2 0 所以我手动将其更改为 Scala 2 11 11 Using Spark s default log4j profile
防止 Edge 中的高对比度模式向文本添加背景

我正在努力调整一些组件以便它们在高对比度模式下都能正常工作并且看起来不错 Edge 似乎在 IE11 未添加的所有文本下添加了黑色背景我似乎找不到一种方法来在 CSS 中定位这个背景或者任何其他方法来规范两个浏览器之间的行为例如假
如何从 Matlab 在 virtualenv 中执行 Python 代码

我正在创建一个用于研究的 Matlab 工具箱我需要执行 Matlab 代码但也需要执行 Python 代码我想允许用户从 Matlab 执行 Python 代码问题是如果我立即执行此操作我将必须在 Python 环境中安装所有
当出现alertController（actionSheet）时inputAccessoryView动画向下

我有一个用于聊天应用程序的 inputAccessoryView 它始终保持可见并停靠在屏幕底部用于类似于大多数消息应用程序的文本输入当我呈现带有actionSheet样式的alertController时 inputAccessory
Flutter StatefulWidget 小部件和泛型

如何将泛型类型传递给State of a StatefulWidget 在这里我想使用我的泛型myMethod
如何在 Android 中使用 kSOAP 序列化双精度值

这是代码 package com SRS6 import org ksoap2 SoapEnvelope import org ksoap2 serialization SoapObject import org ksoap2 serial
小数点分隔符 oracle

我需要用点替换逗号然后我需要我的值是一个数字所以我写了这个 select replace 12345 6789 from dual it works fine 但后来我想转换to number该值我收到错误 invalid numbe
PostGIS - 将多多边形转换为单多边形

是否可以将包含多个多边形的形状文件导入到 PostGIS 中的单个多边形中每当我尝试导入多边形的形状文件时它都会作为多多边形而不是单个多边形存储在geom柱子因此我无法从多重多边形中将其提取为单个多边形值非常感谢所有有用的建议
使用 jQuery 更改 Bootstrap 动画进度条动画持续时间

我正在尝试更改 Twitter Bootstrap 动画进度条上使用的 CSS3 动画的持续时间我想要的结果是使用 jQuery 减少动画的持续时间以便获得更快的动画我有以下 HTML 和 CSS 并使用了以下 jQuery HTML
Julia 中过时的软件包列表

有没有办法列出 Julia 中所有过时的软件包相当于pip3 list outdated在Python中我做了几次搜索 1 https docs julialang org en v1 stdlib Pkg 2 https pkgdoc
如何使用pytorch构建多任务DNN，例如超过100个任务？

下面是使用 pytorch 为两个回归任务构建 DNN 的示例代码这forward函数返回两个输出 x1 x2 用于大量回归分类任务的网络怎么样例如 100 或 1000 个输出对所有输出例如 x1 x2 x100 进行硬编码绝对

如何使用pytorch构建多任务DNN，例如超过100个任务？

如何使用pytorch构建多任务DNN，例如超过100个任务？ 的相关文章

随机推荐

热门标签

如何使用pytorch构建多任务DNN，例如超过100个任务？的相关文章