深度学习模型学习笔记

2023-11-07

我作为新手的一些学习笔记

backbone：主干网络。主干网络大多时候指的是提取特征的网络，其作用就是提取图片中的信息，供后面的网络使用。这些网络经常使用的是Resnet VGG等，而不是我们自己设计的网络，因为这些网络已经证明了在分类等问题上的特征提取能力是很强的。在用这些网络作为backbone的时候，都是直接加载官方已经训练好的模型参数，后面接着我们自己的网络。
head：是获取网络输出内容的网络，利用之前提取的特征，head利用这些特征，做出预测。
neck：是放在backbone和head之间的，是为了更好的利用backbone提取的特征
bottleneck：瓶颈的意思，通常指的是网络输入的数据维度和输出的维度不同，输出的维度比输入的小了许多，就像脖子一样，变细了。经常设置的参数 bottle_num=256，指的是网络输出的数据的维度是256 ，可是输入进来的可能是1024维度的。
GAP：Global Average Pool全局平均池化，就是将某个通道的特征取平均值。
Embedding：深度学习方法都是利用使用线性和非线性转换对复杂的数据进行自动特征抽取，并将特征表示为“向量”（vector），这一过程一般也称为“嵌入”（embedding）
用于预训练的任务被称为前置/代理任务(pretext task)，用于微调的任务被称为下游任务(downstream task)
end to end：在论文中经常能遇到end to end这样的描述，那么到底什么是端到端呢？其实就是给了一个输入，我们就给出一个输出，不管其中的过程多么复杂，但只要给了一个输入，只会对应一个输出。End-To-End的方案，即输入一张图，输出最终想要的结果，算法细节和学习过程全部丢给了神经网络。
Warm up：热身。Warm up指的是用一个小的学习率先训练几个epoch，这是因为网络的参数是随机初始化的，一开始就采用较大的学习率容易数值不稳定。
通常把训练的数据分为三个文件夹：训练集、测试集和验证集。

训练集（train set）：用于训练模型以及确定参数。相当于老师教学生知识的过程。

验证集（validation set）：用于确定网络结构以及调整模型的超参数。相当于月考等小测验，用于学生对学习的查漏补缺。

测试集（test set）：用于检验模型的泛化能力。相当于大考，上战场一样，真正的去检验学生的学习效果。

参数（parameters）是指由模型通过学习得到的变量，如权重w和偏置b。
超参数（hyperparameters）是指根据经验进行设定的参数，如迭代次数，隐层的层数，每层神经元的个数，学习率等。
在使用数据集训练模型之前，我们需要先将整个数据集分为训练集、验证集、测试集。训练集是用来训练模型的，通过尝试不同的方法和思路使用训练集来训练不同的模型，再通过验证集使用交叉验证来挑选最优的模型，通过不断的迭代来改善模型在验证集上的性能，最后再通过测试集来评估模型的性能。
调参（hyperparameter tuning）是选择超参数的过程。
梯度下降：
梯度下降通过不断沿着反梯度方向更新参数求解
小批量随机梯度下降是深度学习默认的求解算法
两个重要的超参数是批量大小和学习率
在深度学习中，num_epochs 常用于表示模型需要遍历整个训练数据集的次数。例如，如果训练数据集包含 1000 个样本，并且 num_epochs = 3，那么模型将使用这 1000 个样本训练 3 次，每个样本会被训练 3 次。
分类和回归：
回归估计一个连续值
分类预测一个离散类别
Zero-shot recognition（零样本识别）是指模型在没有接触到某个类别样本的情况下，可以对该类别进行正确的分类或者识别。
更难做到的是找到⼀组参数，这组参数能够在我们从未⻅过的数据上实现较低的损失，这⼀挑战被称为泛化（generalization）
batch_size是指每次训练时，输入到模型中的样本数。在深度学习中，由于训练数据集的数据量通常非常大，单次读取全部数据会导致内存不足，因此通常需要将数据集分成若干批次(batch)进行训练。
⼤多数常⻅的深度学习模型训练过程:先读取数据，再定义模型和损失函数，然后使⽤优化算法训练模型
在深度学习中，“opt.heads”通常是指模型的**输出头（output head）**或损失函数的分量。在目标检测和分割等任务中，模型的输出通常需要包含多个部分，例如边界框坐标、类别预测、掩模分割等，每个部分对应一个输出头。这些输出头可以共享前面的特征提取层，但在后面的卷积层中分别生成不同的输出。在训练时，每个输出头都需要使用相应的损失函数来计算梯度，并根据总体损失进行反向传播调整模型参数。因此，“opt.heads”通常用于指定所有输出头的名称、类型、权重等相关信息，以及构建相应的损失函数。
训练数据集：训练模型参数
验证数据集：选择模型超参数
非大数据集上通常使用k-折交叉验证
训练误差：模型在训练数据上的误差
泛化误差：模型在新数据上的误差
1：输入通道个数等于卷积核通道个数

2：卷积核个数等于输出通道个数

输出通道数等于类别个数，高宽缩小的倍数看stride即可
在模型训练中，损失函数通常被用来衡量模型预测结果与真实结果之间的差距。优化器的目标就是最小化损失函数，从而提高模型性能。
高宽减半，通道数加倍

batchnorm层作用在：

 1.全连接层和卷积层输出上，激活函数前

 2.全连接层和卷积层输入上

 3.对全连接层，作用在特征维

 4.对于卷积层，作用在通道维

批量归一化固定小批量中的均值和方差，然后学习出适合的偏移和缩放。可以加速收敛速度，但一般不改变模型精度，因此没必要跟丢弃法混合使用
上采样通常是将低分辨率图像或特征图放大或恢复到高分辨率版本的技术，也称为放大或插值。上采样方法包括双线性插值、三次样条插值、反卷积等。上采样可用于许多任务，例如目标检测、分割和图像生成。上采样的效果取决于插值方法和放大倍数，可能会导致一些图像细节的失真和模糊。
下采样是将高分辨率图像或特征图缩小到低分辨率版本的技术，也称为降采样或子采样。下采样通常用于编码器中，以减少模型大小和计算复杂度，同时保留重要的图像信息。下采样方法包括平均池化、最大池化等。下采样可能会导致信息丢失和空间分辨率降低，这可能会影响模型的性能。
在深度学习时代，也有习惯，以全连接层为界限，将网络模型划分为特征提取模块和分类模块以便更好的管理网络。
硬关联是一种二元的、确定性的关联方式，而软关联是一种连续的、模糊的或概率性的关联方式。
语义分割的任务是给场景中的每个位置（图像中的每个像素，或者点云中的每个点）指定一个类别标签，比如车辆，行人，道路，建筑物等。
实例分割的任务类似于物体检测，但输出的不是物体框，而是每个点的类别标签和实例标签。
全景分割任务则是语义分割和实例分割的结合。算法需要区分物体上的点（前景点）和非物体上的点（背景点），对于前景点还需要区分不同的实例。
机器学习一般分为判别式模型和生成式模型
论文里面的latent, hidden ,feature,embedding，这些其实都是特征的意思，就是各种花里胡哨的用法而已。
pytorch可以给我们提供两种方式来切换训练和评估(推断)的模式，分别是: **model.train()**和 model.eval()。
一般用法是:在训练开始之前写上model.trian()，在测试时写上model.eval()。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习

学习

笔记

Pytorch

python

深度学习模型学习笔记的相关文章

如何编写嵌套的 __init__.py 文件

我正在努力解决嵌套问题 init py在我正在编写的Python包中该包具有以下架构 module init py submodule1 init py source py submodule2 init py source py sub
如何在多进程系统中实现锁定？

我们正在并行运行许多詹金斯项目我们使用 python 并且选择使用 pyenv 管理虚拟环境不幸的是 pyenv 有一个众所周知的竞争条件 https github com yyuu pyenv issues 174 为了解决这个问题
当我有自定义身份验证模型时，如何登录 Django Rest 可浏览 API？

我有一个自定义用户模型如下所示account models py from django contrib auth modles import AbstractUser from django db models signals impo
此 TypeError 消息中提到的“代码对象”是什么？

在尝试使用Python时exec声明我收到以下错误 TypeError exec arg 1 must be a string file or code object 我不想传递字符串或文件但什么是代码对象如何创建一个创建代码对象的
使用 django-rest-framework 设置对象级权限

尝试使用 django rest framework 最干净最规范地管理 django guardian 对象级权限我想将对象的读取权限 module view object 分配给在执行 POST 时发出请求的用户我的基于阶级的观点
Mypy 无法从文字列表推断项目的类型

我有一个变量x和一个文字列表例如 0 1 2 我想转换x这些文字之一如果x在列表中我将其退回否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
使用 Boto3 以字符串形式打开 S3 对象

我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
Series.sort() 和 Series.order() 有什么区别？

s pd Series nr randint 0 10 5 index nr randint 0 10 5 s Output 1 3 7 6 2 0 9 7 1 6 order 按值排序并返回一个新系列 s order Output 2 0
协程从未被等待

我正在使用一个简单的上下文管理器其中包含一个异步循环 class Runner def init self self loop asyncio get event loop def enter self return self def e
Python将文本文件解析为嵌套字典

考虑以下数据结构 HEADER1 key value key value HEADER2 key value key value HEADER3 key value HEADER4 key value key value 原始数据中没有缩进
两个不同长度的数据帧的列之间的余弦相似度？

我在 df1 中有文本列在 df2 中有文本列 df2 的长度将与 df1 的长度不同我想计算 df1 text 中每个条目与 df2 text 中每个条目的余弦相似度并为每场比赛给出分数输入样本 df1 mahesh suresh
python中basestring和types.StringType之间的区别？

有什么区别 isinstance foo types StringType and isinstance foo basestring 对于Python2 basestring是两者的基类str and unicode while type
Python 中维基百科 API 中的 DisambiguationError 和 GuessedAtParserWarning

我想获得维基百科与搜索词相关的可能且可接受的名称列表在这种情况下是电晕当输入以下内容时 print wikipedia summary Corona 这给出了以下输出 home virej local lib python3 8 si
使用另一个数据帧在数据帧中创建子列

我对 python 和 pandas 很陌生在这里我有一个以下数据框 did features offset word JAPE feature manual feature 0 200 0 aa 200 200 0 200 11 bf
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
无法通过 Python 子进程进行 SSH

我需要通过堡垒 ssh 进入机器因此该命令相当长 ssh i
pandas 中数据帧中的随机/洗牌行

我目前正在尝试找到一种方法来按行随机化数据框中的项目我在 pandas 中按列洗牌排列找到了这个线程在 pandas 中对 DataFrame 进行改组排列 https stackoverflow com questions 157
如何获取pandas中groupby对象中的组数？

我想知道有多少个独特的组需要执行计算给定一个名为 groupby 的对象dfgroup 我们如何找到组的数量简单快速 Pandaic ngroups 较新版本的 groupby API pandas gt 0 23 提供了此未记录的
python从二进制文件中读取16字节长的双精度值

我找到了蟒蛇struct unpack 读取其他程序生成的二进制数据非常方便问题如何阅读16 字节长双精度数出二进制文件以下 C 代码将 1 01 写入二进制文件三次分别使用 4 字节浮点型 8 字节双精度型和 16 字节长双精度型
无法安装最新版本的 Numpy (1.22.3)

我正在尝试安装最新版本的 numpy 即 1 22 3 但看起来 pip 无法找到最后一个版本我知道我可以从源代码本地安装它但我想了解为什么我无法使用 pip 安装它 PS 我有最新版本的pip 22 0 4 ERROR Could n

随机推荐

组网方案设计，运用Mesh组网实现无缝漫游！

在当今社会无线网络已经成为了人们在工作学习娱乐生活中必不可少的一部分但一台路由器的信号范围是有限的随着距离的增加就会出现信号变弱导致的网速慢网络卡顿甚至断网的情况所以在一些面积较广障碍较多结构较复杂的场景下就需要安装两个乃
彻底搞懂Java的等待-通知(wait-notify)机制

线程的生命周期转换新建状态 New 新建一个线程对象就绪可运行状态 Runnable 线程对象创建后其他线程调用了该对象的start方法该状态的线程位于可运行线程池中变得可运行等待获取CPU的使用权运行状态 Running
python读取openapijson文件所有接口信息

import openpyxl import json from apistar schemas import OpenAPI with open r E 下载 default OpenAPI json r encoding utf 8 a
JAVA string类型的年月日期获取前一个月日期

废话不多说代码如下 String date 2023 01 SimpleDateFormat simpleDateFormat new SimpleDateFormat yyyy MM Date newdate simpleDateFor
各种开源协议介绍

各种开源协议介绍 BSD Apache Licence GPL V2 GPL V3 LGPL MIT 原文连接 https www open open com bbs view 1319816219625
C#中的变量祥解

一 C 数据类型 A 值类型值类型变量可以直接分配一个值它是从System ValueType派生而来值类型直接包含数据比如int char float 他们分别存储整型数据字符浮点数当你申明一个值类型时系统分别空间来存储值
MySQL中的读锁和写锁

MySql锁数据库都是悲观锁 java redis zookeeper会有乐观锁锁的概念 MySQL中的锁 MyISAM锁 MyISAM共享读锁 MyISAM独占写锁 MyISAM锁调度 InnoDb InnoDb行锁 InnoDb表锁
21天打卡挑战学习MySQL——《Docker容器安装》第三周第七篇

活动地址 CSDN21天学习挑战赛前言 Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级可移植的容器中然后发布到任何流行的 Linux 机器上也可以实现虚拟化 Docker支持在主流的操作系统平台上使用包括 Wind
RecyclerView曝光埋点

RecyclerView曝光埋点在做客户端埋点的时候一般分为三类事件页面浏览事件元素点击事件列表item元素曝光事件页面浏览事件和元素点击事件在做代码埋点时可以很简单的进行埋点对列表item元素曝光事件的埋点相对来说就麻烦许多
2. 初识Python脚本

Python的系列课程是写给零基础的小白看的如果基础比较好的小伙伴可以暂时先不关注等待后续课程 Hi 大家好我是茶桁之前的课程已经给大家讲解了Python相关特性和基本语法那么这节课呢我们尝试着从最简单的脚本来开始认识Pytho
IDEA 项目结构出现 0%classes,0% lines covered解决方法

Ctrl Alt F6 然后取消勾选中间的那个No Coverage
苹果邮件怎么添加qq邮箱_iPhone自带邮件无法登陆QQ邮箱?

要说现在什么邮箱用的最频繁个人认为是QQ邮箱但如今我们都喜欢在手机上处理一些事情接收和回复邮件也不例外不过许多iPhone用户可能都遇到过在苹果手机自带邮件内添加QQ邮箱时总是显示用户名或密码不正确今天就来帮大家解决这个问题
C++参数传递与返回值

1 const member function 常量成员函数在类内如果不改变数据就写为常量成员函数 FUNCTION1 const 为什么要使用常量成员函数呢 for example template
单目标应用：基于成长优化算法（Growth Optimizer，GO）的微电网优化调度MATLAB

一微网系统运行优化模型微电网是由分布式电源储能装置和能量转换装置等组成的小型发配电系统具有成本低电压低污染小等特点由于环保和能源压力清洁可再生能源和分布式能源工业发展潜力巨大微电网控制器可实现对电网的集中控制采用分布式电
使用 FasterTransformer 和 Triton 推理服务器部署 GPT-J 和 T5

使用 FasterTransformer 和 Triton 推理服务器部署 GPT J 和 T5 文章目录使用 FasterTransformer 和 Triton 推理服务器部署 GPT J 和 T5 简介主要步骤概述第 1 步从
点云从入门到精通技术详解100篇-定子装配过程中基于深度学习的易变形材料的点云分割

目录前言易变形导线装配过程及问题国内外相关研究现状三维视觉的研究现状
Windows中Lua环境配置记录

之前在Mac环境下配置了Lua的环境因为装的是双系统 Mac有点不稳定所以更多的时候我是在用Windows系统所以就想在windows上也将环境配置好一开始感觉windows应该很好配置网上的教程应该有很多可是当自己查起来的时候
2022第十一届中国创新创业大赛全国总决赛在深圳举办

为深入贯彻党的二十大精神和创新驱动发展战略强化企业科技创新主体地位支持企业融合创新推进科技型创新型企业遴选和培育加大金融对硬科技企业的支持力度营造有利于科技型中小微企业成长的环境推动创新链产业链资金链人才链深度融合第十一届中国
如何给信号加噪声，matlab

Matlab信号上叠加噪声和信噪比的计算 http www ilovematlab cn thread 54155 1 1 html 出处 MATLAB中文论坛在信号处理中经常需要把噪声叠加到信号上去在叠加噪声时往往需要满足一定的信噪比
深度学习模型学习笔记

我作为新手的一些学习笔记 backbone 主干网络主干网络大多时候指的是提取特征的网络其作用就是提取图片中的信息供后面的网络使用这些网络经常使用的是Resnet VGG等而不是我们自己设计的网络因为这些网络已经证明了在分类等问

深度学习模型学习笔记

深度学习模型学习笔记 的相关文章

随机推荐

热门标签

深度学习模型学习笔记的相关文章