特征金字塔:FPN(Feature Pyramid Networks)

2023-11-04

参考:
【论文笔记】FPN —— 特征金字塔
神经网络学习小记录29——特征金字塔-Feature Pyramid Networks(FPN)

1、introduction

在目标检测中,对于小目标的检测是一个难点,如果我们使用传统的多级卷积运算,可能导致像素占比少的小目标在该过程中丢失,所以如何提取高级特征还能保留小目标的信息是一个问题。

在FPN论文中总结出针对这个问题的几种解决方法。

1.1、Featurized Image Pyramid

通过图像金字塔来构建不同尺度的特征金字塔,如下图所示。
在这里插入图片描述
该方法对于图像金字塔中每个尺寸的图像都进行特征提取,无论是高分辨还是低分辨,无论是大目标还是小目标都能提取到较强的信息。

但是缺点也很明显,相当于给一个推理网络投喂一个图像金字塔,其计算量是巨大的,无法形成一个端到端的实时性的检测网络。

而且训练时,网络是针对了某个分辨率训练好的(偏好性?),不能有很好的适应性。

1.2、Single Feature Map

更常见的网络结构,显然无法进行多分辨率的检测,也对小尺寸目标无法很好完成检测。
在这里插入图片描述
当然在计算量上,相比上一种结构有很大的优势。

1.3、Pyramidal Feature Hierarchy

1.2中单图像多级特征图,所以也可以联合利用所产生的所及特征图,比如SSD
在这里插入图片描述
但问题是,SSD利用多级特征并不是从低层特征开始的,而是从较高的层开始的,所以存在低层特征图语义信息不够和低层特征图的分辨率也不高的问题。

1.4、Feature Pyramid Networks

FPN即特征金字塔,来自论文《Feature Pyramid Networks for Object Detection》。
在这里插入图片描述
这种网络结构,能够在增加较少计算量的前提下融合低分辨率语义信息较强的特征图和高分辨率语义信息较弱但空间信息丰富的特征图。

2、结构详解

我们来看看这个“堆叠”是怎么实现的?
在这里插入图片描述
对于不同级的特征图尺寸不同,高语义内容的特征层尺寸小,但是含小目标的信息越少,低语义内容的特征层尺寸大,但是含小目标的信息越多。

从上图可以看出,高语义内容的特征层经过上采样和下层进行堆叠,保证小目标的特征与信息。

在这里插入图片描述

深度学习中常用矩阵加操作,将不同表征的信息融合在一起,也就是多个矩阵逐像素相加,但是我曾经想着逐像素相加形成少许几个矩阵,还能表示曾经的多个信息吗?比如特征金字塔将高分辨率和低分辨率这种,生产的新特征富含了高分辨特征和低分辨特征,怎么想想也觉得怪。

但是新的想法帮助我理解了这个问题,虽然只是突发奇想,不一定是对的。

我们知道比如光波、声波,当多个不同的来源叠加时,我们仍然能够将其分离,比如光纤通信,比如多个人同时给你讲话,虽然能量上叠加了,但是仍然能保持自己的特征。那么图像也是一种信息,可以理解为一种波,那么可能也能够在叠加时保持自己的特征,虽然在算法上只是简单的叠加了,实际上各种特征并没有改变,只是隐藏在了cat操作之下了。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

特征金字塔:FPN(Feature Pyramid Networks) 的相关文章

随机推荐

  • pytorch基本使用_01

    import torch import numpy as np string 在torch中对string不支持 1 可以通过向量one hot来进行分类 2 embedding word2vec glove type check a to
  • 利用nodemcu和mqtt协议让嵌入式设备接入互联网(二.nodejs的安装和配置)

    文章目录 前言 nodejs nvm和nodejs的安装 npm的相关配置 配置npm的global和cache路径 配置npm仓库为国内淘宝镜像 npm下载相关依赖包 npm初始化项目 安装相关依赖包 前言 第一篇讲了怎么用layui做H
  • 在Sonar中配置license和copyright的检查

    现在开源代码越来越多 代码头部的license和copyright信息在开发中容易被遗忘 那么就有必要做一些相关的检查 例如在持续集成CI中加入这方面的检查 当然 目前有很多集成在IDE中的工具来自动添加license和copyright信
  • 区间查询(树状数组之差点问线问题)

    1110 区间查询 时间限制 2 Sec 内存限制 32 MB 提交 162 解决 62 提交 状态 题目描述 食堂有N个打饭窗口 现在正到了午饭时间 每个窗口都排了很多的学生 而且每个窗口排队的人数在不断的变化 现在问你第i个窗口到第j个
  • selenium自动化测试入门 浏览器多窗口切换

    有时web应用会打开多个浏览器窗口 当我们要定位新窗口中的元素时 我们需要将webDriver的handle 句柄 指定到新窗口 什么意思 假设我们打开web应用 在系统运行过程中重新打开一个新窗口 可以是页签 当前浏览器存在两个窗口 这时
  • 宋浩概率论笔记(四)数字特征

    本帖更新数字特征 包含期望 方差 相关系数等 要点在于记忆性质中的各种公式 遇到题目时能迅速利用已知条件计算答案
  • (超详细)单臂路由及操作步骤

    目录 一 前提引入 二 单臂路由概述 2 1概念 2 2单臂路由优点 2 3单臂路由子接口 三 链路类型 四 单臂路由的配置实例 4 1拓扑图 4 2交换机的配置 4 3路由器的配置 4 4主机的配置 4 5连通性测试 五 总结 一 前提引
  • ajax+异步promise+async+await

    ajax是什么 为什么要学 ajax 异步js xml ajax实现客户端和服务端进行异步通信 实现页面的局部更新 好处 局部刷新 用户体验好 异步通信 加快了响应能力 减少冗余请求 减轻了服务器负担 ajax原理就是 通过xml对象向服务
  • 用python绘制一条直线_python绘制直线的方法

    本文实例为大家分享了python绘制直线的具体代码 供大家参考 具体内容如下 usr bin env python import vtk 绘制通用方法 def myshow linepolydata Now we ll look at it
  • 1km分辨率全球夜间灯光数据(2012-2022)

    数据简介 夜间灯光 一方面直接反映着当地的工业化水平和城市化水平 另一方面 也能部分反映着人口集中分布情况 同时 根据地表夜间灯光亮度 从而在一定程度上表征人类活动强度 长时间序列的夜间灯光数据被广泛运用于多个领域 一些学者将这一指标当作真
  • el-cascader级联选择器单选/多选根据接口懒加载动态获取数据

    在Vue项目中 使用elment ui 中 el cascader 级联选择器 级联选择器每一级的内容对应不同的接口 因此我们要采用懒加载的形式实现对数据的动态获取 主要思路 通过 lazy 开启动态懒加载 并使用 lazyLoad 来设置
  • Spri-n-g-Cl-oud-发-布

    https www cnblogs com lexiaofei tag SpringCloud
  • 数据库number 对应java_数据库中的number型表示什么

    本文收集整理关于数据库中的number型表示什么的相关议题 使用内容导航快速到达 内容导航 Q1 数据库中的number类型在java类中应该是什么类型 数据库中的number类型在java类对应的类型 1 如果number类没有设置小数位
  • GSM模块_STM32实现GPRS与服务器数据传输经验总结

    硬件环境 MCU STM32F103RET6 调试器 J Link GSM模块 Ai Thinker A6 安信可 还需要配一个串口打印工具 当初选这个模块纯粹是因为价格是最便宜的 软件环境 Keil4 开篇废话 经过两周时间的编码 调试
  • 字符串全排列 java实现

    项目github地址 bitcarmanlee easy algorithm interview and practice 欢迎大家star 留言 一起学习进步 经常会遇到字符串全排列的问题 例如 输入为 a b c 则其全排列组合为abc
  • C++ vector、array和数组的比较

    在c 11中 STL中提拱了一个新的容器std array 该容器在某些程度上替代了之前版本的std vector的使用 更可以替代之前的自建数组的使用 那针对这三种不同的使用方式 先简单的做个比较 相同点 三者均可以使用下表运算符对元素进
  • [C++] LeetCode 214. 最短回文串

    题目 给定一个字符串 s 你可以通过在字符串前面添加字符将其转换为回文串 找到并返回可以用这种方式转换的最短回文串 示例 1 输入 aacecaaa 输出 aaacecaaa 示例 2 输入 abcd 输出 dcbabcd 思路解析 这题考
  • Python3,10行代码,制作艺术签名,从此走上人生巅峰。

    制作艺术签名 1 引言 2 代码实战 2 1 代码示例 3 总结 1 引言 小鱼 小屌丝 你在画啥呢 小屌丝 我这在练习签名呢 小鱼 这 艺术签 小屌丝 喔 鱼哥 你这真实博才多艺 这都知道 小鱼 主要看到你的签名 让我联想到一种武功 小屌
  • 在IDEA中实现Python随机森林模型预测人口

    数据集链接在评论区噢 训练数据中有22个自变量 valuexx是某种土地利用面积 因变量是最后的人口 每一行数据都是一个县市的数据 根据训练数据得到这22个自变量与因变量人口之间的函数关系式y ax by z a b以及后面的省略号中都是常
  • 特征金字塔:FPN(Feature Pyramid Networks)

    参考 论文笔记 FPN 特征金字塔 神经网络学习小记录29 特征金字塔 Feature Pyramid Networks FPN 1 introduction 在目标检测中 对于小目标的检测是一个难点 如果我们使用传统的多级卷积运算 可能导