近红外跨模态行人重识别（RGB-IR Cross-Modality Re-id）(一)

2023-05-16

1. 写在前面

本文是我阅读近红外的跨模态行人重识别（RGB-IR Cross-Modality Re-id）文献的笔记，由于网上对该方面介绍的博客很少，所以这里我记录下阅读文章的一些要点和我自己对这些问题的思考。

2. 综述

1. Beyond Intra-modality Discrepancy: A Comprehensive Survey of Heterogeneous Person Re-identification
2. Near infrared nighttime road pedestrians recognition based on convolutional neural network

研究背景：目前学术界对于正常光照下的行人重识别的研究以达到一个不错的效果，但是在实际场景下的数据并不仅限于正常光照的数据，所以提出了一个在未来更具有研究价值的行人重识别问题——Heterogeneous person reidentification
研究现状：目前已有的跨模态行人重识别大致有如下四个方向：低分辨、近红外、素描和文本，本文主要记录近红外的部分
近红外跨模态的优势：
1. 弱光or黑暗条件下，普通re-id效果很差
2. 大多数监控摄像头可支持近红外图像和彩色图片
3. 近红外图像不受可见光的影响
为什么采用近红外图片？

相比其他方式，近红外图像传感器，采集样本分辨高，帧率快，成本低

3. 数据集

SYSU-MM01

在这里插入图片描述

数据集介绍：
SYSU-MM01 包括了6个摄像机采集的数据，其中包括2个IR摄像机和4个RGB摄像机。
评估
gallery:RGB
query:IR
- 全部场景搜索
  - gallery:RGB（cam1、cam2、cam4、cam5）
    query:IR（cam3、cam6）
- 室内场景搜索
  - gallery:RGB（cam1、cam2）
    query:IR（cam3）

4. 相关方法介绍

对于近红外的跨模态的行人重识别问题，其根本目的是解决两种模态之间的gap，大致解决思路为以下两种：

使用参数共享的卷积网络，学习到两种模态数据之间的共享特征
使用GAN网络，通过训练生成器和判别器去学习模态之间的关联

1. RGB-Infrared Cross-Modality Person Re-Identification

简介：
当前存在多种构造的单双流网络，作者对其分析后，对其输入补了一个全零层，实现了单双流网络的合并，其中，虚线对应的节点参数为0，不同的节点对应不同的模态数据会选择性"失活"，并且存在始终激活的节点，如绿色节点所示，学习两种模态的共有特征。
总结：
结构简单明了，通过一个类似"开关"的数据输入结构解决了不同模态的数据输入问题，但是并未将信息全部利用。

2. Cross-Modality Person Re-Identification with Generative Adversarial Training

简介：
本文使用GAN的方法，在特征级别上缩小RGB和IR之间的gap，同时使用triplet loss 和Id loss。
特点:

对于两种模态下的三元损失函数的构建：
混淆不同模态下数据的特征，让网络无法分辨出特征来自同一域或者不同域：

3. Hierarchical Discriminative Learning for Visible Thermal Person Re-Identification

简介：
使用双流网络（共享后半部分的参数）提取特征，之后进行特征学习和度量学习
Feature Learning：
- Id Loss：CrossEntropy Loss
- Contrastive Loss：三元损失函数，
Metric Learing：将两个不同空间的模态的数据转化到同一个空间，为了更有效对特征的学习
总结：
损失函数采用常规设计，但HCML目的是将不同模态数据的特征转化到同一个空间进行学习，思路清晰。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

RGB

cross

Modality

近红外跨模态行人重识别

近红外跨模态行人重识别（RGB-IR Cross-Modality Re-id）(一) 的相关文章

我如何使用 javascript/jquery 知道给定字符串是 hex、rgb、rgba 或 hsl 颜色？

我使用正则表达式来表示十六进制 a fA F0 9 6 a fA F0 9 3 但我不知道我应该做什么来找到 rgb rgba 和 hsl 我正在以字符串形式获取输入例如输入将包含 rgb 0 0 0 或 rgb 0 0 0 0 2 这
将 RGB 颜色转换为 CMYK 颜色？

我正在寻找一种将 RGB 颜色转换为 CMYK 颜色的算法 Photoshop 正在执行以下转换 R 220 G 233 乙 174 C 15 中号 0 Y 40 K 0 从 RGB 到 CMYK 的转换取决于用于铺设 CMYK 墨水的物理
sRGB 和 AdobeRGB 的数学转换

这是一个非常明确的问题但我做了很多研究但没有找到答案 StackOverflow 问题为this https stackoverflow com questions 1174832 converting jpeg colorspace
RGB 与 HLS 之间的转换

我正在使用 python 的 colorsys 库将 RGB 颜色值转换为 HLS 为了验证一下我尝试转换回 RGB 并得到了不同的值我可以理解由于精度问题而产生的微小差异但这些值有很大不同这是我的代码 import colorsy
如何将 YUV420p 转换成 RGB 用于 ffmpeg 编码器？

我想使用 C 代码从位图图像制作 avi 视频文件我写了以下代码 Get RGB array data from bmp file uint8 t rgb24Data new uint8 t 3 imgWidth imgHeight hB
比较两个 BufferedImage 之间的像素值的最快方法？

我有一个 TYPE INT BGR 类型的 BufferedImage 我需要与另一个 BufferedImage 进行逐像素比较以计算两个图像之间的距离我有一些东西可以工作但速度很慢我从参考图像中获取一个像素将其分解为 R
从字节数组创建 8 位图像

字节数组是这样获得的 BufferedImage image new Robot createScreenCapture new Rectangle screenDimension byte array DataBufferByte get
从图像中提取红色通道

我有一个图像为 X RGB 我想使用 Imagick 从中获取红色通道的图像我尝试参考http www imagemagick org Usage quantize http www imagemagick org Usage quant
使用GL着色器语言的相机帧yuv到rgb转换

我从字节数组中的 android 相机预览回调获取相机帧并将其传递给 jni 代码由于我们不能在 C 中使用字节因此我将其转换为整数数组如下所示 JNIEXPORT void JNICALL Java com omobio armad
模拟颜色透明度

我有 RGB 颜色值和 alpha 值假设我有白色背景并且应用了 alpha 如何获得新的 RGB 值应用于每个颜色通道的公式如下 cr cf af cb ab 1 af where cr是像素的最终颜色 cf是前景色 cb背景颜色 a
如何在字符串中存储颜色？

如果颜色是人类可读格式我想将颜色存储在字符串中如果不是则将其存储在 ToArgb 中颜色是红色然后将其存储在 Red 字符串中如果颜色是绿色的某种变体则将其存储为 ff40ff80 在运行时我想将此字符串转换回 Color 类
在 Python 中将图像中的颜色映射到颜色列表中最接近的成员

我有一个 19 种颜色的列表它是一个大小为 numpy 的数组 19 3 colors np array 0 0 0 0 0 255 255 0 0 150 30 150 255 65 255 150 80 0 170 120 65 12
在c#中比较RGB颜色

我正在尝试找到一种方法来比较两种颜色以找出它们的相似程度我似乎找不到有关该主题的任何资源因此我希望在这里得到一些指示理想情况下我希望得到一个分数来表明它们有多相似例如 0 到 100 其中 100 相等 0 完全不同 Thanks
在Python中将十六进制值转换为RGB值

在这里处理杰里米的回应将十六进制颜色转换为 RGB 反之亦然 https stackoverflow com questions 214359 converting hex color to rgb and vice versa我能够获得
如何设置 BufferedImage 中的 RGB 像素以显示 16 位深度的 PNG？

我正在尝试读取并显示 PNG 文件我处理 8 位深度的图像没有问题我按如下方式进行 BufferedImage result new BufferedImage width height BufferedImage TYPE INT R
颜色生成功能

让我们考虑以下场景一个可以生成从白色到红色从白色到蓝色从白色到粉色从白色到橙色等代码颜色的函数颜色代码采用 RGB 格式值从 0 到 255 有任何想法吗您能给我伪代码或此类算法的链接吗听起来你在追求线性插值 http en
如何在C中将RGB转换为HSL？

如何在 C C 中将 RGB 转换为 HSL Note This is a short self answer I posted it here so people can find it quickly with a search 翻译代
作为颜色表示的值

将值转换为颜色是众所周知的我确实理解以下两种方法在改变 RGB 颜色值来表示一个值 https stackoverflow com questions 1423925 changing rgb color values to repre
如何使用 c 使用 libpng 更改 png 图像的 RGB 值？

更改 png 图像的 rgb 值的推荐方法是什么现在我正在使用示例代码来查看 libpng 的工作方式它只打开一个 png 图像并写入另一个 png 图像但是我想更改这个新图像的 RGB 值使其变为全蓝色绿色或红色无论我选择什么
如何计算位图的平均 RGB 颜色值

在我的 C 3 5 应用程序中我需要获取位图的红色绿色和蓝色通道的平均颜色值最好不使用外部库这可以做到吗如果是这样怎么办提前致谢尝试让事情变得更精确位图中的每个像素都有一定的 RGB 颜色值我想获取图像中所有像素的平均

随机推荐

Ubuntu 14.04 16.04 18.04 安装Docker(Docker CE)

Ubuntu 14 04 16 04 18 04 使用apt get进行安装自17年开始 xff0c docker分为docker ce xff08 社区版 xff09 docker ee xff08 企业版 xff09 xff0c 另外
PHP实现跨域的解决方法

PHP实现跨域解决方法如果要实现跨域通过设置Access Control Allow Origin来实现跨域例如 xff1a 客户端的域名是client runoob com xff0c 而请求的域名是server runoob com
SLAM后端——滤波与优化对比

滤波与优化 xff1a 摘自 xff1a https www cnblogs com zengcv p 5994587 html 因为基于滤波的理论 xff0c 滤波器稳度增长太快 xff0c 这对于需要频繁求逆的EKF xff08 扩展卡
realsense t265测试

roslaunch realsense2 camera rs t265 launch rosrun rviz rviz roslaunch vins estimator euroc launch 将加计和陀螺仪主题放在一起修改rs cam
Intel Realsense t265获取相机参数

rs sensor control
VINS-MONO需要修改的参数

相机参数修改 xff1a 加速度和角速度发表在两个话题 xff0c 用上述方法将其发表在一个话题上修改VINS MONO包 xff1a
MSCKF

https github com TurtleZhong msckf mono
ROS毕设坑3：在ROS下用视觉方法求取R和t，然后将其发布

今天莫名遇到两个问题 xff1a 之前调好的代码硬生生的跑不通 xff0c 就会出现下面这个问题 xff1a 大概意思就是说我还没得到图片呢就让他去计算 xff0c opencv就出错了 xff0c 我不信这个邪 xff0c 自己去调试了一
Linux网卡驱动pcnet32.c的注释（AM79C9*系列网卡的驱动）

很久之前读的网卡驱动源码 xff0c 很多东西已经忘记了 xff0c 最近面试被问道了网卡收数据包的全过程 xff0c 只能答出一个很简单的过程 xff0c NAPI这种非常优秀的机制都没有想起来 xff0c 很惭愧 xff0c 重新复习了
ADRC算法Auto Disturbances Rejection control

自抗扰控制其中 xff0c e 61 v t y t 是控制系统参考输入量v t 与被控对象输出量y t 之间的差值 xff0c kp比例系数 ki积分系数 xff0c xff0c kd微分系数优点 xff1a 1 仅由误差来决定控制
python 下运行ros

1 建立l两个文件夹python ros scr 2 执行下述命令后 xff0c 将会在在src中 xff0c 建立一个包daodao 并且在文件夹daodao里生成了两个空文件夹 xff0c 有include daodao scr 和 C
tensor 与 array 的相互转化

import tensorflow as tf import numpy as np a 61 np array 1 2 3 4 5 6 7 8 9 print a 1 2 3 4 5 6 7 8 9 b 61 tf constant a
keras.layers.UpSampling2D与tf.image.resize_nearest_neighbor

参考https www bookstack cn read keras docs zh sources layers convolutional md keras layers UpSampling2D size 61 2 2 data f
Linux安装elasticsearch7.x（踩坑分享）

安装并启动首先下载elasticsearch压缩文件 xff0c 下载地址我这里选择的是elasticsearch 7 17 1版本 xff1a https www elastic co cn downloads elasticsear
VNC 登录显示too many security failures的解决方法

原因 xff1a 黑客试图登录解决方法 xff1a 在putty上登录 xff0c 然后输入命令vncserver kill 5 杀掉vnc进程之后输入su 你的用户名使用su权限输入命令 vnc 重启vnc 成功之后就可以再次登录
MapReduce案例运行及分词

首先查询进程 xff0c 发现hadoop并没有启动如何配置hadoop xff0c 参考我的另外一篇博文 Hadoop环境准备接下来 xff0c 启动hadoop start all sh 或者 start dfs sh start
main函数是主线程吗

1 线程的概念 xff1a 线程是程序最基本的运行单位 xff0c 而进程不能运行 xff0c 所以能运行的 xff0c 是进程中的线程 2 线程是如何创建起来的 xff1a 进程仅仅是一个容器 xff0c 包含了线程运行中所需要的数据结构
C#类型的转换:Converter<TInput, TOutput> 委托的使用

Converter lt TInput TOutput gt 委托表示将对象从一种类型转换为另一种类型的方法此委托由 Array 类的 ConvertAll lt TInput TOutput gt 方法和 List lt T gt 类
收藏一些不错的国外网站

设备树 xff1a https www devicetree org LINUX xff1a https www arm linux org uk USB xff1a https github com pyusb pyusb PYTHON
近红外跨模态行人重识别（RGB-IR Cross-Modality Re-id）(一)

1 写在前面本文是我阅读近红外的跨模态行人重识别 xff08 RGB IR Cross Modality Re id xff09 文献的笔记 xff0c 由于网上对该方面介绍的博客很少 xff0c 所以这里我记录下阅读文章的一些要点和我自