近红外跨模态行人重识别(RGB-IR Cross-Modality Re-id)(一)

2023-05-16

1. 写在前面

本文是我阅读近红外的跨模态行人重识别(RGB-IR Cross-Modality Re-id)文献的笔记,由于网上对该方面介绍的博客很少,所以这里我记录下阅读文章的一些要点和我自己对这些问题的思考。

2. 综述

1. Beyond Intra-modality Discrepancy: A Comprehensive Survey of Heterogeneous Person Re-identification
2. Near infrared nighttime road pedestrians recognition based on convolutional neural network

  • 研究背景:目前学术界对于正常光照下的行人重识别的研究以达到一个不错的效果,但是在实际场景下的数据并不仅限于正常光照的数据,所以提出了一个在未来更具有研究价值的行人重识别问题——Heterogeneous person reidentification
  • 研究现状:目前已有的跨模态行人重识别大致有如下四个方向:低分辨、近红外、素描和文本,本文主要记录近红外的部分
    在这里插入图片描述
  • 近红外跨模态的优势:
    1. 弱光or黑暗条件下,普通re-id效果很差
    2. 大多数监控摄像头可支持近红外图像和彩色图片
    3. 近红外图像不受可见光的影响
  • 为什么采用近红外图片?
    在这里插入图片描述
    相比其他方式,近红外图像传感器,采集样本分辨高,帧率快,成本低

3. 数据集

SYSU-MM01在这里插入图片描述

在这里插入图片描述

  • 数据集介绍:
    SYSU-MM01 包括了6个摄像机采集的数据,其中包括2个IR摄像机和4个RGB摄像机。

  • 评估
    gallery:RGB
    query:IR

    • 全部场景搜索
      • gallery:RGB(cam1、cam2、cam4、cam5)
        query:IR(cam3、cam6)
    • 室内场景搜索
      • gallery:RGB(cam1、cam2)
        query:IR(cam3)

4. 相关方法介绍

对于近红外的跨模态的行人重识别问题,其根本目的是解决两种模态之间的gap,大致解决思路为以下两种:

  1. 使用参数共享的卷积网络,学习到两种模态数据之间的共享特征
  2. 使用GAN网络,通过训练生成器和判别器去学习模态之间的关联

1. RGB-Infrared Cross-Modality Person Re-Identification

  • 简介:
    当前存在多种构造的单双流网络,作者对其分析后,对其输入补了一个全零层,实现了单双流网络的合并,其中,虚线对应的节点参数为0,不同的节点对应不同的模态数据会选择性"失活",并且存在始终激活的节点,如绿色节点所示,学习两种模态的共有特征。
  • 总结:
    结构简单明了,通过一个类似"开关"的数据输入结构解决了不同模态的数据输入问题,但是并未将信息全部利用。
    在这里插入图片描述

2. Cross-Modality Person Re-Identification with Generative Adversarial Training

  • 简介:
    本文使用GAN的方法,在特征级别上缩小RGB和IR之间的gap,同时使用triplet loss 和Id loss。
  • 特点:
  1. 对于两种模态下的三元损失函数的构建:
  2. 混淆不同模态下数据的特征,让网络无法分辨出特征来自同一域或者不同域:
    在这里插入图片描述
    在这里插入图片描述

3. Hierarchical Discriminative Learning for Visible Thermal Person Re-Identification

  • 简介:
    使用双流网络(共享后半部分的参数)提取特征,之后进行特征学习和度量学习
  • Feature Learning:
    • Id Loss:CrossEntropy Loss
    • Contrastive Loss:三元损失函数,
      在这里插入图片描述
  • Metric Learing:将两个不同空间的模态的数据转化到同一个空间,为了更有效对特征的学习
    在这里插入图片描述
  • 总结:
    损失函数采用常规设计,但HCML目的是将不同模态数据的特征转化到同一个空间进行学习,思路清晰。
    在这里插入图片描述
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

近红外跨模态行人重识别(RGB-IR Cross-Modality Re-id)(一) 的相关文章

  • 我如何使用 javascript/jquery 知道给定字符串是 hex、rgb、rgba 或 hsl 颜色?

    我使用正则表达式来表示十六进制 a fA F0 9 6 a fA F0 9 3 但我不知道我应该做什么来找到 rgb rgba 和 hsl 我正在以字符串形式获取输入 例如 输入将包含 rgb 0 0 0 或 rgb 0 0 0 0 2 这
  • 将 RGB 颜色转换为 CMYK 颜色?

    我正在寻找一种将 RGB 颜色转换为 CMYK 颜色的算法 Photoshop 正在执行以下转换 R 220 G 233 乙 174 C 15 中号 0 Y 40 K 0 从 RGB 到 CMYK 的转换取决于用于铺设 CMYK 墨水的物理
  • sRGB 和 Adob​​eRGB 的数学转换

    这是一个非常明确的问题 但我做了很多研究 但没有找到答案 StackOverflow 问题为this https stackoverflow com questions 1174832 converting jpeg colorspace
  • RGB 与 HLS 之间的转换

    我正在使用 python 的 colorsys 库将 RGB 颜色值转换为 HLS 为了验证一下 我尝试转换回 RGB 并得到了不同的值 我可以理解由于精度问题而产生的微小差异 但这些值有很大不同 这是我的代码 import colorsy
  • 如何将 YUV420p 转换成 RGB 用于 ffmpeg 编码器?

    我想使用 C 代码从位图图像制作 avi 视频文件 我写了以下代码 Get RGB array data from bmp file uint8 t rgb24Data new uint8 t 3 imgWidth imgHeight hB
  • 比较两个 BufferedImage 之间的像素值的最快方法?

    我有一个 TYPE INT BGR 类型的 BufferedImage 我需要与另一个 BufferedImage 进行逐像素比较 以计算两个图像之间的 距离 我有一些东西可以工作 但速度很慢 我从 参考 图像中获取一个像素 将其分解为 R
  • 从字节数组创建 8 位图像

    字节数组是这样获得的 BufferedImage image new Robot createScreenCapture new Rectangle screenDimension byte array DataBufferByte get
  • 从图像中提取红色通道

    我有一个图像为 X RGB 我想使用 Imagick 从中获取红色通道的图像 我尝试参考http www imagemagick org Usage quantize http www imagemagick org Usage quant
  • 使用GL着色器语言的相机帧yuv到rgb转换

    我从字节数组中的 android 相机预览回调获取相机帧并将其传递给 jni 代码 由于我们不能在 C 中使用字节 因此我将其转换为整数数组 如下所示 JNIEXPORT void JNICALL Java com omobio armad
  • 模拟颜色透明度

    我有 RGB 颜色值和 alpha 值 假设我有白色背景并且应用了 alpha 如何获得新的 RGB 值 应用于每个颜色通道的公式如下 cr cf af cb ab 1 af where cr是像素的最终颜色 cf是前景色 cb背景颜色 a
  • 如何在字符串中存储颜色?

    如果颜色是人类可读格式 我想将颜色存储在字符串中 如果不是 则将其存储在 ToArgb 中 颜色是红色 然后将其存储在 Red 字符串中 如果颜色是绿色的某种变体 则将其存储为 ff40ff80 在运行时我想将此字符串转换回 Color 类
  • 在 Python 中将图像中的颜色映射到颜色列表中最接近的成员

    我有一个 19 种颜色的列表 它是一个大小为 numpy 的数组 19 3 colors np array 0 0 0 0 0 255 255 0 0 150 30 150 255 65 255 150 80 0 170 120 65 12
  • 在c#中比较RGB颜色

    我正在尝试找到一种方法来比较两种颜色以找出它们的相似程度 我似乎找不到有关该主题的任何资源 因此我希望在这里得到一些指示 理想情况下 我希望得到一个分数来表明它们有多相似 例如 0 到 100 其中 100 相等 0 完全不同 Thanks
  • 在Python中将十六进制值转换为RGB值

    在这里处理杰里米的回应 将十六进制颜色转换为 RGB 反之亦然 https stackoverflow com questions 214359 converting hex color to rgb and vice versa我能够获得
  • 如何设置 BufferedImage 中的 RGB 像素以显示 16 位深度的 PNG?

    我正在尝试读取并显示 PNG 文件 我处理 8 位深度的图像没有问题 我按如下方式进行 BufferedImage result new BufferedImage width height BufferedImage TYPE INT R
  • 颜色生成功能

    让我们考虑以下场景 一个可以生成从白色到红色 从白色到蓝色 从白色到粉色 从白色到橙色等代码颜色的函数 颜色代码采用 RGB 格式 值从 0 到 255 有任何想法吗 您能给我伪代码或此类算法的链接吗 听起来你在追求线性插值 http en
  • 如何在C中将RGB转换为HSL?

    如何在 C C 中将 RGB 转换为 HSL Note This is a short self answer I posted it here so people can find it quickly with a search 翻译代
  • 作为颜色表示的值

    将值转换为颜色是众所周知的 我确实理解以下两种方法 在改变 RGB 颜色值来表示一个值 https stackoverflow com questions 1423925 changing rgb color values to repre
  • 如何使用 c 使用 libpng 更改 png 图像的 RGB 值?

    更改 png 图像的 rgb 值的推荐方法是什么 现在我正在使用示例代码来查看 libpng 的工作方式 它只打开一个 png 图像并写入另一个 png 图像 但是我想更改这个新图像的 RGB 值 使其变为全蓝色 绿色或红色 无论我选择什么
  • 如何计算位图的平均 RGB 颜色值

    在我的 C 3 5 应用程序中 我需要获取位图的红色 绿色和蓝色通道的平均颜色值 最好不使用外部库 这可以做到吗 如果是这样 怎么办 提前致谢 尝试让事情变得更精确 位图中的每个像素都有一定的 RGB 颜色值 我想获取图像中所有像素的平均

随机推荐

  • Ubuntu 14.04 16.04 18.04 安装Docker(Docker CE)

    Ubuntu 14 04 16 04 18 04 使用apt get进行安装 自17年开始 xff0c docker分为docker ce xff08 社区版 xff09 docker ee xff08 企业版 xff09 xff0c 另外
  • PHP实现跨域的解决方法

    PHP实现跨域解决方法 如果要实现跨域通过设置Access Control Allow Origin来实现跨域 例如 xff1a 客户端的域名是client runoob com xff0c 而请求的域名是server runoob com
  • SLAM后端——滤波与优化对比

    滤波与优化 xff1a 摘自 xff1a https www cnblogs com zengcv p 5994587 html 因为基于滤波的理论 xff0c 滤波器稳度增长太快 xff0c 这对于需要频繁求逆的EKF xff08 扩展卡
  • realsense t265测试

    roslaunch realsense2 camera rs t265 launch rosrun rviz rviz roslaunch vins estimator euroc launch 将加计和陀螺仪主题放在一起 修改rs cam
  • Intel Realsense t265获取相机参数

    rs sensor control
  • VINS-MONO需要修改的参数

    相机参数修改 xff1a 加速度和角速度发表在两个话题 xff0c 用上述方法将其发表在一个话题上 修改VINS MONO包 xff1a
  • MSCKF

    https github com TurtleZhong msckf mono
  • ROS毕设坑3:在ROS下用视觉方法求取R和t,然后将其发布

    今天莫名遇到两个问题 xff1a 之前调好的代码硬生生的跑不通 xff0c 就会出现下面这个问题 xff1a 大概意思就是说我还没得到图片呢就让他去计算 xff0c opencv就出错了 xff0c 我不信这个邪 xff0c 自己去调试了一
  • Linux网卡驱动pcnet32.c的注释(AM79C9*系列网卡的驱动)

    很久之前读的网卡驱动源码 xff0c 很多东西已经忘记了 xff0c 最近面试被问道了网卡收数据包的全过程 xff0c 只能答出一个很简单的过程 xff0c NAPI这种非常优秀的机制都没有想起来 xff0c 很惭愧 xff0c 重新复习了
  • ADRC算法Auto Disturbances Rejection control

    自抗扰控制 其中 xff0c e 61 v t y t 是控制系统参考输入量v t 与被控对象输出量y t 之间的差值 xff0c kp比例系数 ki积分系数 xff0c xff0c kd微分系数 优点 xff1a 1 仅由误差来决定控制
  • python 下运行ros

    1 建立l两个文件夹python ros scr 2 执行下述命令后 xff0c 将会在在src中 xff0c 建立一个包daodao 并且在文件夹daodao里生成了两个空文件夹 xff0c 有include daodao scr 和 C
  • tensor 与 array 的相互转化

    import tensorflow as tf import numpy as np a 61 np array 1 2 3 4 5 6 7 8 9 print a 1 2 3 4 5 6 7 8 9 b 61 tf constant a
  • keras.layers.UpSampling2D与tf.image.resize_nearest_neighbor

    参考https www bookstack cn read keras docs zh sources layers convolutional md keras layers UpSampling2D size 61 2 2 data f
  • Linux安装elasticsearch7.x(踩坑分享)

    安装并启动 首先下载elasticsearch压缩文件 xff0c 下载地址 我这里选择的是elasticsearch 7 17 1版本 xff1a https www elastic co cn downloads elasticsear
  • VNC 登录显示too many security failures的解决方法

    原因 xff1a 黑客试图登录 解决方法 xff1a 在putty上登录 xff0c 然后输入命令vncserver kill 5 杀掉vnc进程 之后输入su 你的用户名 使用su权限 输入命令 vnc 重启vnc 成功之后就可以再次登录
  • MapReduce案例运行及分词

    首先查询进程 xff0c 发现hadoop并没有启动 如何配置hadoop xff0c 参考我的另外一篇博文 Hadoop环境准备 接下来 xff0c 启动hadoop start all sh 或者 start dfs sh start
  • main函数是主线程吗

    1 线程的概念 xff1a 线程是程序最基本的运行单位 xff0c 而进程不能运行 xff0c 所以能运行的 xff0c 是进程中的线程 2 线程是如何创建起来的 xff1a 进程仅仅是一个容器 xff0c 包含了线程运行中所需要的数据结构
  • C#类型的转换:Converter<TInput, TOutput> 委托的使用

    Converter lt TInput TOutput gt 委托 表示将对象从一种类型转换为另一种类型的方法 此委托由 Array 类的 ConvertAll lt TInput TOutput gt 方法和 List lt T gt 类
  • 收藏一些不错的国外网站

    设备树 xff1a https www devicetree org LINUX xff1a https www arm linux org uk USB xff1a https github com pyusb pyusb PYTHON
  • 近红外跨模态行人重识别(RGB-IR Cross-Modality Re-id)(一)

    1 写在前面 本文是我阅读近红外的跨模态行人重识别 xff08 RGB IR Cross Modality Re id xff09 文献的笔记 xff0c 由于网上对该方面介绍的博客很少 xff0c 所以这里我记录下阅读文章的一些要点和我自