论文阅读笔记之——Contextual Loss

2023-05-16

给出几篇论文的链接(

https://arxiv.org/pdf/1803.02077.pdf

https://arxiv.org/pdf/1803.04626.pdf)

无论是风格转换的任务中,还是超分辨率重建的任务中,有一个核心内容是找到生成图像跟目标图像特征之间的相似性度量。对于超分任务,从概率的角度看,也是希望生成图像跟目标图像的分布尽可能相似,因此提出使用一个比较特征分布的目标函数,而不仅仅是比较外观。若仅仅比较外观,就会存在MSE loss所带来的问题——over smooth

The commonly used loss functions for comparing images can be classified into two types:

Pixel-to-pixel loss functions(针对图像pixel维度的)——compare pixels at the same spatial coordinates, e.g., L1, L2, the perceptual loss。这类损失函数对input 和GT 的要求比较高,是逐像素进行匹配的,对以PSNR、SSIM为客观评价指标的问题贡献比较大,但是从目前的研究来看,单单用这类损失函数,已经不能够满足我们的需求了。比如SRGAN这篇论文中提到MSE代价函数使重建结果有较高的信噪比PSNR,但是缺少了高频信息,出现过度平滑的纹理。perceptual loss的提出主要是为了更好的保留图像的高频信息。

全局平均,从而导致过平滑。见下图

Global loss functions(针对整幅图像特征的)——perceptual loss,Gram loss which successfully captures style and texture by comparing statistics collected over the entire image.(通过比较在整个图像上收集的统计数据,成功捕获样式和纹理。)与perceptual loss相似的,Gram loss也是计算在特征层上的损失,这两个损失都是在整个VGG网络中得到的特征层进行的计算,约束的是全局高频特征的相似性;然而图像的相似性一般是局部的,这些约束也不是十分的合理(由于它的全局性,它把全局特性转换为整个图像。它不能用于约束生成的图像的内容)

更注重纹理特征,会更加的sharp。但是存在的问题是虽然更明亮,但是部分会出现倾斜,见下图

adversarial loss functions (GAN,针对身材图像和目标图像的“逼真程度”)。GAN loss是一个常见的损失函数,通过简单的判断生成的图像是否“逼真”到以假乱真的程度,但是GAN的模式崩溃问题到目前都没有一个较好的解决办法。

而这篇论文的Contextual Loss——a loss function targeted at non-aligned data.(用于不对齐数据之间的loss)based on the similarity between their features, ignoring the spatial positions of the features. And, this approach allows the generated image to spatially deform with respect to the target. The Contextual loss is not overly global (which is the main limitation of the Gram loss) since it compares features, and therefore regions, based on semantics.

A nice characteristic of the Contextual loss is its tendency to maintain the appearance of the target image.(更倾向于保持目标图像的外观?可以理解为保持目标的轮廓么~~~) This enables generation of images that look real even without using GANs, whose goal is speci cally to distinguish between `real' and `fake', and are sometimes difficult to fine tune in training.

 

作者design a loss function that can measure the similarity between images that are not necessarily aligned. Comparison of non-aligned images is also the core of template matching methods, that look for image-windows that are similar to a given template under occlusions and deformations.作者认为通过一系列高维特征点来代表图片,当他们的高维特征点相似,那么两张图片就是相似的。如下图所示。两张图像同一区域的特征块中大部分是相似的(与点在特征图块的位置无关,只要能相似即可),就可以认为两张图像相似。这跟perceptual loss最不同的就是perceptual loss是跟特征的位置相关的(位置按点一一对应起来)。Based on this observation we formulate the contextual similarity measure between images.

Contextual Loss如下:

input image为x,target image 为y。其对应的特征点为:(特征点可以为VGG19生成的特征)。通过对应的xi特征与yj特征的相似性来计算出两张图片的contextual similarity

其中为xi特征与yj特征的相似性。

特别地,如果特征xi比Y中的其他特征更接近于特征yj,我们认为特征xi contextual similarity to特征yj。当xi跟任何的yj都不相似时,那么它对于所有的yj的contextual similarity都会很低。这种相似性对于距离的尺度是鲁棒的。如下图所示(仔细阅读图题)

设dij为xi与yj的cosine距离。

认为两者是相似的。那么先通过归一化距离:

其中,再将距离转换为相似性,通过(通过求幂从距离转换到相似性):

其中,最后,我们定义contextual similarity为:在特征之间是归一化相似性的尺度不变版本(将特征之间的上下文相似度定义为归一化相似度的尺度不变版本)

通过定义基于contextual similarity的loss的训练G网络。为perceptual network 的第l层。而perceptual network为VGG19

实际上的改变对比如下:

 

 

关于perceptual loss

https://www.jianshu.com/p/58fd418fcabf

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

论文阅读笔记之——Contextual Loss 的相关文章

随机推荐

  • Deepin20.5安装JDK8

    1 下载OpenJDK Deepin20 5下安装jdk 这里使用AdoptOpenJDK xff0c 版本8 虚拟机使用HotSplot 首先进入AdoptOpenJDK官网进行下载 xff0c 官方地址为 xff1a https ado
  • Deepin20.5安装maven

    1 前置依赖 安装Maven之前 xff0c 首先需要安装JDK xff0c 如何从Deepin中安装JDK xff0c 可以参考 xff1a Deepin20 5安装JDK8 2 下载Maven 官网最新版本已经变为3 8 xff0c 这
  • Python不智能的聊天机器人

    上代码 xff01 亲测好用 本文当做Git库 xff0c 经常更新 xff01 2022 08 17 V0 1 39 39 39 pyinstaller使用方法 home leopader local bin pyinstaller i
  • 厌倦了各种app推送广告?用RSS来订阅自己想看的内容吧

    前言 现在是2022年 xff0c 大数据加上信息大爆炸 xff0c 让各种资讯类App已经到了满天飞的地步 微博 头条 抖音 B站 公众号等等等 xff0c 数之不尽 xff0c 一会看看这个 xff0c 一会看看那个 xff0c 应用来
  • linux安装极狐gitlab

    1 官网寻找安装方式 不管我们使用任何软件 xff0c 最靠谱的方式就是查看官方文档 gitlab提供了相应的安装文档 xff0c 并且有对应的中文文档 地址如下 xff1a https gitlab cn install 我在这里以Cen
  • linux安装jenkins

    1 官网寻找安装方式 进入到jenkins官网 xff0c 找到对应的下载页面 xff1a https www jenkins io download 根据自己系统还有想要使用的版本 xff0c 进行选择即可 这里我们使用CentOS作为示
  • 使用jenkins实现自动化部署springboot应用

    1 前置准备 这里代码仓库使用gitlab 在介绍如何通过gitlab和jenkins进行自动化部署之前 xff0c 需要先安装完成gitlab以及jenkins 两种程序的安装方式以及相关配置可以参看以下内容 xff1a linux中安装
  • 申请免费的国产泛域名证书

    1 申请免费泛域名证书 云服务商提供的免费证书一般都是单独域名证书 xff0c 对于泛域名 xff08 也可以称为子域名 通配符域名 xff09 支持的较少 如果想要使用免费的泛域名 xff0c 则需要付费购买或者使用Let s Encry
  • QT入门初学者——如何新建一个工程项目(详细)

    本文讲的是如果用QT新建一个项目和打开现有的项目 我这里的QT使用的是QT4 xff0c 如果需要安装软件的话去我的后序其他文章里找 xff0c 可以直接下载安装使用 第一步 xff0c 先打开QT程序 打开之后的页面是这样的 xff0c
  • QT入门初学者——如何更改Widget窗口左上角标题的图标

    运行出来之后的界面左上角都是默认窗口的属性值 xff0c 今天教大家怎么个性化设置 首先 xff0c 先打开自己的UI界面 xff0c 鼠标选中Widget xff08 QWidget xff09 在后下角属性调整里面找到下列两个属性值 x
  • QT入门初学者——如何创建和使用资源文件Resource(详细)

    使用QT创建资源文件 xff0c 可以对UI设计 窗口图标等一些需要用到图片或GIF图的地方 首先先拥有一个基本的QT项目 xff0c 可以是全新创建的 xff0c 也可以是现有的 xff0c 打开该项目 点击File gt New Fil
  • C语言题目:HDU - 1408 盐水的故事

    题目描述 挂盐水的时候 xff0c 如果滴起来有规律 xff0c 先是滴一滴 xff0c 停一下 xff1b 然后滴二滴 xff0c 停一 下 xff1b 再滴三滴 xff0c 停一下 xff0c 现在有一个问题 xff1a 这瓶盐水一共有
  • 使用Android Studio创建第一个程序Hello word超详细

    首先 xff0c 打开Android Studio软件 xff0c 双击打开 打开后的页面如下所示 xff0c 点击第一个新建一个项目 点开之后如图所示 xff0c 点击Phone and Tablet xff0c 这个就是手机和平板适用
  • 让我们和机器一起聊天

    Python大法好 xff01 让我们做一个可以聊天的玩意 xff01 Python可以干好多事 xff0c 两天前 xff0c 我有一个想法 xff1a 和电脑交流 我第一个想法就是打造一个字典数据集 xff0c 获取你的输入 xff0c
  • 团体程序设计天梯赛-练习集-001 Hello World (5 分)

    这道超级简单的题目没有任何输入 你只需要在一行中输出著名短句 Hello World 就可以了 输入样例 xff1a 无 输出样例 xff1a Hello World include lt stdio h gt int main void
  • C++20新特性—range(一)

    1 range的概念 Ranges 实际上可理解为一个接口规范 xff08 C 43 43 20中的concept xff09 xff0c 它针对集合 xff0c 提供begin 和end 两个方法 xff0c 返回一个指示类 xff08
  • Ubuntu 终端闪退的一个解决方法

    Ubuntu 终端闪退的一个解决方法 首先看一下 tmp 目录的权限情况 gxp span class hljs variable 64 gxp span span class hljs symbol span span class hlj
  • 重拾旧时光——Bringing-Old-Photos-Back-to-Life

    Bringing Old Photos Back to Life Bringing Old Photos Back to Life项目简介Bringing Old Photos Back to Life项目资源下载与配置Bringing O
  • 学习笔记之——基于tensorflow的VESPCN

    之前已经写了挺多的博文关于image 超分了 xff0c 接下来研究一下video 超分 之前博文已经对VESPCN进行了理论的介绍 xff08 学习笔记之 基于深度学习的图像超分辨率重构 xff09 之前做的超分都是基于pytorch的
  • 论文阅读笔记之——Contextual Loss

    给出几篇论文的链接 xff08 https arxiv org pdf 1803 02077 pdf https arxiv org pdf 1803 04626 pdf xff09 无论是风格转换的任务中 xff0c 还是超分辨率重建的任