论文阅读笔记之——Contextual Loss

2023-05-16

给出几篇论文的链接（

https://arxiv.org/pdf/1803.02077.pdf

https://arxiv.org/pdf/1803.04626.pdf）

无论是风格转换的任务中，还是超分辨率重建的任务中，有一个核心内容是找到生成图像跟目标图像特征之间的相似性度量。对于超分任务，从概率的角度看，也是希望生成图像跟目标图像的分布尽可能相似，因此提出使用一个比较特征分布的目标函数，而不仅仅是比较外观。若仅仅比较外观，就会存在MSE loss所带来的问题——over smooth

The commonly used loss functions for comparing images can be classified into two types:

•Pixel-to-pixel loss functions（针对图像pixel维度的）——compare pixels at the same spatial coordinates, e.g., L1, L2, the perceptual loss。这类损失函数对input 和GT 的要求比较高，是逐像素进行匹配的，对以PSNR、SSIM为客观评价指标的问题贡献比较大，但是从目前的研究来看，单单用这类损失函数，已经不能够满足我们的需求了。比如SRGAN这篇论文中提到MSE代价函数使重建结果有较高的信噪比PSNR，但是缺少了高频信息，出现过度平滑的纹理。perceptual loss的提出主要是为了更好的保留图像的高频信息。

全局平均，从而导致过平滑。见下图

•Global loss functions（针对整幅图像特征的）——perceptual loss，Gram loss which successfully captures style and texture by comparing statistics collected over the entire image.（通过比较在整个图像上收集的统计数据，成功捕获样式和纹理。）与perceptual loss相似的，Gram loss也是计算在特征层上的损失，这两个损失都是在整个VGG网络中得到的特征层进行的计算，约束的是全局高频特征的相似性；然而图像的相似性一般是局部的，这些约束也不是十分的合理（由于它的全局性，它把全局特性转换为整个图像。它不能用于约束生成的图像的内容）

更注重纹理特征，会更加的sharp。但是存在的问题是虽然更明亮，但是部分会出现倾斜，见下图

•adversarial loss functions (GAN，针对身材图像和目标图像的“逼真程度”)。GAN loss是一个常见的损失函数，通过简单的判断生成的图像是否“逼真”到以假乱真的程度，但是GAN的模式崩溃问题到目前都没有一个较好的解决办法。

而这篇论文的Contextual Loss——a loss function targeted at non-aligned data.（用于不对齐数据之间的loss）based on the similarity between their features, ignoring the spatial positions of the features. And, this approach allows the generated image to spatially deform with respect to the target. The Contextual loss is not overly global (which is the main limitation of the Gram loss) since it compares features, and therefore regions, based on semantics.

A nice characteristic of the Contextual loss is its tendency to maintain the appearance of the target image.(更倾向于保持目标图像的外观？可以理解为保持目标的轮廓么~~~) This enables generation of images that look real even without using GANs, whose goal is speci cally to distinguish between `real' and `fake', and are sometimes difficult to fine tune in training.

作者design a loss function that can measure the similarity between images that are not necessarily aligned. Comparison of non-aligned images is also the core of template matching methods, that look for image-windows that are similar to a given template under occlusions and deformations.作者认为通过一系列高维特征点来代表图片，当他们的高维特征点相似，那么两张图片就是相似的。如下图所示。两张图像同一区域的特征块中大部分是相似的(与点在特征图块的位置无关，只要能相似即可），就可以认为两张图像相似。这跟perceptual loss最不同的就是perceptual loss是跟特征的位置相关的(位置按点一一对应起来）。Based on this observation we formulate the contextual similarity measure between images.

Contextual Loss如下：

input image为x，target image 为y。其对应的特征点为：（特征点可以为VGG19生成的特征）。通过对应的xi特征与yj特征的相似性来计算出两张图片的contextual similarity

其中为xi特征与yj特征的相似性。

特别地，如果特征xi比Y中的其他特征更接近于特征yj，我们认为特征xi contextual similarity to特征yj。当xi跟任何的yj都不相似时，那么它对于所有的yj的contextual similarity都会很低。这种相似性对于距离的尺度是鲁棒的。如下图所示（仔细阅读图题）

设dij为xi与yj的cosine距离。

当认为两者是相似的。那么先通过归一化距离：

其中，再将距离转换为相似性，通过（通过求幂从距离转换到相似性）：

其中，最后，我们定义contextual similarity为：在特征之间是归一化相似性的尺度不变版本（将特征之间的上下文相似度定义为归一化相似度的尺度不变版本）

通过定义基于contextual similarity的loss的训练G网络。为perceptual network 的第l层。而perceptual network为VGG19

实际上的改变对比如下：

关于perceptual loss

https://www.jianshu.com/p/58fd418fcabf

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

论文阅读笔记之——Contextual Loss 的相关文章

Contextual loss

Mechrez R Talmi I Zelnik Manor L The contextual loss for image transformation with non aligned data J arXiv preprint arX
3D机器学习（6）：交叉熵（cross entropy loss），一种收敛更快的损失函数

1 交叉熵 xff08 cross entropy loss xff09 简介熵 61 entropy 61 不确定性 61 惊讶的度量越高的熵越低的信息度 xff0c 因此不确定性或者混乱性越高 xff0c 熵越高数学定义 xff0
交叉熵损失函数（Cross Entropy Loss）、散度（KL）

原文 xff1a 交叉熵散度
【机器学习】MATLAB Deep Learning Toolbox输出Loss下降曲线

目录 MATLAB Deep Learning Toolbox输出Loss下降曲线 MATLAB Deep Learning Toolbox输出Loss下降曲线 MATLAB Deep Learning Toolbox可以通过训练选项 pl
论文阅读笔记之——Contextual Loss

给出几篇论文的链接 xff08 https arxiv org pdf 1803 02077 pdf https arxiv org pdf 1803 04626 pdf xff09 无论是风格转换的任务中 xff0c 还是超分辨率重建的任
人脸识别概述[L-softmax | 人脸验证 | DeepFace | FaceNet | Triplet loss]

文章目录思维导图疑问用softmax分类做人脸识别 xff0c 怎么应用呀概念区分主流方法损失函数Softmax loss基于欧式距离的损失函数对比损失 xff08 Contrastive Loss xff09 三元组损失 xff08
旋转目标检测：The KFIoU Loss for Rotated Object Detection（Under review in ICLR 2022）

关键词 xff1a KFIoU 倾斜IoU SkewIoU 参考博客 xff1a https zhuanlan zhihu com p 447286823 论文原文下载 xff1a https openreview net pdf id 6
Generalized Focal Loss: Learning Qualified and Distributed BBoxes for Dense Object Detection论文翻译阅读

Generalized Focal Loss Learning Qualified and Distributed Bounding Boxes for Dense Object Detection论文翻译阅读论文下载地址 xff1a 点
【论文-损失函数】Learning with Average Top-k Loss

基本信息 paper Learning with Average Top k Loss code pytorch 论文思路该损失适用于在线难例挖掘即在训练时选择前K个loss较大的样本进行back propagate bp xff0c
【AI面试】损失函数（Loss），定义、考虑因素，和怎么来的

神经网络学习的方式就是不断的试错知道了错误然后沿着错误的反方向梯度方向不断的优化就能够不断的缩小与真实世界的差异此时如何评价正确答案与错误答案错误的有多么的离谱就需要一个评价指标这时候损失和损失函数就运用而生开始之
真正的非零预测的损失惩罚更高

我正在构建一个深度回归网络 CNN 来从图像 7 11 预测 1000 1 目标向量目标通常由大约90 为零并且只有10 非零值目标中非零值的分布因样本而异即不存在全局类别不平衡使用均方误差损失这导致网络仅预测零我对此并不感
训练期间损失没有减少（Word2Vec、Gensim）

哪些情况会造成损失model get latest training loss 每个时期都会增加用于训练的代码 class EpochSaver CallbackAny2Vec Callback to save model after e
比较 MSE 损失和交叉熵损失的收敛性

For a very simple classification problem where I have a target vector 0 0 0 0 and a prediction vector 0 0 1 0 2 1 would
我应该如何解释稀疏_分类_交叉熵函数的输出？

作为输入 a 具有浮点数 1 0 或 0 0 当我尝试用我的模型和sparse categorical crossentropy损失我得到类似的东西 0 4846592 0 5153408 我如何知道它预测什么类别您看到的这些数字是给定输
CNN 上的快速损失收敛意味着什么？

我正在两个不同的深度学习库 Caffe e Tensorflow 中训练两个 CNN AlexNet e GoogLeNet 该网络由每个图书馆的开发团队实施 here https github com BVLC caffe tree ma
如何有条件地为张量赋值[屏蔽损失函数]？

我想创建一个 L2 损失函数忽略标签值为 0 的值 gt 像素张量batch 1 包含标签同时output是净输出的张量两者的形状均为 None 300 300 1 labels mask tf identity batch 1 l
计算网络两个输出之间的 cosine_proximity 损失

我正在使用 Keras 2 0 2 功能 API Tensorflow 1 0 1 来实现一个接受多个输入并产生两个输出的网络a and b 我需要使用 cosine proximity 损失来训练网络这样b是标签a 我该怎么做呢在这里
Android：在应用程序中间时从 3G 切换到 WIFI = 网络连接丢失

我在使用 HTC Legend Android 2 2 时遇到了一个恼人的问题在 Xperia Galaxy Nexus 等上没有看到此问题当我在 3G 连接上启动应用程序获取一些数据然后进入手机设置并启用 WIFI 时手机会自动
ffmpeg 无损质量转换

当文件类型不是 flv mp4 webm 时我需要将所有视频转换到我的视频播放器在网站中当我使用时 ffmpeg i filename mkv sameq ar 22050 filename mp4 h264 0x645ee0 解码
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable

随机推荐

Deepin20.5安装JDK8

1 下载OpenJDK Deepin20 5下安装jdk 这里使用AdoptOpenJDK xff0c 版本8 虚拟机使用HotSplot 首先进入AdoptOpenJDK官网进行下载 xff0c 官方地址为 xff1a https ado
Deepin20.5安装maven

1 前置依赖安装Maven之前 xff0c 首先需要安装JDK xff0c 如何从Deepin中安装JDK xff0c 可以参考 xff1a Deepin20 5安装JDK8 2 下载Maven 官网最新版本已经变为3 8 xff0c 这
Python不智能的聊天机器人

上代码 xff01 亲测好用本文当做Git库 xff0c 经常更新 xff01 2022 08 17 V0 1 39 39 39 pyinstaller使用方法 home leopader local bin pyinstaller i
厌倦了各种app推送广告？用RSS来订阅自己想看的内容吧

前言现在是2022年 xff0c 大数据加上信息大爆炸 xff0c 让各种资讯类App已经到了满天飞的地步微博头条抖音 B站公众号等等等 xff0c 数之不尽 xff0c 一会看看这个 xff0c 一会看看那个 xff0c 应用来
linux安装极狐gitlab

1 官网寻找安装方式不管我们使用任何软件 xff0c 最靠谱的方式就是查看官方文档 gitlab提供了相应的安装文档 xff0c 并且有对应的中文文档地址如下 xff1a https gitlab cn install 我在这里以Cen
linux安装jenkins

1 官网寻找安装方式进入到jenkins官网 xff0c 找到对应的下载页面 xff1a https www jenkins io download 根据自己系统还有想要使用的版本 xff0c 进行选择即可这里我们使用CentOS作为示
使用jenkins实现自动化部署springboot应用

1 前置准备这里代码仓库使用gitlab 在介绍如何通过gitlab和jenkins进行自动化部署之前 xff0c 需要先安装完成gitlab以及jenkins 两种程序的安装方式以及相关配置可以参看以下内容 xff1a linux中安装
申请免费的国产泛域名证书

1 申请免费泛域名证书云服务商提供的免费证书一般都是单独域名证书 xff0c 对于泛域名 xff08 也可以称为子域名通配符域名 xff09 支持的较少如果想要使用免费的泛域名 xff0c 则需要付费购买或者使用Let s Encry
QT入门初学者——如何新建一个工程项目(详细)

本文讲的是如果用QT新建一个项目和打开现有的项目我这里的QT使用的是QT4 xff0c 如果需要安装软件的话去我的后序其他文章里找 xff0c 可以直接下载安装使用第一步 xff0c 先打开QT程序打开之后的页面是这样的 xff0c
QT入门初学者——如何更改Widget窗口左上角标题的图标

运行出来之后的界面左上角都是默认窗口的属性值 xff0c 今天教大家怎么个性化设置首先 xff0c 先打开自己的UI界面 xff0c 鼠标选中Widget xff08 QWidget xff09 在后下角属性调整里面找到下列两个属性值 x
QT入门初学者——如何创建和使用资源文件Resource（详细）

使用QT创建资源文件 xff0c 可以对UI设计窗口图标等一些需要用到图片或GIF图的地方首先先拥有一个基本的QT项目 xff0c 可以是全新创建的 xff0c 也可以是现有的 xff0c 打开该项目点击File gt New Fil
C语言题目：HDU - 1408 盐水的故事

题目描述挂盐水的时候 xff0c 如果滴起来有规律 xff0c 先是滴一滴 xff0c 停一下 xff1b 然后滴二滴 xff0c 停一下 xff1b 再滴三滴 xff0c 停一下 xff0c 现在有一个问题 xff1a 这瓶盐水一共有
使用Android Studio创建第一个程序Hello word超详细

首先 xff0c 打开Android Studio软件 xff0c 双击打开打开后的页面如下所示 xff0c 点击第一个新建一个项目点开之后如图所示 xff0c 点击Phone and Tablet xff0c 这个就是手机和平板适用
让我们和机器一起聊天

Python大法好 xff01 让我们做一个可以聊天的玩意 xff01 Python可以干好多事 xff0c 两天前 xff0c 我有一个想法 xff1a 和电脑交流我第一个想法就是打造一个字典数据集 xff0c 获取你的输入 xff0c
团体程序设计天梯赛-练习集-001 Hello World (5 分)

这道超级简单的题目没有任何输入你只需要在一行中输出著名短句 Hello World 就可以了输入样例 xff1a 无输出样例 xff1a Hello World include lt stdio h gt int main void
C++20新特性—range（一）

1 range的概念 Ranges 实际上可理解为一个接口规范 xff08 C 43 43 20中的concept xff09 xff0c 它针对集合 xff0c 提供begin 和end 两个方法 xff0c 返回一个指示类 xff08
Ubuntu 终端闪退的一个解决方法

Ubuntu 终端闪退的一个解决方法首先看一下 tmp 目录的权限情况 gxp span class hljs variable 64 gxp span span class hljs symbol span span class hlj
重拾旧时光——Bringing-Old-Photos-Back-to-Life

Bringing Old Photos Back to Life Bringing Old Photos Back to Life项目简介Bringing Old Photos Back to Life项目资源下载与配置Bringing O
学习笔记之——基于tensorflow的VESPCN

之前已经写了挺多的博文关于image 超分了 xff0c 接下来研究一下video 超分之前博文已经对VESPCN进行了理论的介绍 xff08 学习笔记之基于深度学习的图像超分辨率重构 xff09 之前做的超分都是基于pytorch的
论文阅读笔记之——Contextual Loss

给出几篇论文的链接 xff08 https arxiv org pdf 1803 02077 pdf https arxiv org pdf 1803 04626 pdf xff09 无论是风格转换的任务中 xff0c 还是超分辨率重建的任

论文阅读笔记之——Contextual Loss

论文阅读笔记之——Contextual Loss 的相关文章

随机推荐

热门标签