[CVPR2020] DoveNet: Deep Image Harmonization via Domain Verification 论文解读

2023-11-09

论文地址和代码

数据库和代码已公布:https://github.com/bcmi/Image_Harmonization_Datasets
论文地址:https://arxiv.org/abs/1911.13239

一.简介

图像合成 (image composition) 是图像处理的常用操作,把前景从一张图上剪贴下来粘贴到另一张图上,获得一张合成图。合成图可以用来获取感兴趣的目标图像,也可以用于数据增广,有着广泛的应用的前景。但通过这种方式得到的合成图存在诸多问题,比如前景的大小或位置不合理、前景和背景看起来不和谐等等。我们的工作侧重于解决合成图中前景和背景不和谐的问题。具体来说,在合成图中,前景和背景是在不同的拍摄条件 (比如时刻、季节、光照、天气) 下拍摄的,所以在亮度色泽等方面存在明显的不匹配问题。图像和谐化 (image harmonization) 旨在调整合成图中的前景,使其与背景和谐。

二.创新点

1.公开提供了高质量公共可用数据集
2.提出了一种使用新颖的域验证鉴别器的图像协调方法DoveNet, 该方法认为前景需要转换为与背景相同的域。(这里的域指的是光照,天气,季节等)

三.数据集构建

在这里插入图片描述
(a)图采用颜色转换的方法去构建合成图像,(b)图采用前后背景图拼接方法构建合成图像

四.DoveNet结构

4.1整体结构

在这里插入图片描述
DoveNet整体的一个结构采用了三个模型的连接,(a)Attention Enhanced Generator(U-Net加了一个attention模块)。(b)Global Discriminator(一个类似于GAN的Discriminator)。(c)Domain Verification Discriminator(域的一个Discriminator,这个域指的是光照,天气,季节等)

4.2 Attention Enhanced Generator

在这里插入图片描述
在这里插入图片描述
个人觉得作者的输入应该只有M~的图像,这个M二值图像只是一个区分前景和背景的展示
在这里插入图片描述
在这里插入图片描述
Lrec是这个网络的最小化损失函数是一个绝对误差损失

4.3 Global Discriminator

在这里插入图片描述
Attention Enhanced Generator网络生成的图像与真实图像一起放进网路训练,和训练GAN网络一样
在这里插入图片描述

4.4 Domain Verification Discriminator

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
这里也是个GAN网络

五.实验部分

5.1 实验结果对比展示

在这里插入图片描述
能看出来DovNet最终生成的图像和真实图像的域很像

5.2 不同模型同一数据集实验结果

在这里插入图片描述

5.3 消融实验:对模型结构进行分析

在这里插入图片描述

5.4 改变前景比例,对比各个模型的表现

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

[CVPR2020] DoveNet: Deep Image Harmonization via Domain Verification 论文解读 的相关文章

随机推荐

  • Git 第一次提交代码到远程分支

    1 创建远程仓库名称 创建远程仓库名称 2 复制远程仓库链接 这个链接到最后把本地库与远程库关联的时候要使用 复制远程仓库链接 3 到你要上传远程仓库的项目文件中点击右键 选择Git Bash Here 右键上传项目 右键选择Git Bas
  • Android学习之路-常用布局方式(4)

    设置视图间距有两种方式 layout margin 它指定了当前视图与周围平级视图之间的距离 包括 layout marginLeft layout marginTop layout marginRight layout marginBot
  • 微软 WSL 重装操作系统

    如果你对 WSL 还不怎么了解的话 请自行脑补下 简单理解就是 WSL 主要为了让你能够在 Windows 系统中运行 Linux 为什么需要这样 这是因为很多时候一些环境需要在 Linux 下运行 操作系统重装 如果希望对操作系统进行重装
  • 有关音频编码的知识与技术参数

    自然界中的声音非常复杂 波形极其复杂 通常我们采用的是脉冲代码调制编码 即PCM编码 PCM通过抽样 量化 编码三个步骤将连续变化的模拟信号转换为数字编码 1 什么是采样率和采样大小 位 bit 声音其实是一种能量波 因此也有频率和振幅的特
  • mongodb的优缺点

    对比mysql mongo的优缺点有 缺点 l 不支持事务操作 l 占用空间过大 l MongoDB没有如MySQL那样成熟的维护工具 l 无法进行关联表查询 不适用于关系多的数据 l 复杂聚合操作通过mapreduce创建 速度慢 模式自
  • 关于我在(PTA)程序设计类实验辅助教学平台的重修经历

    这里还是有必要说一下 为什么要搞这个该死的PTA的垃圾题目 这是关于我重修发博客的灰暗时刻 简单说一下为什么笔者要重修吧 大一上学期 在学校陆陆续续学C语言 其实也还算好 期末考试配上个平时分也还算能及格 但是经历了疫情之后 一整个学期 大
  • go语言基础学习

    Go 语言基础 学习笔记 一 go语言的特点 既有静态编译语言的安全和性能 又拥有动态语言开发维护的高效性 即 go c python 从c语言中继承了很多的理念 表达式语法 控制结构 基础的数据类型 调用参数传值 指针等等 保留了和c语言
  • 人工智能应用加速落地,推动券商业务+IT双升级|爱分析报告

    券商数字化转型已驶入快车道 多部政策文件相继发布 要求提升金融科技治理水平 加大科技资金投入 深化数字化转型 与此同时 受宏观经济环境下行影响 券商同质化竞争加剧 传统经纪业务增长承压 券商亟待寻求业务新增长点 在政策驱动和业绩承压的双重影
  • 第二十三课:Data setup

    PR Flow内容总览 在整个PR阶段 我们要做的主要可以分为三大部分 data setup部分 就类似于我们一般的Creat new project创建新项目的阶段 此阶段我们主要就是导入各种文件 Technology file TF文件
  • STM32F103常用的HAL库函数

    1 GPIO PA0输出高低电平 HAL GPIO WritePin GPIOA GPIO PIN 0 GPIO PIN RESET 低电平 HAL GPIO WritePin GPIOA GPIO PIN 0 GPIO PIN SET 高
  • valgrind简介与使用

    一 valgrind简介 Valgrind是一款用于内存调试 内存泄漏检测以及性能分析 检测线程错误的软件开发工具 Valgrind 是运行在Linux 上的多用途代码剖析和内存调试软件 主要包括Memcheck Callgrind Cac
  • Mysql API实践

    Mysql API实践 MySql 5 6的API官方见 http dev mysql com doc refman 5 6 en c api function overview html 下面给出一个简单的例子 include
  • Mybatis快速入门

    基本步骤 1 2 导入坐标 使用maven来构建项目只需将所需依赖注入
  • 【Java】基础知识练习题(编程题为主!)

    答案后续发布 欢迎来到小明的练习空间 一 异常 编程题 1 1 题目一 1 2 题目二 1 3 题目三 1 4题目四 二 集合 问答 编程题目 2 1 集合 编程题 Collection接口 2 2 集合 编程题 Collection接口
  • 调用用于获取服务器信息,一种获取测试用例的方法以及服务器

    1 一种获取测试用例的方法 其特征在于 包括 获取被测对象的函数调用关系信息 获取目标函数 所述目标函数为根据所述被测对象的被测版本源码和历史版本源码的差异信息确定的相关函数 所述被测版本源码是所述历史版本源码经过处理得到的 根据所述函数调
  • openEuler怎么查询端口是否被占用-ChatGPT回答

    openEuler怎么查询端口是否被占用 ChatGPT回答 在 openEuler 系统中 你可以使用以下命令来查询端口是否被占用 查看所有使用中的端口 lsof i 查看指定端口是否被占用 lsof i 端口号 例如 查看 80 端口是
  • 高次谐波电压、电流主要有哪些危害?

    高次谐波电压 电流主要有哪些危害 答 高次谐波电流超过一定限度会引起发电机 变压器 电动机损失增大 产生过热 高次谐波电压可能引起设备异常振动 继电保护误动 计量误差增大 晶闸管装置失控和影响通信质量等 高次谐波电流 电压更容易使电力电容器
  • JS获取随机或指定数据

    1 不能全是相同的数字或者字母 如 000000 111111 222222 333333等等 2 不能是连续数字 如 123456 12345678 87654321等等 顺序表 static String orderStr static
  • 模板类的继承问题

    首先大家来看这段代码 plain view plain copy class A public void Show cout lt lt A Show lt lt endl void Fun cout lt lt A Fun lt lt e
  • [CVPR2020] DoveNet: Deep Image Harmonization via Domain Verification 论文解读

    论文地址和代码 数据库和代码已公布 https github com bcmi Image Harmonization Datasets 论文地址 https arxiv org abs 1911 13239 一 简介 图像合成 image