【风格迁移系列三】（Adain）Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization 论文解读

2023-11-19

最近看了这篇论文 Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization 。由于没有详细的博客参考，还是花了一些时间来阅读论文。于是提出自己对论文的理解，以供大家参考。下面直接进入主题：

1 Adaptive Instance Normalization

作者在 CIN 的基础上提出了 Adain ：
在这里插入图片描述
其中，x 和 y 分别是内容图片和风格图片 encode 后的特征图， σ \sigma σ 和 μ \mu μ 分别是均值和标准差。论文中说该公式将内容图片的均值和标准差与风格图片的均值和标准差对齐，我们可以这样理解：首先内容图片经过标准化后均值为0，标准差为1；然后乘以风格的标准差再加上风格的均值，Adain 的结果不就使得原来的内容特征图的标准差和均值与风格特征图的相同了吗？那么就可以说成它们的标准差和均值对齐了。

2 Model Architecture

在这里插入图片描述
论文的模型如上图：

首先将内容图片 c 和风格图片 s 输入 VGG 网络 f f f;
将 f ( c ) f(c) f(c) 和 f ( s ) f(s) f(s) 进行上述的 Adain 操作，得到 t；
最后通过 Decoder g g g 输出风格迁移结果 T ( c , s ) T(c,s) T(c,s)。

3 Training

首先总损失的定义和其他的论文类似：
在这里插入图片描述
内容损失定义如下：

可以看上图的模型最右边进行理解， f ( g ( t ) ) f(g(t)) f(g(t)) 就是将得到的结果再输入到 vgg 中的结果，然后与 t 计算均方差损失。

风格损失定义如下：
在这里插入图片描述
这里是计算decode生成的结果的均值和方差和风格特征图的均值和方差的均方差损失。也就是让 g ( t ) g(t) g(t) 和 t t t 的方差和均值对齐。

4 Code

官方实现（Torch）: https://github.com/xunhuang1995/AdaIN-style
非官方实现（Pyorch）: https://github.com/irasin/Pytorch_Adain_from_scratch

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

图像风格迁移

AdaIN 图像风格迁移

【风格迁移系列三】（Adain）Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization 论文解读的相关文章

SpringBoot配置多数据源，三数据源，mysql+oracle+mysql

废话不多说直接上代码 yml文件配置 server port 8080 spring datasource primary
小谈设计模式（1）—总序

小谈设计模式 1 总序专栏地址开始操作设计模式总论设计模式是什么组成要素模式名称问题描述解决方案效果描述设计模式有什么作用提供可重用的解决方案提高代码的可读性和可维护性促进代码的可扩展性提高代码的灵活性和可重用性
llvm之IR手册翻译（5）

原网址是 http llvm org docs LangRef html abstract 下面这些是我自己的翻译肯定有很多不恰当的地方做这些只是希望自己以后翻阅更加方便如果能对大家有所帮助那是极好的别名别名不像函数或变量不会
OSError:...libcublasLt.so.11 with link time reference

程序运行时报错 OSError u01 anaconda3 envs modlscope py39 lib python3 9 site packages nvidia cublas lib libcublas so 11 symbol c
无法从命令行或调试器启动服务，必须首先安装Windows服务....。在“安装”阶段发生异常。 System.Security.SecurityException:未找到源

此处一共两个问题第一个问题完整描述是无法从命令行或调试器启动服务必须首先安装Windows服务使用installutil exe 然后用ServerExplorer Windows服务器管理工具或NET START命令启动它第二个
Python基础教程:强大的Pandas数据分析库

Pandas是一个基于 NumPy 的非常强大的开源数据处理库它提供了高效灵活和丰富的数据结构和数据分析工具当涉及到数据分析和处理时使得数据清洗转换分析和可视化变得更加简单和高效本文中我们将学习如何使用Pandas来处理和分
集合addAll方法使用存在的问题。

集合addAll 方法的时候这里里有两个集合集合2要拿到集合1中的元素然后对集合2进行removeAll方法结果集合1中的值也没有了只是因为listTwo listOne 只是把集合1的引用给了集合2 集合1和集合2的引用是指向同
GDB and Reverse Debugging

Overview GDB version 7 0 due September 2009 will be the first public release of gdb to support reverse debugging the abi
PTA基础题练习-检查密码

PTA 检查密码本题要求你帮助某网站的用户注册模块写一个密码合法性检查的小功能该网站要求用户设置的密码必须由不少于6个字符组成并且只能有英文字母数字和小数点还必须既有字母也有数字输出格式输入样例输出样例本题要求你帮助某网站
Linux学习（一）：查看文件目录的几种常用方式

一将主文件夹下的所有文件列出来包括属性与隐藏文件完整呈现文件的修改时间注意无论如何 ls最长被使用到的功能还是那个 l的参数为此很多distribution在默认的情况中已经将ll l的小写设置成为ls l的意思了这个功能
kodi没有中文设置_kodi播放器设置中文的方法

KODI播放器是一款强大的多媒体播放器其能够支持目前几乎所有的主流格式文件的播放而且除了视频文件外即使是音乐图片电视节目等其他媒体文件也能够正常进行播放而且能够支持投屏扥更种辅助功能为用户提供了一套完整的播放方案因而广受用户
zookeeper学习草稿纸

指令重排序 https baijiahao baidu com s id 1701616903992143186 wfr spider for pc JVM JDK JRE 静态方法为什么不能调用非静态成员重载和重写的区别可变参数基本
高质量、高并发的实时通信架构设计与探索

中国互联网络信息中心 CNNIC 近日发布的第 47 次中国互联网络发展状况统计报告显示截至 2020 年 12 月我国网民规模达 9 89 亿随着社会信息化水平持续提升及电子设备加速普及手机网民规模持续增长基本实现对全体网民
关于Semaphore信号量的源码解读

Semaphore的简单使用利用Semaphore可以实现对线程数量的控制比如如下的代码 class SemaphoreTest public static void main String args Semaphore semapho
【RTX 3060Ti 深度学习环境配置图文（安装Anaconda、VScode、CUDA、CUDNN、pytorch）】

RTX 3060Ti 深度学习环境配置图文安装Anaconda VScode CUDA CUDNN pytorch 配置安装驱动一安装Anaconda 1 1 Anaconda简介 1 2 下载Anaconda 1 3安装Anaco
SpringBoot集成jasypt，加密yml配置文件

SpringBoot集成jasypt 加密yml配置文件一 pom配置二生成密文代码三配置 3 1 yml加密配置 3 2 密文配置 3 3 启动配置 3 4 部署配置四遇到的一些坑最新项目安全检测发现配置文件中数据库密码
Spring学习笔记day01——Spring入门

Spring学习 Spring介绍 1 1Spring概述 Spring是一个开源框架 Spring是于2003 年兴起的一个轻量级的Java 开发框架由Rod Johnson 在其著作Expert One On One J2EE Dev

随机推荐

设计模式的 C++ 实现---工厂方法模式(二)

前文回顾单例模式一单例模式二观察者模式简单工厂模式工厂方法模式一前言对于工厂方法模式当增加新产品时也需要对应增加一个工厂类可以使用模版进行封装减少代码工作量实现举例产品抽象基类 class Animal pu
TypeScript 基本概念

TypeScript 是什么目标能够说出什么是 TypeScript TS 官方文档 TS 中文参考不再维护 TypeScript 简称 TS 是 JavaScript 的超集 JS 有的 TS 都有 TypeScript Type
分布式锁实现方案2、基于Redis的SET操作实现的分布式锁

继上一篇文章分布式锁实现方案1 基于Redis的SETNX操作实现的分布式锁实现方案之后 redis又提供了更加强大的set方法可以解决分布式锁实现方案1中提到的缺陷直接看代码 package com alioo lock impo
C++Primer第五版习题答案（二）

第二章变量和基本类型 2 8 2 10 2 14 C Primer第五版课后习题答案目录 2 8 include
vue3项目实战---知乎日报----首页功能

目录网络请求封装 header swiper items新闻列表 home IntersectionObserver API 使用教程性能优化网络请求封装 GET传参格式 www baidu com info t 0 age 18 传
IntelliJ IDEA中代码被覆盖了怎么恢复

在你git pull 拉去代码的时候在IntelliJ IDEA中一不小心将你本地代码给覆盖了这个时候你撤回是无效的时候是不是有点小激动还有点小慌辛辛苦苦写的代码没啦被覆盖了不要慌只要用的是IntelliJ IDEA这个工
javaの日志级别

最近几周给项目补日志头都大了项目开发接口时一定要同步日志一定首先日志级别从低到高 all
网络安全应急响应操作流程-打好应急响应保卫战

文章目录应急响应应急响应目标应急响应标准流程事前事中检测响应处置溯源人的识别核心注意事项参考文献应急响应应急响应是安全工作的重点和难点由于响应过程中压力比较大难免出现手忙脚乱的情况因此怎样做好应急响应工作是
router和route的区别

简单理解为 route是用来获取路由信息的 router是用来操作路由的一 router router是VueRouter的实例通过Vue use VueRouter 和VueRouter构造函数得到一个router的实例对象这个对象
List、Queue

1 ArrayList 底层是基于动态数组的数据结构是有存放顺序的 2 LinkedList 底层是基于双链表的数据结构每一个存储单元都涉及到其他两个引用优缺点在执行get set 时 ArrayList的效率高 LinkedLi
Matlab产生离散正弦信号即绘制频谱图

假设正弦信号频率为f0 40000Hz 采样频率fs 160000Hz 注意 fs必须大于2f0 否则采到的点根本不是正弦实际上 fs 4f0是比较合适的 Matlab程序如下 function y gensinx f0 fs n N f
[YOLO专题-27]：YOLO V5 小目标检测遇到的问题与常见解决办法

作者主页文火冰糖的硅基工坊文火冰糖王文兵的博客文火冰糖的硅基工坊 CSDN博客本文网址 YOLO专题 27 YOLO V5 小目标检测遇到的问题与常见解决办法文火冰糖王文兵的博客 CSDN博客目录第1章前言第2章
freeswitch二、freeswitch之注册，呼叫接听测试

在上一篇文章中讲解了freeswitch的安装方法安装完后测试了和数据库的交互下面就要测试一下freeswitch的功能了 freeswitch测试 freeswitch的conf目录中有20个默认的sip账号可以直接做简单的测试其
sys用户下为其他用户的创建私有db link的案例

文章目录 1 查询job执行情况 2 确认根因 3 重建DB LINK 3 1使用current schema方式 3 2使用procedure方式 4 重新编译失效的对象并手动执行job 记录一下scheduler job执行失败而不
类型“ScriptManager”的控件“ScriptManager1”必须放在具有 runat=server 的窗体标记内。...
表单提交Post方法、Get方法背后的秘密

表单大家都很熟悉上网的时候经常会遇到表单表单用来接受用户的输入并将用户的输入以 name value值对集合的形式提交到服务器进行处理那么表单是怎样将数据提交到服务器的服务器是怎样对表单数据进行处理的下面我将为大家揭开表单提交
数据中台-让数据用起来-6

文章目录第六章数据开发数据价值提炼工厂 6 1 数据计算能力的4种类型 6 1 1 批计算 6 1 2 流计算 6 1 3 在线查询 6 1 4 即席分析 6 2 离线开发 1 作业调度 2 基线控制 3 异构存储 4 代码校验 5
Tomcat 服务器的使用（IDEA 2021.3）

目录 1 Tomcat 下载和安装 2 IDEA 创建 JavaWeb 项目 3 IDEA 集成 Tomcat 并发布项目服务器是计算机的一种它比普通计算机运行更快负载更高价格更贵服务器在网络中为其它客户机如PC机智能设备等
精致的动画特效源代码

动画特效 css简介代码部分纯css3云彩动画效果 css3放大镜动画效果 jQuery游戏图片手风琴收缩切换特效 js百叶窗图片3D旋转切换特效纯CSS3制作飞舞的火箭动画简单易用的纯CSS3图片墙效果一个简单好看的纯CSS3翻
【风格迁移系列三】（Adain）Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization 论文解读

最近看了这篇论文 Arbitrary Style Transfer in Real time with Adaptive Instance Normalization 由于没有详细的博客参考还是花了一些时间来阅读论文于是提出自己对论文的

热门标签