南大和中大“合体”拯救手残党:基于GAN的PI-REC重构网络,终于有救了

2023-11-14

对于喜欢画画的你来说,总是画得七零八落,不堪入目,但现在,有一种方法可以让你像专业人士那样,让你的糟糕画作变成一副完美的作品。

南京大学和中山大学的三位研究人员发布的最新论文中,提出了一种具有边缘和色域的渐进式图像重构网络 PI-REC,这是一种基于 GAN 的渐进式训练方法,它能从超二值稀疏边缘以及色块中还原重构真实图像,最终“合成”一张高精度图像,当然它并非自动绘画。

总之,你们画的半成品“老婆”们的美貌有救了。

论文链接:https://arxiv.org/abs/1903.10146

 

研究者介绍说,PI-REC 项目属于图像重构、图像转化、条件图像生成以及 AI 自动绘画等前沿交叉领域的最新产出,而非简单的以图搜图等,它主要有以下三种功能:

  • 图(a): 超稀疏输入信息重建原图。PI-REC 方法能够从提取的稀疏边缘和平面色域中重构逼真图像。

  • 图 (b): 手绘草图转换。PI-REC 方法可以在手绘草图的基础上合成准确和微调图像。

  • 图 (c): 用户自定义的边缘到图像(edge-to-image,E2I) 转化。用户可以将自定义和像素级的样式图像注入 PI-REC 模型以获得准确输出。

     

 

当然,用相似内容进行 I2I 转化也没问题。

 

近年来,在图像到图像(I2I)转化领域,Pix2Pix 等方法可以从稀疏二值边缘图中合成逼真图像,并根据条件生成对抗网络(cGAN)部署循环框架。不过,在边缘到图像(E2I)转化领域无法生成高保真图片。于是研究者开始考虑解决稀疏输入和可控样式空间的矛盾。

在 S2I 合成、I2I 转化、IR(图像识别)等领域使用的主要方法功能比较,PI-REC 具有更多的功能。†表示输入的各种特性,*表示输出质量。

 

受绘画过程的启发,基于生成对抗网络的 PI-REC 由三个阶段组成:旨在初始化网络的模拟阶段(Imitation Phase),然后是以重构初步图像的生成阶段(Generating Phase)以及用于将初步图像微调到具有最终细节输出的精细化阶段(Refinement Phase)。该框架允许他们的模型从稀疏输入信息中生成丰富的高频细节。

值得一提的是,这三大阶段都只用了一个生成器和一个判别器。训练期间,在同一个生成器上利用渐进式策略可以减少时间和 RAM 内存成本。

 

研究者还探讨了从图像中隐式分解样式潜在空间的缺陷,并证明了模型中的显式色域为什么在可控性和可解释性方面表现更好。在实验中,他们在重构真实图像和将手绘草稿转化为令人满意的绘画作品方面取得了出色的成果。此外,在边缘到图像转换领域,他们的模型 PI-REC 在定量和定性方面评估真实性和准确性方面是最好的方法。

 

以下为论文中的部分实验图表数据:

(a)不同稀疏级别输入结果。由于训练时的 HC(超参数混淆)操作,本文的模型对用于测试的特定超参数不敏感。(b)对比有 HC 操作和无 HC 操作的输出结果。当在训练中应用 HC 操作时,研究者可以在局部细节上获得更好的质量,而且能从非常稀疏的内容或样式中获得不错的输出。

 手绘草图转化。上层表示手绘草图与已编辑边缘和色域相结合,下层表示输出,它们对手绘图输入的微小变化会做出敏捷响应。

 定性比较 PI-REC 与基线的结果。对于 MUNIT 和 BicycleGAN,研究者分别将真实图像和颜色域作为样式输入,以便得到最好的重构输出。显然,经过精细化调整的 PI-REC 模型可以更准确地重构内容和颜色细节。

总体而言,该论文的研究者提出了一种用于图像重构任务的新型渐进性模型 PI-REC。当只取超稀疏二值边缘和平面色域的输入时,能实现精细化和高质量的重构输出。输入的稀疏性和可解释性保证了用户对图像内容或风格的自由、准确控制,这是对现有作品的重大改进。

 

该方法在 E2I 任务的标准基准测试中取得了较好的成绩。同时,他们利用参数混淆操作(HC),在手绘图纸转换任务中取得了显著的效果,从而推动了自动绘制技术的发展。如果两个领域的内容相似,该方法也可以有条件地应用于 I2I 转换任务中。

 

GitHub链接:https://github.com/youyuge34/PI-REC

 

 

PI-REC 安装

 

基础环境

  • Python 3+

  • PyTorch 1.0(0.4不支持)

  • NVIDIA GPU + CUDA cuDNN

     

 

 

第三方库安装

  • 复制这个 repo

  • 从 http://pytorch.org 安装PyTorch和依赖项

  • 安装python要求:

 

pip install -r requirements.txt

 

 

运行使用

 

提供以下两种方式运行:

  • 命令基础行模式用来批处理测试整个文件夹数的图片

  • 绘画 GUI 模式工具用来实现交互式创作

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

南大和中大“合体”拯救手残党:基于GAN的PI-REC重构网络,终于有救了 的相关文章

  • 那个当年的三本学渣,为啥最后进了大厂?

    自我介绍 我是一名普通的三本大学生 自学开发 相继经历了接外包 创业 合伙人跑路等一系列事情 从一开始对于计算机的一无所知到现在拿到了一线互联网企业的special offer 磕磕碰碰 一路走来 可谓辛酸苦辣 大一小白 我就读的专业偏计算
  • 官宣——BSV工程师能力认证项目在CSDN推出线上学习平台

    去年11月 上海可一澈科技有限公司 以下简称 可一科技 与CSDN联合推出了BSV区块链开发工程师能力认证项目 以下简称 BSV工程师认证 今天 BSV工程师认证项目正式推出一个全新的线上学习平台 并发布首门课程 比特币协议与设计 本次推出
  • ​深度学习引用数最高的十大论文(附论文下载)

    在过去的几年里 作为机器学习和统计学习的子领域 深度学习已经在诸多领域取得了令人印象深刻的突破 鲁棒性的开源工具 云计算以及大量可用的数据是深度学习能够取得成功的重要基石 下面 我们列出十大深度学习论文 1 Deep Learning by
  • @那些想要转行AI的人:送你一份人工智能入门指南

    人工智能是什么 人工智能为何重要 我们应该畏惧人工智能吗 为什么突然之间所有人都在谈论人工智能 你可能会从网上知道人工智能如何为亚马逊和Google的虚拟助理提供支持 或者人工智能如何一步步地取代所有的工作 有争议的 但是这些文章极少很好的
  • C语言这么厉害,它自身又是用什么语言写的?

    作者 码农翻身刘欣 出自 码农翻身 ID coderising 这是来自我的星球的一个提问 C语言本身用什么语言写的 换个角度来问 其实是 C语言在运行之前 得编译才行 那C语言的编译器从哪里来 用什么语言来写的 如果是用C语言本身来写的
  • 超级厉害的汇总图——人工智能之机器学习算法体系

    1 人工智能之机器学习体系汇总 直接上干货 此处梳理出面向人工智能的机器学习方法体系 主要体现机器学习方法和逻辑关系 理清机器学习脉络 后续文章会针对机器学习系列讲解算法原理和实战 抱着一颗严谨学习之心 有不当之处欢迎斧正 2 人工智能相关
  • 最萌算法学习,一秒让程序员及其女友都能学会!

    普通程序员 不学算法 也可以成为大神吗 对不起 这个 绝对不可以 可是算法好难啊 看两页书就想睡觉 所以就不学了吗 就一直当普通程序员吗 如果有一本算法书 看着很轻松 又有代码示例 又有讲解 怎么会有那样的书呢 哎呀 最好学了算法人还能变得
  • 如何写毕业设计——文献综述

    文献综述是一种收集某一特定学科大量信息数据的学术论文 经过综合分析 它是一种学术论文 它是一种科学文献 文献综述反映了某一学科或某一领域重要课题的最新进展 学术见解和建议经常反映有关问题的新发展 新趋势 新水平 新原则和新技术等等 写一篇文
  • AI工程师职业规划指南——中科院大牛告诉你如何成为一名语音识别工程师

    语音识别基础知识 数学与统计学 数学是所有学科的基础 其中的高等数学 数理方程 泛函分析等课程是必要的基础知识 概率论与数理统计也是语音识别的基础学科 声学与语言学 声学基础 理论声学 声学测量等是声学方面的基础课程 有助于了解更多声学领域
  • 十大经典排序算法动画与解析

    排序算法是 数据结构与算法 中最基本的算法之一 排序算法可以分为内部排序和外部排序 内部排序是数据记录在内存中进行排序 而外部排序是因排序的数据很大 一次不能容纳全部的排序记录 在排序过程中需要访问外存 常见的内部排序算法有 插入排序 希尔
  • 超5星难度【微软Core allocation】Coding赛题 - 解题思路&优秀代码分享,邀你来“找茬儿”

    6月23日英雄会平台发布了一道难度为超5星的微软比赛题目 截止活动结束共有300多名编程爱好者参与线上答题 而最终通过者仅有7人 通过率仅为2 为什么成绩如此出人意料 是因为原题的英文描述难以理解 还是题目本身的难度太高让很多人望而生畏知难
  • 面试过程中会遇到的机器学习教科书中 7 大经典问题

    如果希望了解机器学习 或者已经决定投身机器学习 你会第一时间找到各种教材进行充电 同时在心中默认 书里讲的是牛人大神的毕生智慧 是正确无误的行动指南 认真学习就能获得快速提升 但实际情况是 你很可能已经在走弯路 科技发展很快 数据在指数级增
  • ES6中数组首尾两端和中间添加/移除数据方法

    1 push 尾端插入 返回数组长度 let arr 1 hello true console log arr push 22 4 console log arr arr 1 hello true 22 console log arr pu
  • 用python画个佩奇来瞧瞧

    闲来无事 用turtle画了个小猪佩奇 代码其实很简单的 就是烦了点 没必要每行代码都发出来 给大家看几个主要的函数好了 另外我给绝大多数代码都加上了注释 相同的代码我就不加了 首先需要初始化画笔的一些属性 包括颜色 画笔的画画速度等 de
  • AI技术进阶的75道面试题

    本文转载自AI科技大本营 整理 AI科技大本营 出品 AI科技大本营 公众号id rgznai100 导语 正值求职 跳槽季 无论你是换工作还是找实习 没有真本事都是万万不行的 可是如何高效率复习呢 之前我们给大家推荐了一份 Python
  • 南大和中大“合体”拯救手残党:基于GAN的PI-REC重构网络,终于有救了

    对于喜欢画画的你来说 总是画得七零八落 不堪入目 但现在 有一种方法可以让你像专业人士那样 让你的糟糕画作变成一副完美的作品 南京大学和中山大学的三位研究人员发布的最新论文中 提出了一种具有边缘和色域的渐进式图像重构网络 PI REC 这是
  • 一个好玩的编程小游戏—— 母牛生小牛

    题目 母牛从3 7岁初每年会生产1头小母牛 10岁后死亡 10岁任然存活 假设初始有一头刚出生的母牛 请问第n年有多少头母牛 年从第一年开始计数 注 第三年初会出生 第一头母牛 故第三年有两头母牛 第五年初 第三年出生的母牛会生产 故第五年
  • 如何成为一名合格的互联网大厂Python工程师?

    Python开发工程师 是一个在IT行业圈子里一直都很热门的话题 无论是像腾讯 百度这样的大型公司 还是刚刚起步的初创公司 都会招python开发工程师 python已成为越来越多开发者的开发语言选择 而python开发工程师工资基本上都高
  • 一个好玩的小游戏——麻神之战

    题目 一种新的麻将 只留下一种花色 并且除去了一些特殊和牌方式 例如七对子等 规则如下 共有36张牌 每张牌是1 9 每个数字4张牌 你手里有其中的14张牌 如果这14张牌满足如下条件 即算作和牌 14张牌中有2张相同数字的牌 称为雀头 除
  • 原动力×云原生正发声 降本增效大讲堂

    原动力 云原生正发声 降本增效大讲堂课程活动链接 原动力 云原生正发声 降本增效大讲堂 提升IT资源利用率 实现降本增效 已经成为企业关注重点 2021 年 CNCF FinOps Kubernetes Report 指出 迁移至 Kube

随机推荐

  • 新手教程!设置PDF文件的页面大小

    设置文档的页面大小是办公一族经常遇到的一种操作 如果是word文档 那简直就是so easy 但在日常工作中 我们偶尔会遇到PDF格式的文件 由于对它不熟悉 想要对PDF文档的页面大小进行修改 又该如何操作呢 这时我们就需要借助一款非常专业
  • 客户价值预测:线性回归模型与诊断(概念)

    客户生命周期可分为四个阶段 潜在客户阶段 响应客户阶段 既得客户阶段 流失客户阶段 本章整体是一个客户价值预测的案例 背景是某信用卡公司在地推活动之后 获取了大量客户的信用卡申请信息 其中一个部分客户顺利开卡 并且有月消费记录 而另外一部分
  • C语言结构体应用-通讯录

    这里写目录标题 总体介绍 一 数据的定义及数据初始化 二 增加联系人 三 删除联系人 四 修改某个联系人 五 显示所有联系人 六 删除所有联系人 七 按名字首字母排序联系人 八 查找联系人 九 代码展示 总体介绍 本文主要介绍一个结构体的应
  • vue 点击事件失效

    点击事件失效的情况 总共有三种 1 没有点到那个元素 比如说div gt span 事件绑定在div上 但是它可能点来点去是在span标签上面 这种情况 把 click点击事件绑定到span上测试一下就好了 如果是被覆盖了 加个这个 sto
  • error while loading shared libraries: libcublasLt.so.11 解决方法

    在运行cuda程序的时候 有时候会遇到此类错误 error while loading shared libraries libcublasLt so 11 问题是两个 确实没有此类库文件 有此库文件 不过没有放在正确的地方 针对第一类 如
  • Java实现将JSON文件导出到Excel

    文章目录 一 运行环境 二 需求描述 三 实现思路 四 实现代码 一 运行环境 windows10 IDEA 2022 JDK 8 Maven 3 8 6 Apache POI 5 fastjson2 二 需求描述 写一个功能 任意json
  • 利用Vulnhub复现漏洞 - Adobe ColdFusion 反序列化漏洞(CVE-2017-3066)

    Adobe ColdFusion 反序列化漏洞 CVE 2017 3066 Vulnhub官方复现教程 漏洞原理 复现漏洞 启动环境 漏洞复现 生成POC 发送POC 发送POC内容 检验POC 进入容器 通过DockerID进入容器 查看
  • 软工实践2019——第二次作业评分

    第二次作业评分 第二次作业原文 写在前面的话 看了大家陆续提交的第一次作业 感慨良多 初心 勇气和信心 回顾初心 回想自己当初为什么报这个专业 不知你们是否看过电影 无问西东 其中有一句台词 如果提前了解了你们要面对的人生 不知你们是否还会
  • VirtualBox中安装Android-x86详解

    1 下载安装VirtualBox 官网 http www virtualbox org wiki Downloads 2 下载Android x86 官网 http www android x86 org download 这里我们下载5
  • 19. 第三方库的管理和虚拟环境

    Hi 大家好 我是茶桁 在我们之前的课程中 讲解了数据 函数 类 模块以及包 这些基本上已经构成了Python的全部了 那么 我们在学习Python的包之后 有没有思考过 既然Python有内置模块 我们也可以自己写一些模块来使用 那一定有
  • 3D游戏设计作业10:AR/MR 技术

    AR MR 技术 游戏截图 1 作业要求 1 图片识别与建模 2 虚拟按键小游戏 2 设计思路 1 首先是要安装Vuforia 这里直接在file build settings player settings里勾选Vuforia Augme
  • 【漏洞复现】CVE-2021-32682 elFinder ZIP 参数与任意命令注入

    1 Vulhub启动环境 2 查看端口号 3 输入网址 ip 8080 打开网页 4 先创建一个普通的文本文件1 txt 5 然后右键这个文件 对其进行打包 打包后的文件命名为2 zip 并同时进行抓包 获取1 txt的base64编码 6
  • 成员变量与局部变量

    一 成员变量 在类中定义 用来描述对象将要有什么 二 局部变量 在类的方法中定义 在方法中临时保存数据 三 成员变量和局部变量的区别 1 作用域不同 局部变量的作用域仅限于定义它的方法 成员变量的作用域在整个类内部都是可见的 2 初始值不同
  • 【总结】爬虫流程

    爬虫流程 根据所需数据确定爬虫网页 首先考虑resquests 需要提前导入 1 若是文本数据 用response text 2 若是下载视频 图片 音频 用response content 3 若是json接口 用response jso
  • CSS整体界面设计

  • RBAC简介

    RBAC BAC基于角色的访问控制 RBAC认为权限授权的过程可以抽象地概括为 Who是否可以对What进行How的访问操作 RBAC简介 基于角色的权限访问控制模型 在RBAC模型里面 有3个基础组成部分 分别是 用户 角色和权限 RBA
  • Java多线程异常处理

    文章目录 一 线程中出现异常的处理 1 线程出现异常的默认行为 2 setUncaoughtExceptionHandler 方法处理异常 3 setDefaultUncaoughtExceptionHandler 方法进行异常处理 二 线
  • vue3.0的安装配置(含node和npm的配置)

    文章目录 一 下载Node js 二 配置环境变量 三 配置NPM下载存放目录 文件不用事先创建 四 NPM设置镜像仓库 淘宝镜像仓库 五 vue cli脚手架创建Vue3 0项目 一 下载Node js 下载地址 二 配置环境变量 在CM
  • SpringBoot自定义错误页面 与 全局异常处理

    Springboot中需要自定义错误页面 一 使用Springboot默认的配置 1 在templates下穿件一个目录 error 2 在error目录下创建相应的对应的文件即可 如 400 html 500 html 二 自定义错误页面
  • 南大和中大“合体”拯救手残党:基于GAN的PI-REC重构网络,终于有救了

    对于喜欢画画的你来说 总是画得七零八落 不堪入目 但现在 有一种方法可以让你像专业人士那样 让你的糟糕画作变成一副完美的作品 南京大学和中山大学的三位研究人员发布的最新论文中 提出了一种具有边缘和色域的渐进式图像重构网络 PI REC 这是