灰度重采样的方法分为_基于深度学习的着色方法介绍

2023-11-06

用于灰度图像着色是一种空间内插,即8比特的灰度空间扩展到24比特的RGB空间。下面以两篇文章为引子解释深度学习的应用。


论文【1】是一种全自动方法从灰度产生逼真的色彩。针对着色问题的潜在不确定性,它将其作为分类任务并在训练时使用类重平衡(class-rebalancing)来增加着色的多样性。

首先,颜色空间表示如图所示,(a)量化的ab颜色空间,网格大小为10,在色域中总共313个ab对;(b)对数尺度表示的ab值经验概率分布;(c)对数尺度表示的以L为条件的ab值经验概率分布。这里将着色看出一个多模式分类问题,其中颜色ab输出空间量化为网格大小为10的区间,并保持色域内的Q = 313值。 给定输入X,学习映射Z = G(X),输出到可能颜色Z∈[0,1] H×W×Q的概率分布,其中Q是ab值的量化级数。

为了比较预测的Z^与基础事实(GT),定义函数Z = H gt -1(Y),用软编码方案将GT颜色Y转换为矢量Z。然后,多模式交叉熵损失Lcl(·,·)定义如下:

通过基于像素颜色稀有度,在训练时重新加权每个像素的损失来解决类别不平衡(class- imbalance)问题,这渐近地等同于典型的重采样训练空间方法。基于其最接近的ab格,每个像素由因子w ∈RQ加权。

如图所示是网络架构图,训练该CNN模型从灰度输入映射到输出量化颜色值的分布。每个conv层是2或3个重复的卷积层和ReLU层的块,然后是批处理归一化(BN)层,没有池化层。分辨率的所有变化都是通过conv块之间的空域下采样或上采样实现。

如下两个图和是一些实验结果:重平衡的分类损失比无重平衡的回归损失或分类损失的结果更准确,更有活力。第一个图是成功的着色结果。第二个图是失败的例子,常见故障如下:无法捕捉长距离一致性、频繁的红蓝色混淆以及复杂室内场景默认的棕褐色调。


论文【2】也是一种全自动着色方法,不同的是,它重新定义了着色为匹配问题;可更好地利用全局图像信息,采用自适应图像聚类技术;为了确保无畸变,采用基于联合双边滤波(joint bilateral filtering)的后处理方法。

如图所示是采用大型参考图像数据库和深度学习着色法的直观图。(a)给出通过自适应图像聚类技术被分为各种类的参考图像,用于每个类训练深度神经网络(DNN)。(b)着色方法和DNN架构。给定灰度,首先自动探索最近的类和相应训练的DNN。在每个像素提取特征描述子用作神经网络的输入。神经元对的连接与参考图像数据库学习的权重相关联。输出是相应像素的色度,可以直接与灰度组合得到相应的颜色值。训练模型计算出的色度可能在低纹理区域周围有点噪声,使用联合双边滤波器(输入灰度图像为指导)可以降低噪声。


参考文献

1. R Zhang, P Isola, A Efros,“Colorful Image Colorization”,arXiv 1603.08511, 2016

2. Z. Cheng, Q. Yang, and B. Sheng. “Deep colorization”. IEEE ICCV, 2015

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

灰度重采样的方法分为_基于深度学习的着色方法介绍 的相关文章

  • KEIL的下载图标是灰色的怎么办

    今天用cubemx配置好之后 generate发现下载图表是灰色的 解决方法 魔术棒下面的debug选项 有个右下角有个空手动输入 MPU
  • mock测试工具

    什么是mock测试 mock常见场景 mock常用工具 实战 1 什么是mock测试 mock测试就是对于某些不容易构造或者不容易获取的对象 用一个虚拟的对象来创建以便测试的测试方法 2 mock常见场景 1 无法控制第三方系统某接口的返回
  • PTA 7-100 敲笨钟 (20 分)(C语言版)

    微博上有个自称 大笨钟V 的家伙 每天敲钟催促码农们爱惜身体早点睡觉 为了增加敲钟的趣味性 还会糟改几句古诗词 其糟改的方法为 去网上搜寻压 ong 韵的古诗词 把句尾的三个字换成 敲笨钟 例如唐代诗人李贺有名句曰 寻章摘句老雕虫 晓月当帘
  • 测试开源C#人脸识别模块ViewFaceCore(2:人脸关键点定位器和活体检测)

    ViewFaceCore模块中的FaceLandmarker类支持识别人脸关键点 也即人脸上的关键位置的坐标 其中主要调用Mark函数返回图片中指定人脸的关键点位置集合 该类需配合FaceDetector类共同使用 FaceLandmark
  • UnityWebRequest下载图片和视频进行使用

    利用空余时间写一下网络下载资源使用 进行熟悉一些UnityWebRequest unity已经抛弃了WWW 这里很简单只需要把脚本挂载就行 所有的界面操作都通过代码实现 资源的下载 删除都做了相应的操作 using System Colle
  • 未定义标识符 HMAC_CTX_init

    这是因为 这是旧版本的代码 HMAC CTX hctx HMAC CTX init hctx HMAC Init ex hctx mac key sizeof mac key EVP sha1 NULL HMAC Update hctx p
  • 什么是数据中台?

    写在前面的话 不要被技术吓到哦 本文尽量写的白话 致力为从事大数据的运营 咨询规划 需求以及想学习大数据的入门者提供知识分享 导读 本文将阐述 为什么要建设数据中台 什么是数据中台 数据中台具备什么样的能力 采用什么技术来实现 一 为什么要
  • QEventLoop源码

    Copyright C 2015 The Qt Company Ltd Contact http www qt io licensing This file is part of the QtCore module of the Qt To
  • JDBC的原理与开发步骤(详解)

    简介 JDBC Java DataBase Connectivity 就是Java数据库连接 说白了就是用Java语言来操作数据库 原来我们操作数据库是在控制台使用SQL语句来操作数据库 JDBC是用Java语言向数据库发送SQL语句 原理
  • 想成为网络安全工程师需要学习掌握哪些技术

    想成为网络安全工程师 GPT建议需要掌握以下技术 1 网络基础知识 了解网络协议 网络拓扑 子网划分等基础概念 2 操作系统知识 熟悉常见操作系统 如Windows Linux 的安全配置和漏洞 3 数据库知识 了解数据库的安全配置和防御技
  • Java开发过程中的避坑点(一)

    1 典型空指针问题 包装类型的空指针问题 级联调用的空指针问题 Equals方法左边的空指针问题 ConcurrentHashMap 这样的容器不支持 Key 和 Value 为 null 集合 数组直接获取元素 对象直接获取属性 1 1包
  • RDA 升级

    烧录BOOT升级方式 1 连接 2 烧录BOOT 1 升级 bootrom raw bin 99K 这种升级方式需要Tera Term 工具 按 F5 U盘升级 编译的升级文件 RR8503 bin RR8501 bin RR52C bin
  • figma有哪些快速入门的好用技巧

    使用Figma在创建设计系统或处理大型设计项目时 总会涉及批量修改 快速定位 自动布局问题 MarcAndrew这篇文章分享了技巧 可以大大提高设计效率 希望对大家有所帮助 在这篇文章中 我列出了一些快速简单的方法来帮助你更快地使用它Fig
  • Morris Traversal方法遍历二叉树(非递归,不用栈,O(1)空间)

    本文主要解决一个问题 如何实现二叉树的前中后序遍历 有两个要求 1 O 1 空间复杂度 即只能使用常数空间 2 二叉树的形状不能被破坏 中间过程允许改变其形状 通常 实现二叉树的前序 preorder 中序 inorder 后序 posto
  • 猿如意中的【blender】工具详情介绍

    文章目录 一 工具名称 二 下载安装渠道 2 1 什么是猿如意 2 2 如何下载猿如意 三 工具介绍 四 blender介绍 4 1 blender简介 4 2 背景 4 3 主要功能 五 软件安装过程 5 1 如何在猿如意中下载开发工具b
  • 散列表习题

    1 考虑key的集合S 0 8 16 24 32 40 48 56 64 用除余法构造的散列函数 h1 key key 12 h2 key key 11 h1将S映射到的值域有几个元素 3 h2将S映射到的值域有几个元素 9 2 散列表的规
  • 【1分钟解决VS试用期到期】——登录用户时浏览器跳转失败

    登录 按钮下的 账户选项 将会默认跳转到左侧 环境 选项下的 账户 此界面中右上的 嵌入式Web浏览器 改为 系统Web浏览器 即可正常跳转登录 若没有微软账户可免费注册

随机推荐

  • easy poi 实现Excel文件的导入导出(SpringBoot整合)

    easypoi功能如同名字easy 主打的功能就是容易 让一个没见接触过poi的人员 就可以方便的写出Excel导出 Excel模板导出 Excel导入 Word模板导出 通过简单的注解和模板 语言 熟悉的表达式语法 完成以前复杂的写法 码
  • Win11任务栏怎么变小?Win11任务栏变小的设置方法

    很多Win11用户觉得win11任务栏太大了 用起来很不习惯 想要把任务栏变小 那要怎么进行操作 Win11的任务栏怎么变小 方法其实很简单的 系统之家小编这就分享给你 还不清楚的小伙伴们 快跟着小编一起来看看怎么操作吧 操作方法具体步骤
  • chatgpt赋能python:如何用Python进行数据清洗

    如何用Python进行数据清洗 在数据分析领域 数据清洗是非常重要的一步 因为原始数据往往包含大量的错误 缺失或者不一致的部分 对于这些 脏 数据 如果不进行清洗和处理 就会影响到后续的分析和建模工作 那么 如何用Python进行数据清洗呢
  • envi5.6处理gf3(SAR)详细过程记录

    未完结 待更新 可以参考的处理教程 SAR影像 雷达影像 的预处理 ENVI SARscape多极化单通道数据预处理流程 SARSCAPE中单雷达影像基础处理全过程 本文所使用的文件名 GF3 KAS UFS 017384 E108 9 N
  • 我的世界为什么服务器不显示皮肤,我的世界为什么皮肤没显示,为什么皮肤显示不出来怎么办...

    要正版账号盗版的话如果有皮肤MOD的话就可以看见了必须是安装了这个MOD的人才能看见 为什么显示不出更改后皮肤 用指令指令 skinset代码 英文或数字 怎么才能让我的世界人物皮肤能显示在服务器中 让每个玩家能看到 非官方的不好显示的 为
  • 2021-02-05

    1 字体类型 对于创造不同字体的文字类型时 每一个类型都得重新定义CFont 和 CStatic CStatic m cstatic title 标题名 CStatic m CStatic sys status CFont m Font C
  • mysql binlog 大小设置问题

    mysql开启了二进制日志binlog 如mysql bin 000005等 重启服务后会自动更新这个文件 如原来是000005的话会生成000006 请问 如果服务一直不重启 什么情况下会自动产生新的日志文件呢 是大小到了一定量时自动产生
  • 2016年中总结

    时间飞快 2016年上半年中收获很多 项目 学习 实习等 感慨颇多 一 学习 项目 走过BS 进入了Java的世界 在项目中实践对于自己的知识有了一个梳理和巩固 期间经历了ITOO5 0基础系统 对于基础系统的业务有了更多的了解 图书馆系统
  • 以不同的方向来处理数据倾斜

    一 程序层面 比如说在Hive中 经常遇到count distinct 操作 这样会导致最终只有一个Reduce任务 我们可以先group by 再在外面包一层count 就可以了 比如计算按用户名去重后的总用户量 优化前 只有一个redu
  • android开发之recycleView的adapter理解

    之前很长时间都是使用的listview 然后自己写适配器 主要都是继承自BaseAdapter 大致的思路呢 就是我们传入数据源以及上下文对象 然后我们在自定义适配器文件中实现了构造方法 然后将传入的上下文对象 context 以及数据源初
  • 【流水线】FPGA中流水线的原因和方法

    目录 写在前面 什么是流水线 无流水线设计 流水线设计 流水线的后果 结论 写在前面 对 FPGA 现场可编程门阵列 进行编程是一个定制其资源以实现确定逻辑功能的过程 这涉及使用FPGA的基本构建模块 如可编程逻辑模块 CLB 专用多路复用
  • 【MATLAB第62期】基于MATLAB的PSO-NN、BBO-NN、前馈神经网络NN回归预测对比

    MATLAB第62期 基于MATLAB的PSO NN BBO NN 前馈神经网络NN回归预测对比 一 数据设置 1 7输入1输出 2 103行样本 3 80个训练样本 23个测试样本 二 效果展示 NN训练集数据的R2为 0 73013 N
  • html标签总结之表格标签

    1 表格标签 表格属性 border 表格边框 写在table标签里面 数值代表边框像素 cellpadding 单元格内的空间 写在table标签里面 数值代表空间像素 cellspacing 单元格之间的空间 写在table标签里面 数
  • 线性代数——LU(LR)分解

    文章目录 定义 为什么要LU分解 为什么能做到LU分解 利用LU分解求行列式值 利用LU分解求解线性方程组 利用LU分解求逆矩阵 对角线上元素有0的情况 定义 定义 给定矩阵A 将A表示成下三角矩阵L和上三角矩阵U的乘积 称为LU分解 再进
  • 哄小姑娘的简单小密码

    老师让自由练习 给闺蜜搞个了密码表白 把她高兴的发了个朋友圈哈哈哈 include
  • QT之如何引用dll和头文件

    在QT中 我们在安装时默认安装了很多自带的类 比如画图用的QCharts等 但是当我们想使用一些其他功能的类时 我们应该怎么引入这些类呢 1 我们需要下载对应的dll和头文件 这些在网上都可以找到 以我的电脑上为例 weekday是项目的主
  • 【C++】std::thread的英文资料整理

    2023年9月10日 周日上午 这篇博客是我对网上的英文资料的整理和翻译 英文资料来自 c What exactly is an std thread Stack Overflow When you create a std thread
  • vue中使用.env文件配置全局变量

    首先根目录下创建 env或者 env production文件 生产环境 env develpment文件 开发环境 变量命名格式 键值对形式 VUE APP NAME value VUE APP 是规定的命名格式 NAME是自定义的变量名
  • 有关Flink的一些个人总结(是什么-用来做什么-有什么优势-为什么选它-解决了什么问题)

    文章目录 前言 一 Flink是什么 二 Flink用来做什么 三 Flink的优势是什么 四 为什么用Flink 五 Flink解决了什么问题 总结 前言 在大数据技术日益发展的今天 涌现出越来越多性能优异的组件 其中Spark和flin
  • 灰度重采样的方法分为_基于深度学习的着色方法介绍

    用于灰度图像着色是一种空间内插 即8比特的灰度空间扩展到24比特的RGB空间 下面以两篇文章为引子解释深度学习的应用 论文 1 是一种全自动方法从灰度产生逼真的色彩 针对着色问题的潜在不确定性 它将其作为分类任务并在训练时使用类重平衡 cl