13、Efficient Geometry-aware 3D Generative Adversarial Networks

2023-11-05

简介

仅使用单视图 2D 照片集合无监督生成高质量的多视图一致图像和 3D 形状一直是一项长期存在的挑战。现有的3D GAN要么是计算密集型的,要么是进行不3D一致的近似;前者限制了生成图像的质量和分辨率,后者会对多视图一致性和形状质量产生不利影响。在这项工作中,提高了3D GAN的计算效率和图像质量,而不会过度依赖这些近似值。为此,引入了一种富有表现力的混合显式-隐式网络架构,该架构与其他设计选择一起,不仅可以实时合成高分辨率多视图一致的图像,还可以生成高质量的3D几何体。通过分离特征生成和神经渲染,框架能够利用最先进的2D CNN生成器,如StyleGAN2,并继承它们的效率和表现力。

主页:https://nvlabs.github.io/eg3d/

在这里插入图片描述
在这里插入图片描述
神经隐式表示使用全连接层(FC)和位置编码(PE)来表示场景,这可能会很慢(a)。显式体素网格或混合变体使用小型隐式解码器,查询速度很快,但分辨率较低(b)。我们的混合显式-隐式三平面表示©速度快,分辨率高,可以有效缩放,在同等容量下实现更详细的内容。

论文贡献点
在这里插入图片描述
网络架构
在这里插入图片描述

实现流程

CNN generator backbone and rendering

在这里插入图片描述
这里对StyleGAN2 Generator的输出进行修改,输出的不再是RGB图像,而是 256 x 256 x 96 的特征图,然后再划分为三个32通道的平面,组合为一个轻量级特征解码器的三平面3D表示

StyleGAN2是一个易于理解的高效架构,可以实现2D图像合成的最先进结果,其次,模型可以继承StyleGAN的许多理想属性:一个表现良好的潜在空间,它支持样式混合和潜在空间插值
在这里插入图片描述
在这里插入图片描述

紧接着从三平面中采样特征,通过总和进行聚合,并使用轻量级解码器处理聚合特征,上图中,解码器是一个多层感知器,有一个64个单元的单个隐藏层和软加激活函数。MLP不使用位置编码、坐标输入或视图方向输入。该混合表示可以查询连续坐标,输出标量密度σ和32通道特征,然后通过神经体渲染器处理,将3D特征体投影到2D特征图像中

体渲染器采用双通道重要采样实现,产生特征图像,而不是RGB图像,因为特征图像包含更多的信息,可以有效地用于下面描述的图像空间细化。最后产生128 x 128 x 32的特征图IF,并且每条射线有96个总深度样本。

Super resolution

在这里插入图片描述
虽然三平面表示比之前的方法在计算效率上有了显著提高,但在保持交互帧率的同时,它在本地训练或呈现高分辨率时仍然太慢。因此,在中等分辨率(如128x128)下进行体积渲染,并依靠图像空间卷积对神经渲染进行上采样,使其最终图像大小为256x256或512x512

超分辨率模块由两块stylegan2调制的卷积层组成,对32通道特征图像IF进行上采样和细化,最终得到RGB图像I+ RGB。我们禁用逐像素噪声输入来减少纹理粘着,并重用骨干的映射网络来调制这些层。

Dual discrimination

在这里插入图片描述

判别器使用Dual discrimination避免多视图不一致问题,将Volume Rendering处理后的特征图的前三个特征通道理解为低分辨率的RGB图像——IRGB,dual discrimination通过双线性上采样IRGB到与I+ RGB相同的分辨率,并将结果拼接形成一个六通道图像来实现,IRGB和超分辨率图像I+ RGB之间的一致性。输入鉴别器的真实图像也通过将它们与自身适当模糊的副本进行拼接作同样处理。

双重判别鼓励最终输出匹配真实图像的分布,鼓励神经渲染匹配下采样的真实图像的分布,鼓励超分辨率图像与神经渲染保持一致,允许我们利用有效的图像空间超分辨率层,而不引入视图不一致的工件

遵循StyleGAN2-ADA的条件策略,将呈现摄像机intrinsic和extrinsics矩阵(集合P)作为条件标签传递给鉴别器,使鉴别器意识到相机的姿态,由此生成的图像被渲染。这种条件反射引入了额外的信息,指导生成器学习正确的3D先验

Modeling pose-correlated attributes

引入生成器位姿条件反射作为一种方法来建模和解耦在训练图像中观察到的位姿和其他属性之间的相关性。为此,遵循条件生成策略,为骨干映射网络提供一个潜在的代码向量z,并将摄像机参数P作为输入。通过给出渲染相机位置的主干知识,我们允许目标视图影响场景合成。

在训练过程中,姿态条件反射允许生成器建模隐式到数据集的姿态依赖偏差,允许模型忠实地再现数据集中的图像分布。为了防止场景在推断过程中随着相机姿势的改变而改变,在从移动的相机轨迹进行渲染时将生成器设置为固定的相机姿势。我们注意到,总是用渲染相机姿势调节生成器会导致退化的解决方案,即GAN产生的2D广告牌朝着相机的角度(见补充)。为了避免这种情况,在训练过程中以50%的概率将P中的条件反射姿势与另一个随机姿势随机交换

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

13、Efficient Geometry-aware 3D Generative Adversarial Networks 的相关文章

  • 受约束景观的程序生成

    我想实现地形的程序生成 经过彻底的研究后 我得出的结论是 应该使用梯度 相干 噪声生成算法之一来实现 例如 Perlin 噪声算法 然而 我不希望生成是完全随机的 我想应用一些限制 例如哪里应该是山脉 或者哪里应该是低地等 问题 例如 我有
  • 使用相机将 3D 透视投影到 2D 屏幕上的基本渲染(无需 opengl)

    假设我有一个如下的数据结构 Camera double x y z ideally the camera angle is positioned to aim at the 0 0 0 point double angleX angleY
  • WP7 XNA 显示 3D FBX 模型

    我只是初学者 很抱歉我的愚蠢问题 我的模型看起来像这样 http img265 imageshack us img265 8291 clipboard01ap jpg http img265 imageshack us img265 829
  • 3D 哪个更快? Perlin 噪声还是 Simplex 噪声?

    好吧 网上有很多 Perlin 噪声和 Simplex 噪声之间的比较 但我真的找不到一个对三个维度进行简单处理时间比较的地方 这是我最感兴趣的 我读过那个流行的PDF http webstaff itn liu se stegu simp
  • 如何计算逆运动学[关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 我想知道如何使用逆运动学计算旋转角度 我计划将其用于实时 3D 动画 有人知道一些详细介绍具体解决方案的好文献吗 以下资源调查了逆运动学问题的一些流行
  • 3d 表面的凸包算法 z = f(x, y)

    我有一个以一组三元组 x i y i z i 形式给出的 3D 表面 其中 x i 和 y i 大致位于网格上 并且每个 x i y i 都有一个关联的 z i 值 典型的网格是20x20 我需要在给定的公差范围内找到哪些点属于曲面的凸包
  • Python 中的标量场可视化

    我需要在 Python 中可视化几个重叠的标量场 我发现mayavi图书馆做这种情节 问题是我不明白如何为标量字段自定义颜色图 我的想法是为每个字段设置一种颜色的阴影 我尝试采用一个例子 http docs enthought com ma
  • 对一系列点重新采样

    我有一个 3d 点数组 想象一下球的轨迹 有 X 个样本 现在 我想对这些点重新采样 以便我有一个新数组 其中包含 y 个样本的位置 y 可以大于或小于 x 但不能小于 1 始终至少有 1 个样本 将原始数组重新采样为新数组的算法会是什么样
  • 如何在Android中渲染OBJ或FBX? [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我有几个 obj 和 fbx 格式的 3D 对象 其中包含 mtl 和纹理文件 我想知道哪个是在 An
  • 如何在SceneKit中实现逼真的景深效果?

    我正在尝试渲染具有真实景深效果的帧 我已经尝试过景深属性camera节点 但它不会产生可用的结果 是否可以切换到景深效果的最大渲染质量 性能不是一个因素 我只需要渲染一帧 用户可以等待它 SceneKit 中逼真的景深效果 在SceneKi
  • 自动适合衣服的算法?

    想象一下 客户要求您设计一款软件 以满足一些相当粗略的规格 如下所示 1 它将面向时尚行业营销 2 用户将是 设计衣服和东西 的人 可能有一个特定的术语 但我没有想到 3 由于各种原因 能够快速制作原型设计并查看它们在模型上的外观会很有用
  • C++ Irrlicht 程序未链接:“未定义对‘__imp_createDevice’的引用”

    我的 Irrlicht 程序无法链接 我使用的编译器是g Code include
  • 3D 数学:根据“向上”和“向上”正交向量计算倾斜(滚动)角度

    我希望这是提出这个问题的正确位置和这个一样 https stackoverflow com questions 3035590 bank angle from up vector and look at vector 但表示为纯数学而不是图
  • 如何在 GTX 560 及更高版本上使用 OpenGL 进行立体 3D?

    我正在使用在 Windows 7 上运行的开源触觉和 3D 图形库 Chai3D 我重写了该库以使用 Nvidia nvision 执行立体 3D 我将 OpenGL 与 GLUT 一起使用 并使用 glutInitDisplayMode
  • 我应该如何格式化 .dat 文件以便制作 3D 矢量图?

    我正在为大学做这个编程任务 我们必须写一个c 计算 3D 空间中某些线圈的磁场矢量的程序 我已经成功编写了这个程序 并且我认为它运行得很好 不过 我想添加一个特殊的东西 这是我的试卷 所以它必须特别好 我想绘制出向量 我习惯打电话gnupl
  • 使用 Scipy/Numpy 在浊点的二维插值中仅获取“有效”点

    我有一个通过人的背部摄影测量获得的浊点 我正在尝试对其进行插值以获得规则网格 为此我正在使用scipy interpolate到目前为止取得了良好的成果 问题是 我正在使用的函数 scipy interpolate griddata 使用平
  • 在球体边缘绘制点

    因此 来自 Flash 背景的我对一些简单的 2D 三角函数有很好的理解 在带有 I 圆的二维中 我知道使用给定角度和半径将项目放置在边缘上的数学 x cos a r y sin a r 现在 如果我在 3d 空间中有一个点 我知道球体的半
  • 如何仅剪切剪切平面的交集(而不是并集)?

    在 OpenGL JOGL 中 当使用多个剪切平面时 似乎会应用所有剪切平面的并集 我想要的是路口要应用的所有剪裁平面 这可能吗 请参阅下面的简化二维示例 Edit An example of clipping by vertex shad
  • XNA中窗口系统的渲染策略(RenderTarget性能)

    我目前正在从头开始为 XNA 游戏创建一个窗口系统 我主要针对 Windows 进行开发 但谁知道我将来可能支持哪些平台 如果您知道本机 Direct3D 的这一点 请随意回答 因为性能语义应该类似 如果可能 请考虑如果目标平台是 X Bo
  • 如何在不使用 Kinect SDK 函数的情况下将深度空间中的点转换为 Kinect 中的颜色空间?

    我正在做一个增强现实应用程序 将 3D 对象叠加在用户的彩色视频之上 使用 Kinect 1 7 版本 虚拟对象的渲染在 OpenGL 中完成 我已经成功地在深度视频上叠加了 3D 对象 只需使用 NuiSensor h 标头中深度相机的固

随机推荐

  • 使用OpenCV,Python进行图像哈希(差分哈希 dHash)处理

    使用OpenCV Phthon进行图像哈希处理的一个重要应用是去除重复的图像 当你有多个相册的图片 进行合并时 so boring 有一些图片是重复的 肉眼来看太难删除了 图像哈希可以帮助你完美的解决这个问题 找到完全相同的图片 只保留一张
  • python最详细的安装与完全卸载

    一 python的安装 1 python下载 在网上 输入网址https www python org downloads 下载Windows最新的python程序 我电脑为64位 注意 不要下载32位的且尽可能不要下载3 6 x以上的版本
  • 虚幻4——蓝图在脚本之间的交互

    从虚幻3到虚幻4 之前都已经习惯了在脚本中写节点 然后在编辑器中供关卡师使用 所以对于这种开发模式 也不会有什么不适应的感觉 可视化编辑 也是以后游戏开发的重要的一环吧 但是国内游戏开发还没有这一种概念 对于关卡师 尤其懂游戏逻辑的 这是多
  • 算法 - 冒泡排序(Bubble_ Sort)

    在总结冒泡排序前 先从头开始 对冒泡排序 BubbleSort 进行一个系统性了解 冒泡排序法 又称交换排序法 是从观察水中的气泡变化构思而成的 原理是从第一个元素开始 比较相邻元素的大小 如果大小顺序不对 则进行两个数据的调换 就好像气泡
  • 基于mybatis的数据库脱敏

    背景 思路 实现 思考 背景 最近接到需求需要对数据库中的电话 身份证号等敏感信息进行脱敏加密处理 再加上之前面试时也被问到相关问题 所有在此记录 脱敏对象是数据库的字段 所以在数据库存取的出入口进行加解密操作是最合适的 项目中使用myba
  • 【T1】T1飞跃专业版修改账套名称

    问题描述 使用友加畅捷T1飞跃专业版的过程中 建立完账套后 无法从前台操作进行账套名称的修改 解决方法 打开数据库管理器 执行下述语句 进行修改 update master Sub List set ztname 新名称 where ztn
  • 偏导数及其几何意义

    在一元函数中 我们已经知道导数就是函数的变化 率 对于二元函数我们同样要研究它的 变化率 然 而 由于自变量多了一个 情况就要复杂的多 一 几何意义 在xOy平面内 当动点由P x0 y0 沿不同方向变化时 函数f x y 的变化快慢一般说
  • chisel多时钟域设计(注释)

    在数字电路中免不了用到多时钟域设计 尤其是设计异步FIFO这样的同步元件 在Verilog里 多时钟域的设计很简单 只需声明多个时钟端口 然后不同的always语句块根据需要选择不同的时钟作为敏感变量即可 在Chisel里 则相对复杂一些
  • 杂散应用记录

    启动运行路径 etc ini d rc local svn 启动snv svnserve d listen port 3690 r var svn svnrepos
  • 传奇开区助手源码-添加支付平台

    传奇GM都用过的一款开区助手 如何添加支付平台对接兑换 项目截图 创建兑换 1 添加支付平台组合框 2 增加支付回调相关网络 至此添加登陆函数即可实现平台登陆功能 不过要注意的是默认仅支持http 支持https请添加三方网络模块实现 否则
  • 【COCO数据集】Annotations标注解析

    COCO dataset 是计算机视觉领域中最流行的数据集之一 用于对各种视觉任务进行基准测试 例如目标检测 分割 关键点检测等 在数据集中 有118K张图像用于训练 5K张图像用于验证 下载数据集后 目录中内容如下 COCO Annota
  • android studio修改module名称

    新建一个android studio项目 默认Module名称是app 右键app选择Rename 或者Shift F6也可以 重命名module名称 重命名为abc之后中 如图上面箭头所指的app会出错 点击Edit Configurat
  • 多益网络笔试题 随机地从大小为n的数组中选取m个整数。要求每个元素被选中的概率相等

    题目 随机地从大小为n的数组中选取m个整数 要求每个元素被选中的概率相等 时间复杂度是O m 参考链接 https my oschina net u 2822116 blog 795323 分析 这道题目和随机洗牌算法类似 只需要随机选取1
  • Java开发环境搭建03:idea中使用Maven

    一 Maven介绍 Maven项目对象模型 POM 可以通过一小段描述信息来管理项目的构建 报告和文档的项目管理工具软件 Maven是Apache 的开源项目 Maven使用Java开发的 运行需要Java环境的支持 Maven的作用有三点
  • leveldb之Compaction操作下之具体实现

    leveldb之Compaction操作下之具体实现 2015 05 17 19 40 438人阅读 评论 0 收藏 举报 分类 leveldb 13 版权声明 本文为博主原创文章 未经博主允许不得转载 目录 由上文可知 合并主要分为三种
  • Vue 3结合element plus(问题总结)之 table组件实现多选和清除选中

    问题描述和原因 一直出现toggleRowSelection和clearSelection不是方法 问题解决 后来发现getCurrentInstance支持访问内部组件实例 getCurrentInstance 只能在 setup 或生命
  • 人工神经网络matlab代码,matlab神经网络30例代码

    如何在matlab中建立多层bp神经网络 当你用newff的时候 里面有一个参数可以控制层数 比如说 P 0 1 2 3 4 5 6 7 8 9 10 T 0 1 2 3 4 3 2 1 2 3 4 net newff P T 5 这样表示
  • 通讯协议027——全网独有的OPC AE知识四之接口(十一)

    本文继续介绍OPC AE规范的IOPCEventSubscriptionMgt2接口的相关知识 更多通信资源请登录网信智汇 OPC AE规范描述了OPC事件服务器应该实现的对象和接口 实现在多个OPC客户端间共享事件和警报条件 可选的IOP
  • IT项目管理个人作业8

    练习题1 质量标准 要求 学历 全日制统招研究生及以上学历 专业 计算机科学 软件工程 工程管理或相关专业者优先 经验 三年 三年以上相关工作经验 年龄 30 45 论文发表 在顶级期刊上发表过三篇以上论文 技术需求 熟悉项目管理相关知识
  • 13、Efficient Geometry-aware 3D Generative Adversarial Networks

    简介 仅使用单视图 2D 照片集合无监督生成高质量的多视图一致图像和 3D 形状一直是一项长期存在的挑战 现有的3D GAN要么是计算密集型的 要么是进行不3D一致的近似 前者限制了生成图像的质量和分辨率 后者会对多视图一致性和形状质量产生