着色器中包围体层次结构的遍历

2023-11-21

我正在使用 vulkan 计算着色器开发路径跟踪器。我实现了一棵树代表包围体层次结构。 BVH 的想法是最大限度地减少需要执行光线相交测试的对象数量。

#1 简单的实施

我的第一个实现非常快，它遍历树到singleBVH 树的叶子。然而，射线可能相交multiple树叶。然后，此代码会导致一些三角形未渲染（尽管它们应该渲染）。

int box_index = -1;

for (int i = 0; i < boxes_count; i++) {
    // the first box has no parent, boxes[0].parent is set to -1
    if (boxes[i].parent == box_index) {
        if (intersect_box(boxes[i], ray)) {
            box_index = i;
        }
    }
}

if (box_index > -1) {
    uint a = boxes[box_index].ids_offset;
    uint b = a + boxes[box_index].ids_count;

    for (uint j = a; j < b; j++) {
        uint triangle_id = triangle_references[j];
        // triangle intersection code ...
    }
}

#2 多叶实施

我的第二个实现考虑了多个叶子可能相交的事实。然而，这个实现是36x比实现 #1 慢

经过一番挖掘，我找到了解决方案。需要理解的重要一点是，BVH 树并不排除需要评估的可能性all leaves.

下面的实现 #3 使用命中和未命中链接。需要对这些框进行排序，以便在最坏的情况下以正确的顺序查询所有框（因此单个循环就足够了）。然而，链接用于跳过不需要评估的节点。当当前节点是叶子节点时，进行实际的三角形相交。

命中链接~命中时跳转到哪个节点（下面绿色）
miss link ~ 错过时跳转到哪个节点（下图红色）

图片取自here。相关论文和源代码也在 Toshiya Hachisuka 教授的文章中page。相同的概念也描述于幻灯片中引用的本文.

#3 带有命中和未命中链接的 BVH 树

我必须扩展通过链接推送到着色器的数据。此外，还需要进行一些离线操作才能正确存储树。起初我尝试使用 while 循环（循环直到box_index_next是-1），这再次导致了疯狂的减速。无论如何，以下方法运行得相当快：

int box_index_next = 0;

for (int box_index = 0; box_index < boxes_count; box_index++) {
    if (box_index != box_index_next) {
        continue;
    }

    bool hit = intersect_box(boxes[box_index], ray);
    bool leaf = boxes[box_index].ids_count > 0;

    if (hit) {
        box_index_next = boxes[box_index].links.x; // hit link
    } else {
        box_index_next = boxes[box_index].links.y; // miss link
    }

    if (hit && leaf) {
        uint a = boxes[box_index].ids_offset;
        uint b = a + boxes[box_index].ids_count;

        for (uint j = a; j < b; j++) {
            uint triangle_id = triangle_references[j];
            // triangle intersection code ...
        }
    }
}

这段代码比快速但有缺陷的实现 #1 慢大约 3 倍。这在某种程度上是预料之中的，现在速度取决于实际的树，而不是 GPU 优化。例如，考虑一种退化情况，其中三角形沿轴对齐：同一方向的射线可能与所有三角形相交，然后需要评估所有树叶。

Toshiya Hachisuka教授针对此类情况提出了进一步优化在他的幻灯片中（第 36 页及以后）：存储 BVH 树的多个版本，沿 x、-x、y、-y、z 和 -z 进行空间排序。对于遍历，需要根据光线选择正确的版本。然后，一旦叶子中的三角形相交，就可以停止遍历，因为要访问的所有剩余节点在空间上都将位于该节点后面（从光线角度来看）。

一旦构建了 BVH 树，查找链接就非常简单（下面是一些 python 代码）：

class NodeAABB(object):

    def __init__(self, obj_bounds, obj_ids):
        self.children = [None, None]
        self.obj_bounds = obj_bounds
        self.obj_ids = obj_ids

    def split(self):
        # split recursively and create children here
        raise NotImplementedError()

    def is_leaf(self):
        return set(self.children) == {None}

    def build_links(self, next_right_node=None):
        if not self.is_leaf():
            child1, child2 = self.children

            self.hit_node = child1
            self.miss_node = next_right_node

            child1.build_links(next_right_node=child2)
            child2.build_links(next_right_node=next_right_node)

        else:
            self.hit_node = next_right_node
            self.miss_node = self.hit_node

    def collect(self):
        # retrieve in depth first fashion for correct order
        yield self
        if not self.is_leaf():
            child1, child2 = self.children
            yield from child1.collect()
            yield from child2.collect()

将所有 AABB 存储在数组中（将发送到 GPU）后，您可以使用hit_node and miss_node查找链接的索引并存储它们。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

着色器中包围体层次结构的遍历的相关文章

使用 glDrawElements 时在 OpenGL 核心配置文件中选取三角形

我正在使用 glDrawElements 绘制三角形网格并且希望能够使用鼠标单击来拾取选择三角形三角形的网格可以很大在固定功能 OpenGL 中可以使用 GL SELECT http content gpwiki org inde
Three.js 对象的“中心”是什么？

当我使用 Blender 对对象进行建模时我能够明确定义其发生平移和旋转的中心位置当使用 Three js 对象时我似乎没有找到等效的对象 Three js 对象是否具有定义其中心位置的属性如果不是物体的中心是如何确定的在
如何在 C++ 项目的 Cmake 文件上添加 Mac OS 框架

我正在尝试将外部库 Vulkan 添加到我的项目中这个库是预编译的并且有一个框架我的项目树 build source Entry main cpp include ext vulkan macos include lib Framewo
如何使用网格分割图像并保留透明度边界框

我有一些 png 图像我想将其分成几个部分例如按网格或大小但每个部分应具有与原始图像相同的边界框透明度 Example 将图像分成两部分原来的 200 89 Output 部分 1 png 200 89 第2部分 png 200
使用 GLSL 直接在着色器中从位置计算平移矩阵

我正在开发 C OpengL 程序以及 GLSL 顶点和片段着色器我正在创建同一对象的多个实例我只需要改变实例之间的对象位置这是我所做的我正在使用一个统一变量它是一个变换矩阵数组每个矩阵代表一个对象实例 MVP 也是一个变换矩阵
android ndk 硬件调试内存

背景我对 C 很有经验对 Android 和 Java 还很陌生但这是编程的环境问题我已经用 ANSI C 开发了一个管理应用程序可以移植到任何操作系统只需在依赖于操作系统的代码中添加 UI 即可它使用相当多的内存特别是对于
SSBO 是更大的 UBO？

我目前正在 OpenGL 4 3 中使用 UBO 进行渲染以将所有常量数据存储在 GPU 上诸如材料描述矩阵等内容它可以工作但是 UBO 的小尺寸我的实现为 64kB 迫使我多次切换缓冲区减慢渲染速度我正在寻找类似的方法来存
函数式语言中的部分求值和函数内联有什么区别？

我知道函数内联就是用函数定义代替函数调用部分评估是在编译时评估程序的已知静态部分在 C 等命令式语言中两者之间存在区别其中运算符与函数不同但是在像 Haskell 这样的函数式语言其中运算符也是函数中两者之间有什么区
当 foreach 块的内容具有 Conditional 属性时，C# 编译器是否会对其进行优化？

我正在工作中编写一些调试代码我想知道我所做的是否会损害性能让我们看一下代码 foreach var item in aCollection Debug WriteLine item Name 我知道 Debug 类使用 Conditio
LTO、去虚拟化和虚拟表

比较 C 中的虚拟函数和 C 中的虚拟表一般来说编译器对于足够大的项目在去虚拟化方面做得同样好吗天真地说 C 中的虚拟函数似乎有更多的语义因此可能更容易去虚拟化 Update Mooing Duck 提到了内联去虚拟化函数快速
子组调用索引是否映射到 gl_LocalInitationIndex？

我需要计算吗gl SubgroupID gl SubgroupSize gl SubgroupInvocationID 或者我可以使用gl LocalInvocationIndex 单个子组内的调用是否连续gl SubgroupInvoca
计算边界框重叠的百分比，用于图像检测器评估

在测试大图像中的对象检测算法时我们根据地面实况矩形给出的坐标检查检测到的边界框根据 Pascal VOC 挑战有这样的如果预测的边界框重叠更多则认为它是正确的超过 50 带有真实边界框否则边界框被认为是误报检测多次检测是
现代编译器是否优化乘以 1 和 -1

如果我写 template
并排显示图像的一半 - OpenGL

我为两个图像创建了两个纹理现在我想在opengl中按图像2的左侧部分完整的图像1 图像2的右侧部分的顺序显示该纹理我已经做了如下 Image1 显示在 opengl 屏幕的中央但屏幕的左右部分不正确应分别显示 image2 的左侧
有关 Swift 编译器选项的文档

您好我想开始在 Apple Swift 语言上运行一些微基准测试然而我觉得很难找到有关编译器优化的不同选项的适当文档我读过很多关于其他人的语言微基准的问题和文章但是如果能有一些关于该主题的可靠文档那就太好了在最新的测试版中使用
如何重复更新单个 Vulkan 渲染通道内对象数量的统一数据并使更新同步？

我正在尝试将我的 OpenGL 3D 游戏引擎移植到 Vulkan 游戏场景中有大量的 3D 对象每个对象都有自己的属性模型矩阵灯光等并且对象是完全动态的这意味着在游戏过程中可能会出现一些 3D 对象而另一些可能会被移除使用
着色器属性 mat4 未正确绑定（Opengl ES 2.0 Android）

我有以下着色器 protected final static String vertexShaderCode attribute vec4 vPosition attribute vec2 texCoord attribute mat4 u
如何获取片段的当前颜色？

我正在尝试了解 GLSL 中的着色器并且找到了一些有用的资源和教程但我一直在寻找一些应该是基本且微不足道的东西我的片段着色器如何检索当前片段你通过说设置最终颜色gl FragColor whatever 但显然这是一个仅输出值如何
GCC、字符串化和内联 GLSL？

我想使用宏字符串化来声明内联 GLSL 着色器字符串 define STRINGIFY A A const GLchar vert STRINGIFY version 120 n attribute vec2 position void m
未定义的行为真的有助于现代编译器优化生成的代码吗？

现代编译器不是足够聪明能够生成快速且安全的代码吗看下面的代码 std vector

随机推荐

Lisp：宏与函数[重复]

这个问题在这里已经有答案了在我寻求完全理解如此强大的 Lisp 宏的过程中我想到了一个问题我知道关于宏的一条黄金法则是当函数可以完成工作时永远不要使用宏然而阅读第 9 章实用构建单元测试框架从 Practical Comm
LINQ是否可以动态添加where子句

我想用不同的键搜索我的数据库根据输入的情况可能有1个键到10个键有没有办法动态地将 OR AND 子句添加到我的 Linq 查询中 keys k I have my keys in this array var feedList fr
使用组件上的模板引用变量访问 DOM 元素

我正在尝试使用模板引用变量获取 Angular 2 模板中组件的 DOM 元素的引用这适用于普通的 html 标签但在组件上有不同的行为例如 div div
如何为 Elmah 使用 EntityFramework 连接字符串？

在 ELMAH 中将错误记录到数据库中您可以编写
如何向 d3 饼图添加漂亮的图例

我的饼图工作正常但我想添加一个像这样的漂亮图例用 mspaint 制作但不能完全让它发挥作用这是我的饼图代码没有图例部分
具有分组回归线的叠加 xyplot 面板

我想在晶格中的单个面板上叠加多个组并且想要独立的回归线通过使用条件因子获得多个面板相当容易每个面板都有一条回归线 xyplot Petal Width Petal Length Species data iris panel func
OkHttp: <-- HTTP 失败: java.net.UnknownServiceException: 网络安全策略不允许与 10.0.2.2 进行 CLEARTEXT 通信

I have implemented google sign in with Firebase authentication in my Android app succesfully 如您所见我已使用我的帐户登录并且它显示在 Fire
NULL能保证为0吗？

我想知道是否NULL保证是0在 C 中所以我搜索并发现了这些 This答案指出这是 Bjarne Stroustrup 的原话在C 中 NULL的定义是0 所以只是美观不同之处我更喜欢避免宏所以我使用 0 另一个问题是 NULL
MPAndroidChart 具有 3 个数据集的折线图的多个工具提示/标记视图

我目前正在使用MPAndroid图表对于我的申请在一种情况下我在一个折线图中显示三个数据集当我单击图表上的线条时我一次只能显示一个工具提示相反基于十字线位置我想显示所有三个数据集的单独工具提示 I have gone thro
在摩卡测试中调用异步函数时如何避免超时错误：超出了2000毫秒的超时

在我的节点应用程序中我使用 mocha 来测试我的代码使用 mocha 调用许多异步函数时出现超时错误 Error timeout of 2000ms exceeded 我该如何解决这个问题 var module require li
动态嵌套对象数组的递归迭代

我正在使用 Angular JS 及其示例之一 http jsfiddle net furf EJGHX 我需要在更新功能发生时获取数据并在发送到服务器之前向其中添加一些值如果用 Angular 而不是 js 来做这件事会更好请告诉我
Git 推送时出现 Libcurl.dll 错误

最近我安装了 Git 使用 Bit Bucket 作为存储库我根据在网上找到的不同指南配置了所有内容但是每当我使用该命令时git push u origin all我收到以下错误无法在动态链接库 libcurl dll 中找到过程入口
如何将“now() -interval '2 分钟'”之类的内容插入 PHP PDO 查询？

我有一个这样的查询在 Postgresql 8 4 PHP fpm 5 3 10 fpm fcgi 上 select from users where now interval 2 minutes lt seenlast ORDER BY
将 k 列重塑为 2 列，表示 k 变量值的连续对

我有一个像这样的数据框 id y1 y2 y3 y4 a 12 13 14 b 12 18 c 13 d 13 14 15 16 我想以这样的方式重塑以两列结束上面的例子将变成 id from to a 12 13 a 13 14 a
如何使用 MATLAB 绘制邻接矩阵图

我想创建一个图显示邻接矩阵中节点之间的连接如下所示 gplot似乎是最好的工具但是为了使用它我需要传递每个节点的坐标问题是我不知道坐标应该在哪里我希望该函数能够为我找出一个好的布局例如这是我使用以下任意坐标的输出 A 1
如何在没有 clojure.jar 的情况下从 Github 存储库在 Ubuntu 10.04 上安装 Clojure

我一直在尝试在电脑上安装Clojure来学习和使用我正在运行 Ubuntu 10 04 并安装了来自 Synaptic 的最新 Sun Java SDK 和环境通过 Google 搜索我发现了多个指南这些指南非常清晰地指导了如何使用
WebRTC 数据通道服务器到客户端的 UDP 通信。目前可以吗？

除了使用 UDP 之外是否可以以模仿 WebSocket 功能的方式在 Node js 上使用 WebRTC 数据通道本质上我希望有一个运行 Node js 的服务器浏览器客户端可以通过 JavaScript 建立全双工双向 UDP
相当于 build-arg 的 --env-file 吗？

我正在使用多个构建参数构建 Docker 映像并且想知道是否可以将它们传递给docker build作为一个文件以同样的方式 env file可以传递给docker run env 文件将被解析docker run自动并且变量在容器中可
如何在Android中的线性布局周围显示阴影？

如何显示线性布局的阴影我想要白色圆形背景线性布局周围有阴影到目前为止我已经做到了
着色器中包围体层次结构的遍历

我正在使用 vulkan 计算着色器开发路径跟踪器我实现了一棵树代表包围体层次结构 BVH 的想法是最大限度地减少需要执行光线相交测试的对象数量 1 简单的实施我的第一个实现非常快它遍历树到singleBVH 树的叶子然而射线可能

着色器中包围体层次结构的遍历

着色器中包围体层次结构的遍历 的相关文章

随机推荐

热门标签

着色器中包围体层次结构的遍历的相关文章