glReadPixels() 会消耗单个核心的所有CPU周期

2024-01-07

我有一个带有 OpenGL 窗口的 SDL2 应用程序，它表现良好：当它运行时，该应用程序与我的 60Hz 显示器同步，并且我看到该应用程序的 CPU 使用率为 12%。

到目前为止，一切都很好。但是，当我通过从深度缓冲区（绘制后）读取单个（！）深度值来添加 3D 拾取时，会发生以下情况：

FPS 仍为 60
主线程的CPU使用率达到100%

如果我不执行 glReadPixels，CPU 使用率会再次下降到 12%。为什么从深度缓冲区读取单个值会导致 CPU 烧毁所有周期？

我的窗口是用以下命令创建的：

SDL_GL_SetAttribute(SDL_GL_CONTEXT_MAJOR_VERSION, 3);
SDL_GL_SetAttribute(SDL_GL_CONTEXT_MINOR_VERSION, 2);
SDL_GL_SetAttribute(SDL_GL_CONTEXT_PROFILE_MASK, SDL_GL_CONTEXT_PROFILE_CORE);

SDL_GL_SetAttribute( SDL_GL_DOUBLEBUFFER, 1 );
SDL_GL_SetAttribute( SDL_GL_MULTISAMPLEBUFFERS, use_aa ? 1 : 0 );
SDL_GL_SetAttribute( SDL_GL_MULTISAMPLESAMPLES, use_aa ? 4 : 0 );
SDL_GL_SetAttribute(SDL_GL_FRAMEBUFFER_SRGB_CAPABLE, 1);
SDL_GL_SetAttribute(SDL_GL_DEPTH_SIZE, 24);

window = SDL_CreateWindow
(
            "Fragger",
            SDL_WINDOWPOS_UNDEFINED,
            SDL_WINDOWPOS_UNDEFINED,
            fbw, fbh,
            SDL_WINDOW_OPENGL | SDL_WINDOW_RESIZABLE | SDL_WINDOW_ALLOW_HIGHDPI
);

我的画的结论是：

SDL_GL_SwapWindow( window );

我的深度阅读是通过以下方式执行的：

float depth;
glReadPixels( scrx, scry, 1, 1, GL_DEPTH_COMPONENT, GL_FLOAT, &depth );

我的显示同步配置使用：

int rv = SDL_GL_SetSwapInterval( -1 );
if ( rv < 0 )
{
    LOGI( "Late swap tearing not available. Using hard v-sync with display." );
    rv = SDL_GL_SetSwapInterval( 1 );
    if ( rv < 0 ) LOGE( "SDL_GL_SetSwapInterval() failed." );
}
else
{
    LOGI( "Can use late vsync swap." );
}

对“perf”的调查表明，nVidia 的驱动程序会消耗周期，进行无情的系统调用，其中之一是 sys_clock_gettime()，如下所示：

我通过读取 GL_BACK 或 GL_FRONT 尝试了一些变化，结果相同。我还尝试在窗口交换之前和之后阅读。但CPU使用率始终处于100%水平。

平台：乌班图18.04.1
SDL:版本2.0.8
CPU:英特尔哈斯韦尔
GPU:英伟达 GTX750Ti
GL_版本：3.2.0 英伟达 390.87

UPDATE

在 Intel HD Graphics 上，CPU 不自旋锁。 glReadPixels 仍然很慢，但与 nVidia 驱动程序上完全 100% 加载的 CPU 相比，CPU 的占空比较低 (1%) 左右。

我也尝试过通过 PBO 异步读取像素 http://www.songho.ca/opengl/gl_pbo.html（像素缓冲区对象）但仅适用于 RGBA 值，不适用于 DEPTH 值。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

OpenGL

NVIDIA

cpuusage

sdl2

glReadPixels

glReadPixels() 会消耗单个核心的所有CPU周期的相关文章

OpenGL 超级采样抗锯齿？

在办公室我们正在使用旧的 GLX Motif 软件该软件使用 OpenGL 的 AccumulationBuffer 来实现保存图像的抗锯齿功能我们的问题是Apple从其所有驱动程序中删除了AccumulationBuffer 从OS
着色器/矩阵问题 - 看不到对象

我试图在屏幕上放置一个立方体并点亮它我想要在立方体上添加 phong 阴影当我运行代码时我可以看到背景图像但看不到立方体我相当确定立方体本身是正确的因为我已经设法用纯色着色器显示它我已经设法编译着色器程序但我根本看不到立方体
从文件中读取 GLSL 着色器

我正在尝试从如下所示的文件中读取顶点和片段着色器 version 330 core in vec3 ourColor out vec4 color void main color vec4 ourColor 1 0f but when i
使用 openGL、SOIL 加载图像

我尝试了很多使用 SOIL 在 openGL 中加载和显示图像的示例运行下面的源代码时它仅显示一个没有图像的白色四边形我尝试打开一个名为 foto 的图像我将图像文件放在程序的文件夹中 bool keyStates new bool
哪个对缓存最友好？

我试图很好地掌握面向数据的设计以及如何在考虑缓存的情况下进行最佳编程基本上有两种情况我无法完全确定哪个更好以及为什么是拥有一个对象向量更好还是拥有对象原子数据的多个向量更好 A 对象向量示例 struct A GLsizei mInd
纹理openGl。 C++、qt

我试图用草纹理覆盖我的地形由高度图制成但它没有按预期工作我什至无法在简单的 GL QUAD 上获取纹理结果是多色网络 void GLWidget initializeGL glEnable GL TEXTURE 2D 在 QGLwi
glutPostRedisplay 不在循环内工作

我试图让一个人在 y 轴上跳跃所以我使用 2 秒的循环第一秒它应该向下移动并弯曲膝盖第二秒它应该向上移动然后在起始位置完成现在我刚刚开始让这个人在第一秒内跪下并弯曲膝盖我还没有编写动画的其余部分问题是 glutPostRedi
QOpenGLFunctions 缺少重要的 OpenGL 函数

QOpenGLFunctions 似乎缺少重要的函数例如 glInvalidateFramebuffer 和 glMapBuffer 据我了解 QOpenGLFunctions 加载桌面 OpenGL 函数和 ES 函数的交集如果是这样
Yocto for Nvidia Jetson 由于 GCC 7 而失败 - 无法计算目标文件的后缀

我正在尝试将 Yocto 与 meta tegra 一起使用 https github com madisongh meta tegra https github com madisongh meta tegra 为 Nvidia Jets
OpenGL：调试“单通道线框渲染”

我正在尝试实现论文单通道线框渲染它看起来很简单但它给了我所期望的厚暗值论文没有给出计算海拔高度的确切代码所以我按照自己认为合适的方式进行了操作代码应该将三个顶点投影到视口空间中获取它们的高度并将它们发送到片段着色器片段着
不理解 gluOrtho2D 函数

我不能做什么gluOrtho2D 函数是做什么的是否将原点固定在 OpenGL 窗口上的某个特定点或其他位置这是因为gluOrtho2D 1 1 1 1 将原点固定在窗口的中间如果它在某个时刻没有修复原点那么有什么方法可以修复原点
如何安装适用于 Windows C++ 的最新版本 OpenGL？

我正在使用 Visual Studio 2010 运行 Windows 7 包含的 OpenGL 版本 include 是版本 1 1 我希望使用合理的当前版本某种版本 3 或 4 我需要做什么才能达到该状态 OpenGL SDK 页面位
OpenGL 中连续暂停

void keyPress unsigned char key int x int y int i switch key case f i 3 while i x pos 3 sleep 100 glutPostRedisplay 上面是在
lwjgl 3 , glUniformMatrix4 导致 jre 崩溃

我正在使用 lwjgl 3 并学习现代 opengl 3 我想将统一矩阵发送到顶点着色器以便我可以应用转换我尝试过但程序因此错误而崩溃 A fatal error has been detected by the Java Runti
Linux 上的 OpenCL 编译

我是 OpenCL 的新手从昨天开始我尝试使用 OpenCL 进行并行编程而不是使用我更熟悉且以前体验过的 CUDA 现在我有 NVIDIA GTX 580 GPU Ubuntu Linux 12 04 操作系统和 CUDA SDK
将像素传递给 glTexImage2D() 后会发生什么？

例如如果我创建一个像素数组如下所示 int getPixels int pixels new int 10 pixels 0 1 pixels 1 0 pixels 1 1 etc glTexImage2D getPixels glTe
为什么 OpenGL 给对象提供句柄而不是指针？

OpenGL 的传统是让用户使用 unsigned int 句柄来操作 OpenGL 对象为什么不直接给出一个指针呢与指针相比唯一 ID 有何优点 TL DR OpenGL ID 不会双射映射到内存位置单个 OpenGL ID 可能
如果我用opengl绘图的话SDL Renderer就没用了吗？

我正在学习 SDL2 但我也在使用使用 OpenGL 调用的 imgui 库从我在网上各种博客上读到的内容来看我无法轻松混合 SDL2 渲染器和 opengl 调用我要么使用其中之一要么使用另一个我读过的大多数教程都使用渲染器所
为什么OpenGL使用float而不是double？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
当 OpenGL 中同时绑定 1D 和 2D 纹理时，正确的行为是什么？

假设你有这样的东西 glBindTexture GL TEXTURE 2D my2dTex glBindTexture GL TEXTURE 1D my1dTex glBegin 正确的 OpenGL 行为是什么要绘制一维纹理二维纹理还

随机推荐

WordPress：重置密码始终无效密钥

我有一个很大的问题找不到解决方案我已经安装了 Ultimate Member Plugin 并激活了它当我现在重置用户的密码时我会从我的页面收到一封电子邮件其中包含在class password phpUM函数调用触发的插件文件u
ember.js 中是否有一个回调，我可以在状态转换后渲染所有视图后使用它来运行代码？

我有由三个出口组成的应用程序视图提出自己的观点简化
为什么 CSS :not 伪类不能按预期工作？

考虑以下 HTML div class a div class b Hello div div div class c div class b World div div 按照预期添加以下 CSS 颜色仅世界为红色 c b color
将输入文本字段从 HTML 获取到 JavaScript 并转到 URL

如何将输入文本字段从 HTML 转换为 JavaScript 并转到 URL 我正在构建一个网页您可以在输入字段中输入一些单词 Java 会获取该字符串并检查该字符串是否与另一个字符串相等如果它转到某个 URL 我的代码是
Android 相机视频意图返回 null URI

我最近更新到了 Android 4 3 每当我从应用程序中使用 Intent 启动它时库存摄像机就开始表现得有点奇怪起初它只是崩溃并说图库停止响应过了一会儿我能够录制视频但是单击完成会向我的应用程序返回一个空 URI 这导致
Perl 中的编译时间和运行时间

我在读这个文件 http oreilly com catalog pperl3 chapter ch18 html了解 Perl 程序的生命周期 When do run时间和什么时候做compile在命令行上运行 Perl 脚本时发生时间事
几秒钟后清除通知

当您打开消息活动并且手机收到新消息时状态栏上会显示一条通知短时间后通知将被删除是否可以对我的活动执行相同的操作而不使用计时器在几秒钟后清除通知我不相信有一种方法可以仅使用NotificationManager来取消通知但您可以
Jboss as 7 使用 HTTP 管理 api 进行部署

如何使用 HTTP 管理 api 将存档部署到 Jboss as 7 我尝试使用从 RHQ 插件类创建的以下代码公共类Main2 public static final String MANAGEMENT management publi
硬盘序列号可以/为什么会改变

我们的反盗版软件根据硬盘序列号来识别人员我相信这是一个恒定的功能除非用户更改其主要物理驱动器否则不会改变如果我错了请纠正我我们使用WMIpython模块获取用户的硬盘序列号我们的 2 台测试计算机的硬盘序列号已更改但我们根本
为什么我们必须定义一个在类中初始化的 const 静态成员

我们知道可以在类结构内部初始化整型 const 静态成员这在初始化后在类结构中使用常量时很有用例如它可以用作 int 数组的大小看下面的代码 class MyClass static const int num 100 int e
多个线程在同一全局内存位置写入相同的值

这个问题与以下问题密切相关this one https stackoverflow com questions 8315931 does writing the same value to the same memory location
在文本区域内建议/自动完成的 jQuery 插件 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有一个 jQuery 插件可以在文本区域内建议自动完成我想要的是在文本区域中向用户提供建议的单
现代 C 和 C++ 中是否已弃用 f(void)？ [复制]

这个问题在这里已经有答案了我目前正在重构整理 C 项目中使用的一些旧 C 代码并经常看到以下函数 int f void 我倾向于写成 int f 是否有任何理由不在整个代码库中将 void 替换为以提高一致性或者两者之间是否存在我
如何使用 cassandra-cli 更新 gc_grace_seconds？

更新列族并更改其列族的命令是什么gc grace seconds价值利用cassandra cli 对于CQLSH alter table
为反应式管道编写方面

我正在为返回承诺的方法编写方面考虑以下方法 public Mono
更新现有的 JobDataMap

我有一份已经安排好的 Quartz 工作我想更新与之关联的 JobDataMap 如果我得到一个 JobDataMapJobDataMap jobDataMap scheduler getJobDetail getJobDataMap 那
防止 window.open 聚焦

我想使用 window open 在 Google Chrome 的新选项卡中打开页面但我不希望该窗口在打开后获得焦点而是留在后台这可能吗它只需要在 Google Chrome 上运行它还可以使用 Google Chrome 扩展
Pandas：从多索引中的日期中选择

假设我有 MultiIndex 系列 date foo 2006 01 01 1 12931926 310 3 11084049 460 5 10812205 359 7 9031510 239 9 5324054 903 2007 01
使用 websockets 和 SocketIO 防止“心跳超时”

我正在使用 NodeJS 和 SocketIO 作为我的 websocket 解决方案它工作正常但几分钟后我的套接字服务器总是超时并在控制台中显示以下消息 debug fired heartbeat timeout for clie
glReadPixels() 会消耗单个核心的所有CPU周期

我有一个带有 OpenGL 窗口的 SDL2 应用程序它表现良好当它运行时该应用程序与我的 60Hz 显示器同步并且我看到该应用程序的 CPU 使用率为 12 到目前为止一切都很好但是当我通过从深度缓冲区绘制后读取单个深

glReadPixels() 会消耗单个核心的所有CPU周期

glReadPixels() 会消耗单个核心的所有CPU周期 的相关文章

随机推荐

热门标签

glReadPixels() 会消耗单个核心的所有CPU周期的相关文章