OpenGL-OpenCL 互操作传输时间 + 位图纹理

2024-02-03

两部分问题：

我正在开展一个学校项目，使用生命游戏作为实验 gpgpu 的工具。我使用 OpenCL 和 OpenGL 进行实时可视化，目标是让这个东西尽可能大、更快。经过分析，我发现帧时间主要由 CL 获取和释放 GL 缓冲区决定，并且时间成本与缓冲区的实际大小成正比。

1）这正常吗？为什么会这样呢？据我所知，缓冲区永远不会离开设备内存，并且 CL 获取/释放就像互斥锁一样。 OpenCL 是否单独锁定/解锁每个字节或其他什么？

为了解决这个问题，我从 24 位 RGBA 颜色模式（据我所知，OpenGL 的首选颜色模式？）缩减为 8 位 RGB 颜色。这导致了显着的加速，但是在调整我的内核之后，传输时间再次占据主导地位。

由于没有任何关于如何完全消除传输时间的想法（除了将我的内核从 OpenCL 移植到 GLSL 之外，这将超出项目的原始范围），我现在认为我最好的选择是写入位图（（与我当前使用的 8 位像素图相反），然后使用该位图和颜色索引来对四边形进行纹理处理。

2）我可以直接使用位图对四边形进行纹理化吗？我考虑过使用 glBitmap 绘制到辅助缓冲区，然后使用该缓冲区来纹理我的四边形，但如果可用，我更愿意使用更直接的路线。

CL/GL 互操作获取和释放调用背后的设计意图是让它们只是所有权转移。然而，在许多早期的实现中，这些都是从 CL 到 GL 来回复制图像。

除非您使用 OpenCL 1.1 中的同步对象扩展，否则您需要在释放之前执行 clFinish，在获取之前执行 glFinish；你will看到这里花费了大量时间，因为所有排队的工作都必须在这些调用继续之前完成。有些平台您可以使用 clFlush 而不是 clFinish；检查供应商提供的 OpenCL 文档。

通过在或多或少最新的硬件上安装最新的 NVIDIA 和 AMD 驱动程序，我发现高清视频大小的图像的获取和释放调用速度非常快。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

OpenGL

opencl

OpenGL-OpenCL 互操作传输时间 + 位图纹理的相关文章

使用 OpenCL 或其他 GPGPU 框架在现代 x86 硬件上的 CPU 和 GPU 之间共享数据

AMD Kaveri 的 hUMA 异构统一内存访问和 Intel 第四代 CPU 证明了 CPU 和 GPU 硬件的不断统一应该允许 CPU 和 GPU 之间进行无副本的数据共享我想知道最新的 OpenCL 或其他 GPGPU 框
从文件中读取 GLSL 着色器

我正在尝试从如下所示的文件中读取顶点和片段着色器 version 330 core in vec3 ourColor out vec4 color void main color vec4 ourColor 1 0f but when i
将glm四元数转换为旋转矩阵并与opengl一起使用

所以我将对象的方向存储在 glm fquat 中我想用它来旋转我的模型我怎么做我试过这个 glPushMatrix glTranslatef position x position y position z glMultMatrixf
对 VBO 中的特定三角形使用不同的纹理

我有 9 个由三角形组成的四边形如下所示我在用着VBO存储有关它们的数据它们的位置和纹理坐标我的问题是是否可以仅使用一个来使四边形 5 具有与其余四边形不同的纹理VBO and shader 绿色代表纹理 1 黄色代表纹理 2 到
（定义一个宏）方便OpenGL命令调试？

有时插入条件打印和检查需要很长时间glGetError 使用二分搜索的形式来缩小范围其中第一个函数调用是 OpenGL 首先报告错误我认为如果有一种方法可以构建一个宏我可以包装所有可能失败的 GL 调用并有条件地调用那就太酷了gl
OpenGL 的每个组件 alpha 通道？

是否可以使用 OpenGL 对每个组件使用一个 alpha 通道一个用于红色一个用于绿色一个用于蓝色进行混合如果没有有哪些可能的解决方法这不是直接支持的东西不过您自己实现起来相当容易使用 3 通道 alpha 纹理渲染三
glutPostRedisplay 不在循环内工作

我试图让一个人在 y 轴上跳跃所以我使用 2 秒的循环第一秒它应该向下移动并弯曲膝盖第二秒它应该向上移动然后在起始位置完成现在我刚刚开始让这个人在第一秒内跪下并弯曲膝盖我还没有编写动画的其余部分问题是 glutPostRedi
在内核 OpenCL 中实现 FIFO 的最佳方法

目标在 OpenCL 中实现下图所示 OpenCl 内核所需的主要内容是将系数数组和临时数组相乘然后最后将所有这些值累加为 1 这可能是最耗时的操作并行性在这里非常有帮助我正在为内核使用一个辅助函数来执行乘法和加法我希望这个函数也
OpenGL z轴指向哪里？

我正在尝试了解 OpenGL 坐标系我到处都看到它被描述为右撇子但这与我的经验不符我尝试绘制一些形状和 3 d 对象我发现 z 轴显然指向屏幕而 x 指向右侧 y 指向上方这是左手坐标系的描述我缺少什么编辑例如 http
gluPerspective 与 gluOrtho2D

我查看了 MSDN 上关于这两个函数的文档但是我不太明白这两个功能之间的区别一个是用于设置 3D 相机视图另一个是用于设置 2D 相机视图如果能得到解答就太好了预先感谢您的评论正交投影基本上是没有透视的 3D 投影本质上这
使用 glDrawElements 时在 OpenGL 核心配置文件中选取三角形

我正在使用 glDrawElements 绘制三角形网格并且希望能够使用鼠标单击来拾取选择三角形三角形的网格可以很大在固定功能 OpenGL 中可以使用 GL SELECT http content gpwiki org inde
使用 OpenGL 着色器进行数学计算 (C++)

我有一个矩阵例如 100x100 尺寸我需要对每个元素进行计算 matrix i j tt 8 5例如我有一个巨大的矩阵我想使用 OpenGL 着色器来实现该算法我想使用着色器例如 uniform float val unifo
glut 库中缺少 glutInitContextVersion()

我正在练习一些 opengl 代码但是当我想通过以下方式强制 opengl 上下文使用特定版本的 opengl 时glutInitContextVersion 它编译过程失败并给出以下消息使用未声明的标识符 glutInitContex
使用 C# 截取任何外部应用程序的屏幕截图

我们有一个 C WPF 应用程序我们想要在其中截取我们启动的任意应用程序的屏幕截图即我们可以引用我们启动的进程应用程序可能已最小化或位于其他窗口后面但我们仍然只需要单个应用程序的图像而不是重叠像素我知道使用 BitBlt 或的
OpenCL 何时使用全局、私有、本地、常量地址空间

我正在尝试学习 OpenCL 但我很难决定使用哪些地址空间因为我只找到组装的资源声明这些地址空间是什么但没有声明它们为什么存在或何时使用它们资源至少太分散了所以带着这个问题我希望把所有这些信息汇总一下所有地址空间是什么它们为什么
为什么OpenGL使用float而不是double？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何在 pyopencl 中创建可变大小的 __local 内存？

在我的 C OpenCL 代码中我使用clSetKernelArg创建可变尺寸 local我的内核中使用的内存 OpenCL 本身不提供该内存看我的例子 clSetKernelArg clKernel ArgCounter sizeof
Opengl 像素完美 2D 绘图

我正在研究 2d 引擎它已经工作得很好但我不断收到像素错误例如我的窗口是 960x540 像素我从 0 0 到 959 0 画一条线我希望扫描线 0 上的每个像素都会被设置为一种颜色但事实并非如此最右边的像素没有被绘制当我
是否可以在 OpenCL 中并行运行求和计算？

我是 OpenCL 的新手不过我了解 C C 基础知识和 OOP 我的问题如下是否可以以某种方式并行运行求和计算任务理论上可能吗下面我将描述我尝试做的事情任务例如是 double values new double 1000 l
在 OpenCL 中将函数作为参数传递

是否可以在 OpenCL 1 2 中将函数指针传递给内核我知道可以用C实现但不知道如何在OpenCL的C中实现编辑我想做这篇文章中描述的同样的事情在 C 中如何将函数作为参数传递 https stackoverflow com q

随机推荐

如何创建一个可以点击其他应用程序的自动点击器应用程序？

我见过很多提供自动点击功能的应用程序但他们不提供一些特定的定制所以我决定创建一个我看过很多提供自动点击的教程但它们应该在同一个应用程序中使用但我想创建一个自动点击应用程序可以单击其他应用程序的视图我是一名中级java开发人员
Delphi 应用程序如何检测 Windows PC 的网络代理设置？

我有一个 Delphi 应用程序它使用以下命令与 Internet 上的 Web 服务器进行通信印地组件 http www indyproject org 该应用程序的大多数用户都具有直接的 Internet 连接但有些用户位于本地网络
Lua 作为嵌入式语言的替代品？

我正在开发一个在 DSP 上运行 Linux 的嵌入式系统现在我们想让它的某些部分可以编写脚本并且我们正在寻找一种很好的嵌入式脚本语言这些脚本应该与我们现有的 C 代码库很好地集成并且小而快我知道 Lua 是解决此类问题的行业选择
将 GCController 与 tvOS 模拟器结合使用

我没有新的 Apple TV 但正在使用模拟器为其制作游戏原型不幸的是我似乎无法让 GCController 将 Siri 遥控器列为可用控制器正如 tvOS 文档所示我的控制器列表始终是 0 个元素长即使我调用startWire
OS X 的 Boot2Docker 无法启动

我是 docker 新手我正在尝试在我的工作计算机上运行 boot2docker 我使用从办公室网络挂载主目录的用户帐户登录到运行 OS X 版本 10 10 1 Yosemite 的计算机我安装了 Docker v1 4 1https
禁用内联CSS样式[重复]

这个问题在这里已经有答案了当我使用 IE Developer 工具检查 html 时我发现按钮有一种内联样式我什么都不想要width此输入元素的属性如何禁用或用空覆盖它width 如果您想覆盖内联样式那么您需要在样式表中添加样式
Elasticsearch 的 406（不可接受）错误代码是什么意思？

我正在尝试使用qwest http dreamysource io project qwest将一些数据发送到 Elasticsearch qwest post http elk example com 9200 incidents thi
固定列标题宽度与正文列宽度不匹配

标题与列宽不对齐 JsFiddle http jsfiddle net DyMSb 1 截屏 http s17 postimg org dybznay9b screen png 我在用着 ajax aspnetcdn com ajax jq
以单下划线或双下划线开头的函数和变量

我在各种编程语言 PHP 和 Python 中看到过以下划线开头的函数和变量并且对其背后的含义感到困惑假设 PHP 中使用正常约定单下划线表示受保护的成员变量或方法双下划线表示私有成员变量或方法这源于当时 PHP 的 OOP 支持
如何让Spring JMS从注释@JmsListener中选择目标队列名称

任何帮助将不胜感激我正在尝试使用 spring JMSListener 创建 MDB 的替代品我希望将目的地名称作为注释传递但我注意到org springframework jms listener DefaultMessageLis
对象的 JVM 深度内存大小[重复]

这个问题在这里已经有答案了据我所知众所周知的 Instrumentation Java 方法无法正确计算对象的深度大小是否有可靠的方法在 JVM 上计算对象的正确深度大小我正在考虑的用例是固定或上限内存大小的数据结构即缓存注
如何显示多个 YouTube 视频而不重叠音频

我有一个包含一些 YouTube 视频嵌入代码的页面当用户在一个视频上单击 gt 播放时页面上的所有其他视频都需要暂停否则它们的音频会与刚刚播放的新视频重叠实现这一点最有效的方法是什么好吧这是我根据其他人的一些代码提出的解决方
postgreSQL中的@@Fetch_status

我正在将数据库从 MS SQL Server 传输到 PostgreSQL 但此触发器有问题 CREATE TRIGGER added clients ON client FOR INSERT AS BEGIN DECLARE cursor
如何强类型组合 mixin？

我正在尝试使用函数组合通过 mixin 向对象添加行为 const pipe funcs args any gt any gt initial any gt funcs reduce object fn gt fn object initi
快速，将文件发送到服务器

我正在学习 swift 我使用下面的代码向服务器发送请求它适用于简单的请求我从服务器得到响应我的问题是我无法将文件发送到服务器 code let parameters parameter let request NSMutableUR
播放后重定向 html5 视频

我有一个 html 5 视频我删除了控制按钮并添加了 js 代码以便用户在单击视频时播放视频我需要做的是绑定一个额外的脚本该脚本将在视频播放后重定向页面而无需重新加载页面下面是我的js代码 function play var v
如何获取colspan的值

我尝试过不同的 jQuery 方法 var num this attr colspan text var num this attr colspan val var num this td colspan val var num this
在c#中将字符串转换为十进制

我在使用decimal parse 将字符串转换为十进制值时遇到一些问题这是我的代码行 fixPrice decimal Parse mItemParts Groups price Value Replace Replace Replac
开发人员是否需要为在 Windows Azure Marketplace 上发布 SaaS 应用程序付费？

目前我正在构建一个简单的 SaaS 驱动的 TMS 目的是在 Windows Azure Marketplace 中发布它我无法找到任何定价微软是否向开发者收取发布费用是按月计算的吗或者 Windows Azure 上托管的所有应用
OpenGL-OpenCL 互操作传输时间 + 位图纹理

两部分问题我正在开展一个学校项目使用生命游戏作为实验 gpgpu 的工具我使用 OpenCL 和 OpenGL 进行实时可视化目标是让这个东西尽可能大更快经过分析我发现帧时间主要由 CL 获取和释放 GL 缓冲区决定并且时间

OpenGL-OpenCL 互操作传输时间 + 位图纹理

OpenGL-OpenCL 互操作传输时间 + 位图纹理 的相关文章

随机推荐

热门标签

OpenGL-OpenCL 互操作传输时间 + 位图纹理的相关文章