在 OpenCL 中使用内核导致另一个内核

2024-01-04

我已经编写了图像卷积的代码，使用 API 的 clCreateImage2D 创建空间，使用 clEnqueueWriteImage 写入设备，使用 read_imageui 读取内核中的图像，使用 write_imageui 将图像写回主机。

现在我想使用卷积内核的结果，该结果指向另一个内核参数中的缓冲区。无需将结果移回主机并移至设备。这可能吗？

如果结果来回移动......我认为会很昂贵。

在这方面的任何帮助都将是无价的。

从主机的角度来看，您应该能够获取缓冲区对象，并将其作为参数传递给另一个内核。之后，您只需像对待其他缓冲区一样对待它即可。唯一的技巧是确保当您创建缓冲区时，它具有足够的读写权限，以便它可以输出和输入到内核。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Kernel

opencl

在 OpenCL 中使用内核导致另一个内核的相关文章

unix/linux 套接字中的阻塞模式如何工作？

阻塞模式是否将该特定任务置于进程等待状态因为我认为非阻塞套接字需要用户明确的忙等待或自旋锁实现或者阻塞模式套接字只不过是内核忙等待的隐式实现在信号量互斥体监视器等锁定机制中通常通过将任务推入阻塞状态来实现锁定我认为
定义新的套接字选项以在 TCP 内核代码中使用

我正在尝试向 TCP 内核代码添加一些功能在tcp input c 我希望我实现的代码仅在某些情况下运行我想添加一个控制标志可以从用户空间应用程序设置它我认为我需要添加一个新的套接字选项以便我可以完成以下操作setsockop
使用 OpenCL 或其他 GPGPU 框架在现代 x86 硬件上的 CPU 和 GPU 之间共享数据

AMD Kaveri 的 hUMA 异构统一内存访问和 Intel 第四代 CPU 证明了 CPU 和 GPU 硬件的不断统一应该允许 CPU 和 GPU 之间进行无副本的数据共享我想知道最新的 OpenCL 或其他 GPGPU 框
OpenCL 矩阵乘法应该更快？

我正在尝试学习如何使 GPU 优化 OpenCL 内核我以使用本地内存中的方形图块进行矩阵乘法为例然而在最好的情况下我只得到了约 10 倍的加速约 50 Gflops 与 numpy dot 相比 5 Gflops 它使用的是 BL
如何在 Windows 中拦截 DNS 查询

我正在研究如何在 Windows 中拦截 DNS 查询以一种不需要将 DLL 注入到每个进程中的方式并且理想情况下能够根据发出查询的进程做出决策因此简单的 DNS 代理服务器是不够的从表面上看 DNS 查询所采用的路径如下所示某些
操作系统如何知道缺失页面的磁盘地址？

分页充当虚拟地址空间和物理地址空间之间的间接层给定一个地址操作系统 OS 内存管理单元 MMU 将其转换为主内存位置我的问题是主内存中不存在该页面的情况操作系统如何知道在磁盘上哪里可以找到该页面它在哪里存储1的信息它不存储在页
Linux 中 NDIS 过滤器的类似物是什么？

我正在研究一个as close to real time我在linux中尽可能地使用系统并且需要在收到特定数据包后立即发送大约600 800字节的TCP数据包为了获得最佳的延迟我希望这个数据包直接从内核发送而不是将接收到的数据包一直
没有设备的设备驱动程序？

我正在创建一个需要使用一些内核级模块的应用程序为此我将应用程序分为 2 个一个用户级程序和一个内核级程序在阅读了有关设备驱动程序并浏览一些教程后我有点困惑是否可以存在没有任何特定设备与之关联的设备驱动程序除了设备驱动程序内核代
Linux内核页表更新

在linux x86 中分页每个进程都有它自己的页面目录页表遍历从 CR3 指向的页目录开始每个进程共享内核页目录内容假设三个句子是正确的假设某个进程进入内核模式并更新他的内核页目录内容地址映射访问权利等问题由于内核地
OpenCL 何时使用全局、私有、本地、常量地址空间

我正在尝试学习 OpenCL 但我很难决定使用哪些地址空间因为我只找到组装的资源声明这些地址空间是什么但没有声明它们为什么存在或何时使用它们资源至少太分散了所以带着这个问题我希望把所有这些信息汇总一下所有地址空间是什么它们为什么
如何在 Emgu CV 项目中利用 OpenCL

我是使用 Emgu CV 的新手并开始创建小型示例项目例如面部检测眼睛检测等如果我可以利用 OpenCL 来加速使用 GPU 的过程那就太好了否则当我降低scaleFactor时它会导致大量的CPU利用率我怎样才能做到这一
如何在 pyopencl 中创建可变大小的 __local 内存？

在我的 C OpenCL 代码中我使用clSetKernelArg创建可变尺寸 local我的内核中使用的内存 OpenCL 本身不提供该内存看我的例子 clSetKernelArg clKernel ArgCounter sizeof
内核开发和 C++ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案从我know https stackoverflow com questions 580292 what languages are windo
Linux 内核标识符中前导和尾随下划线的含义是什么？

我不断遇到一些小约定比如 KERNEL Are the 在这种情况下是内核开发人员使用的命名约定还是以这种方式命名宏的语法特定原因整个代码中有很多这样的例子例如某些函数和变量以甚至这有什么具体原因吗它似乎被广泛使用我只需
OpenCL 内核在 Nvidia GPU 上每个线程使用多少寄存器？

我的第一个问题是如何获取 Nvidia GPU 上 OpenCL 内核代码的寄存器使用信息因为 nvcc 编译器给出了相同的使用信息nvcc ptxas options vCUDA 内核代码的标志我还从 AMD GPU for Open
检测从内核扩展的文件复制

我正在尝试构建 POC 该 POC 可以使用 fileop 范围回调来识别来自基于 kauth 的内核扩展的文件复制活动但是复制文件似乎涉及两个单独的身份验证操作从中打开 src 文件并创建新文件我的目标相当简单在填充数据后检测新
使用 strace 修复挂起内存问题

我有一个在 RHEL6 x 64 位上运行的多线程进程我发现当我尝试启动该进程时该进程挂起并且大多数线程同一进程的崩溃有些线程等待线程之间的共享内存被创建我可以看到所有的共享内存都没有被创建但是当我使用 strace 时进
在构建内核模块时为什么需要 /lib/modules？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案在Kbuild树中当我们编写一个简单的hello ko程序时为什么我们需要在构建规则中使用 C lib module 为什么需要这样做
在 open CL 中将结构数组传递给内核

你好我正在尝试在 open CL 中实现距离向量程序基本上我在将结构数组作为参数传递到内核时遇到问题我的结构定义是这样的 typedef struct int a nodes 4 node node srcA 为此分配内存后我使用此
用 OpenCL C 编写快速线性系统求解器

我正在编写一个 OpenCL 内核它将涉及求解线性系统目前我的内核太慢了提高线性系统部分的性能似乎是一个不错的起点我还应该注意我并没有尝试使我的线性求解器并行我正在研究的问题在宏观层面上已经是令人尴尬的并行以下是我编写的 C

随机推荐

我在 Linux (Centos) 下的 C 中运行时出现“无法分配请求的地址”错误

当我分配这个地址时它说cannot assign requested address 但是当我输入本地地址 127 0 0 1 时它会接受它为什么 char hostname 192 168 1 8 int sockfd struct
如何仅使用键盘在 Visual Studio 中导航调用堆栈？

My current solution is to hit AltD W C which navigates via the menus to the call stack and then I can use the arrows to
在 XAML 中将标签和文本块垂直对齐在顶部

我怎样才能垂直对齐Label and TextBlock at Top让他们的第一行文本对齐
如何将 DecimalFormat 的小数分隔符从逗号更改为点/点？

我有一个疯狂的小方法可以将 BigDecimal 值转换为漂亮且可读的字符串 private String formatBigDecimal BigDecimal bd DecimalFormat df new DecimalFormat
PowerShell 执行策略被 powershell.exe 参数破坏

在 PowerShell 中除了尝试控制哪些脚本文件可以运行之外限制性执行策略还有其他优点吗默认情况下不允许运行 PowerShell 脚本但似乎如果恶意方想要运行 PowerShell 脚本他们可以使用 BAT 文件引导进入该
为什么这个文件是空的？这段代码应该用东西填充它

package stuff import java io IOException public class DataWriter public static void main String args throws IOException
将分隔符添加到要显示的项目列表中

我有一个项目列表我希望在 C 中显示它们之间的分隔符使用普通的迭代器我最终会在开头或结尾有一个额外的分隔符 string sa one two three four string ns foreach string s in sa n
使用 Spark 从 Oracle 导入数据

在 Databricks 中我使用以下代码从 Oracle 中提取数据 scala val empDF spark read format jdbc option url jdbc oracle thin username passwor
阅读 Html 代码并查找
文本。 C＃

我正在使用此代码来读取 html 页面 WebClient client new WebClient String htmlCode client DownloadString C checkemails check html Replac
在 Linux shell (Bash) 中使用命名管道的示例

有人可以发布一个在 Linux 上的 Bash 中使用命名管道的简单示例吗命名管道实际使用的最佳示例之一 From http en wikipedia org wiki Netcat http en wikipedia org wiki
JavaScript：location.href 在新窗口/选项卡中打开？

我有一个来自第三方开发人员的 JavaScript 文件它有一个 has 链接可以用目标替换当前页面我想在新选项卡中打开此页面这是我到目前为止所拥有的 if command lightbox location href https
在 Twitter Bootstrap 中实现下拉菜单背后的想法是什么？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我一直在研究 Twitter 的 Bootstrap 框架给我留下了深刻的印象但是我不明白下拉导航菜单工作方式背后的想法首先为了查看子
LNK1112：模块机器类型“x64”与目标机器类型“X86”冲突：Qt 创建者

我有一个在 Linux 上运行的应用程序我试图将其导入到 Windows 上我已经设置了所有库并对 pro 文件进行了更改现在当我尝试构建项目时我收到此错误 error LNK1112 module machine type x
如何减少 ssh 连接超时值[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我有一个完整的远程主机 IP 地址列表我编写了一个脚本来一一连接此列表中的所有主机我的问题是有时当 IP 地址关闭时脚本会等待一段
git-svn 中的 Unignore 目录（将目录添加到稀疏签出）

当使用 git svn 时可以通过以下方式实现中央存储库的稀疏签出 git clone s URL to root include paths dir1 dir2 dir3 使用此设置一段时间后我想将另一个目录 dir4 添加到跟踪的目
为什么在函数的任何表达式中使用 ... 会导致 Lua 中 arg 的值为 nil？

function tell num print value of implicit table arg print value of implicit table select 1 arg select 1 end tell 12 43 1
如何使用 php 循环执行 mysql 查询

我尝试使用这个功能 conn db connect while newsfeed conn gt query select info username time from newsfeed ORDER BY time DESC LIMIT
检查浏览器是否接受cookie

有没有办法检查浏览器是否允许cookies Request Browser Cookies 禁用 cookie 时不起作用它说浏览器可以支持它们我唯一能想到的另一件事是尝试设置一个测试 cookie 然后检查它是否已设置无论如何有没
为什么我不能在Environment.DIRECTORY_PICTURES 中创建目录？

这是我的代码 File selfieLocation new File getExternalFilesDir Environment DIRECTORY PICTURES Daily Selfies boolean isDirectory
在 OpenCL 中使用内核导致另一个内核

我已经编写了图像卷积的代码使用 API 的 clCreateImage2D 创建空间使用 clEnqueueWriteImage 写入设备使用 read imageui 读取内核中的图像使用 write imageui 将图像写回主

在 OpenCL 中使用内核导致另一个内核

在 OpenCL 中使用内核导致另一个内核 的相关文章

随机推荐

热门标签

在 OpenCL 中使用内核导致另一个内核的相关文章