使用哈希合并全局内存写入

2024-01-04

我的问题涉及合并全局写入到 CUDA 中数组的一组动态变化的元素。考虑以下内核：

__global__ void
kernel (int n, int *odata, int *idata, int *hash)
{
  int i = blockIdx.x * blockDim.x + threadIdx.x;
  if (i < n)
    odata[hash[i]] = idata[i];
}

这里是第一个n数组的元素hash包含索引odata从最初开始更新n要点idata。显然，这会导致非常非常严重的缺乏合并。就我的代码而言，一个内核调用的哈希值与另一个内核调用的哈希值完全无关（其他内核以其他方式更新数据），因此简单地重新排序数据来优化这个特定的内核并不是一种选择。

CUDA 中是否有某些功能可以让我提高这种情况下的性能？我听到很多关于纹理内存的讨论，但我无法将我读到的内容转化为该问题的解决方案。

纹理是一种只读机制，因此它不能直接提高 GMEM 分散写入的性能。如果你像这样“散列”：

odata[i] = idata[hash[i]];

（也许你的算法可以改造一下？）

那么考虑一下可能会有一些好处纹理机制 http://docs.nvidia.com/cuda/cuda-samples/index.html#simple-texture。（您的示例本质上似乎是一维的）。

您还可以确保共享内存/L1 分割针对缓存进行了优化。但这对于分散的写入没有多大帮助。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用哈希合并全局内存写入的相关文章

C# 中两种不同类型的列表

我目前在为客户提供购物车时遇到问题他希望能够在 CartItems 之间添加文本所以我想知道是否有某种方法仍然只有一个列表我的解决方案是有两个列表其中一个是 IList 类型在计算购物车的重量和总体价格时会迭代而另一个 ILis
TFS API - 缓慢的 foreach 变更集迭代

问题背景我正在使用 TFS api 查询 TFS 服务器上的大范围 1 600 文件我从每个文件中收集其所有 ChangesetId 然后将其收集在列表中代码这是我正在使用的代码它可以正确生成 QueryHistory 方法中指定
如何在 C++ 中对四元结构进行有效排序？

我有一个包含 x y z 和 w 成员的结构如何高效排序在 C 中首先按 x 然后按 y 按 z 最后按 w 如果你想实现字典排序那么最简单的方法是使用std tie实现小于或大于比较运算符或函子然后使用std sort http
如何从 webmethod 向 AJAX 调用返回异常？

我回来了List
确保 unsigned int/long 始终在 C# 中的检查上下文中执行

有没有人觉得奇怪 uint 和 ulong 的默认上下文是未检查的而不是检查的因为它们旨在表示永远不能为负的值因此如果某些代码试图违反该约束在我看来自然且首选的行为是抛出异常而不是返回最大值这很容易使重要数据处于无效状态并且
.NET：EventHandler 竞争条件修复如何工作？

以下模式用于在引发事件时避免竞争条件以防另一个线程取消订阅 MyEvent 使其为空 class MyClass public event EventHandler MyEvent public void F EventHandler h
gcc 删除内联汇编代码

看起来 gcc 4 6 2 删除了它认为函数中未使用的代码 test c int main void goto exit handler asm volatile jmp 0x0 exit return 0 拆解main 0x0804840
C# While 循环与 For 循环？

在 C 中一个问题已经困扰我一段时间了它的 While 和 For 循环之间的实际主要区别是什么它只是纯粹的可读性吗在 for 循环中本质上可以做的所有事情都可以在 while 循环中完成只是在不同的地方举这些例子 int nu
关于 FirstOrDefault 或 SingleOrDefault

FirstOrDefault 或 SingleOrDefault 将返回什么类型的数据假设我的查询返回 3 条记录例如 empid ename salary 1 joy 1500 2 rob 4500 3 jen 6500 所以如果我们
如何使用 Linq to Sql 修剪值？

在数据库中我有一个名为联系人的表名字和其他此类字符串字段设计为使用 Char 数据类型不是我的数据库设计我的对象 Contact 映射到属性中的字符串类型如果我想做一个简单的测试通过 id 检索 Contact 对象我会这
C++中的虚方法表存放在哪里？

我想知道类对象不是实例而是类如何存储在内存中 class A public int a virtual void f virtual A class B public A public int b void f final overr
vs2010 c++ 通过debug查看指针内容

我正在使用 Vs2010 c 处理 2D 数组我从一维指针开始并使用操作如下 class CMatrix void clear public int nRows int nCols short MyMat CMatrix CMatri
如何获取数字列的确切类型，包括。规模和精度？

有没有办法知道列中列的确切类型DataTable 现在我正在这样做 DataTable st dataReader GetSchemaTable foreach DataColumn col in st Columns var type c
通过开源 PCL 使用 API 查看 3D 点云

我使用 ToF 飞行时间相机来获取 XYZ 格式的深度数据为了实现 3D 点云的可视化目的我想使用开源 PCL 提供的 API 网址为http pointclouds org documentation tutorials pcl v
有没有办法将复选框列表绑定到 asp.net mvc 中的模型

我在这里寻找一种快速简便的方法来在模型中发生回发时绑定复选框列表项的列表显然现在常见的做法似乎是这样的form GetValues checkboxList 0 Contains true 这看起来很痛苦而且不太安全有没有一种方法可以绑
Opencv 对象检测：ORB GPU 检测器和 SURF GPU 描述符提取器

我只是做了一个小实验来尝试不同的检测器描述符组合我的代码使用 ORB GPU 检测器来检测特征并使用 SURF GPU 描述符来计算描述符我使用 BruteForceMatcher GPU 来匹配描述符并使用 knnMatch 方
错误：C# 尝试读取或写入受保护的内存

我很难纠正这个错误该应用程序在 4 台不同的机器上进行了测试在其中 3 台上运行良好但一台 Vista PC 在尝试通过 WebBrowser1 打开页面时出现此错误解决这个问题的任何帮助对我都会非常有帮助 System Acces
我可以创建一个 List> 吗？

我正在尝试创建一个列表WeakReference使用 4 5 泛型实现这样我就可以避免类型检查和转换WeakReference目标但 WeakReference
Eclipse CDT C/C++：包含另一个项目的头文件

我在 Eclipse CDT 中有两个 C 项目main and shared In shared我有一个名为calc h 我想在中使用这个标头main 所以我做了以下事情 added include calc h到相关文件main In
Image.Save 异常“GDI+ 中发生一般错误。”保存到 MemoryStream 时

我有一个服务器客户端应用程序我想从服务器获取屏幕截图但在线bitmap Save ms System Drawing Imaging ImageFormat Png 我得到这个例外 A generic error occurred in

随机推荐

C# 4 和 CLR 兼容性

C 版本 4 的所有新增内容动态代码契约等是否预计将在当前的 NET CLR 上运行或者是否也有计划的 NET 升级 C 4 将需要 NET 4 0 CLR
为什么当我使用命令行进行屏幕录制时，屏幕录制会出现错误[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我正在尝试通过以下方式对我的 Android 设备进行屏幕录制this http developer android com about v
Rails：已完成 401 未经授权

我收到此错误但我不知道为什么我特别排除了 CSRF 检查这 webhook即使在生产中该方法也有效其他类似的问题是关于 Devise 的但我没有在此控制器中使用 Devise stripes controller rb clas
从 Node.js 将 Json 存储到 MySQL 数据库

我知道这个问题已经被问过很多次了但是经过激烈的搜索我似乎找不到我正在寻找的答案我有一个 js 格式的脚本它创建一个 json 数据数组然后将其存储在一个 json 文件中阵列设置为 var sessionState curren
如何将光标移动到文档末尾？

我想将光标移动到脚本开头的文档末尾我怎么做我已经知道如何将光标移动到文档的开头如下所述here https stackoverflow com questions 26945026 how can i move the cursor
如何通过 https 启动 java servlet？

我正在尝试在 eclipse 中的 tomcat 上运行 servlet 当我在服务器上运行时 servlet 会运行并为我提供如下链接 http localhost 8443 AuthServer 服务器我已将 Tomcat 服务器配置
google app engine webapp 中 jinja2 自动转义的问题

我决定安装 jinja2 与我的 webapp 应用程序一起使用以支持自动转义功能因此我将 jinja2 安装到 python 2 5 中并在项目中创建了一个符号链接来指向该目录大部分情况下工作正常除了当我实际尝试使用 aut
如何更改 Visual Studio 2012 Express 项目模板？

例如我不希望我的类和接口符合 StyleCop 在非 Express 版本中我们可以在以下位置找到并更改类模板 C Program Files x86 Microsoft Visual Studio 11 0 Common7 IDE I
更改 SFSafariViewController 的色调颜色？

正如标题所说如何更改 iOS 9 中新的 SFSafariViewController 的整体色调颜色 iOS 10 的一些消息现在我们有两个属性来控制整体外观SFSafariViewController source link htt
Java Runtime.getRuntime().exec() 带引号

我正在尝试通过 linux 上的 exec 调用运行 ffmpeg 但是我必须在命令中使用引号 ffmpeg 需要它我一直在查看 processbuilder 和 exec 的 java 文档以及 stackoverflow 上的问题但
对服务与工厂感到困惑

据我了解当在工厂内部时我返回一个被注入控制器的对象当在服务内部时我正在使用以下方法处理对象this并且不返回任何东西我假设服务是始终是单身人士并且一个新工厂对象被注入到每个控制器中然而事实证明工厂对象也是单例对象吗演示示
JSF MVC设计问题

我有一个 JSF 支持 bean 设计问题现在我的支持 bean 保存 UI 显示信息和业务模式数据人们建议模型和视图应该分开那么创建不同的 bean 来保存 UI 显示数据并让支持 bean 引用它是个好主意吗那么创建不同的 b
我可以只选择 MYSQL 中的一列而不是全部，以使其更快吗？

我想做这样的事情 query mysql query SELECT userid FROM users WHERE username username the user id 因为我想要的只是与用户名对应的用户ID 通常的方法是 query
如何格式化 SQLCMD 输出

我正在使用下面的命令行使用 SQLCMD 运行 SQL 查询 sqlcmd S Server Q select top 100 From people d people t 10 该表有 20 列当我查看输出命令行窗口时文本会换行并使其
客户端 MVC 与服务器 MVC

我希望从其他用户那里获得一些关于服务器端 MVC 优势的意见拥有许多 javascript 库的强大功能服务器端 MVC 服务器还有什么用处呢您可以轻松地使用带有模板和 REST API 的客户端 MVC 来创建响应速度更快的应用程序
subprocess.Popen，从子进程（子进程）获取变量[重复]

这个问题在这里已经有答案了我想知道如何处理它我从子进程到父进程获取变量值我正在将子进程作为脚本运行父级看起来像 import subprocess p subprocess Popen abaqus python getData
为什么负载不能绕过同一核心上的另一个线程从写入缓冲区写入的值？

如果CPU核心使用写缓冲区则负载可以从写缓冲区绕过最近的存储到引用的位置而无需等到它出现在缓存中但是正如它所写的记忆一致性和连贯性入门 https lagunita stanford edu c4x Engineering CS31
Azure AD B2C 在注册策略中预填充自定义属性

从 Web 应用程序 ASP Net MVC 调用时 Azure AD B2C 是否支持在注册策略中预填充自定义属性我们可以创建自定义 SignUp 属性但我们无法在文档中找到如何传递值来填充自定义属性的规范如果开箱即用不支持此功能
自定义绑定类无法正常工作

目前我正在研究 WPF 数据绑定但遇到了一个我不明白的问题所以我把问题发布在这里也许你已经知道地理出了什么问题首先我在Windows Vista 32位下使用Visual Studio 2008 问题也存在于Windows 7 R
使用哈希合并全局内存写入

我的问题涉及合并全局写入到 CUDA 中数组的一组动态变化的元素考虑以下内核 global void kernel int n int odata int idata int hash int i blockIdx x blockDim

使用哈希合并全局内存写入

使用哈希合并全局内存写入 的相关文章

随机推荐

热门标签

使用哈希合并全局内存写入的相关文章