CUDA 中全局内存与常量内存的使用

2023-12-04

嘿，我有以下代码：

#if USE_CONST == 1
    __constant__ double PNT[ SIZE ];    
#else
    __device__ double *PNT;
#endif

稍后我有：

#if USE_CONST == 0
    cudaMalloc((void **)&PNT, sizeof(double)*SIZE);
    cudaMemcpy(PNT, point, sizeof(double)*SIZE, cudaMemcpyHostToDevice);
#else
    cudaMemcpyToSymbol(PNT, point, sizeof(double)*SIZE);
#endif

whereas point是之前代码中定义的某个地方。当与USE_CONST=1一切都按预期工作，但是如果没有它，则不会。我通过以下方式访问内核函数中的数组

PNT[ index ]

这两种变体之间的问题出在哪里？谢谢！

CUDA 4.0之前的cudaMemcpyToSymbol的正确用法是：

cudaMemcpyToSymbol("PNT", point, sizeof(double)*SIZE)

或者：

double *cpnt;
cudaGetSymbolAddress((void **)&cpnt, "PNT");
cudaMemcpy(cpnt, point, sizeof(double)*SIZE, cudaMemcpyHostToDevice);

如果您计划多次从主机 API 访问符号，这可能会更快一些。

编辑：误解了这个问题。对于全局内存版本，执行与恒定内存的第二个版本类似的操作

double *gpnt;
cudaGetSymbolAddress((void **)&gpnt, "PNT");
cudaMemcpy(gpnt, point, sizeof(double)*SIZE.  cudaMemcpyHostToDevice););

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

memory

CUDA

CUDA 中全局内存与常量内存的使用的相关文章

VS 程序在调试模式下崩溃，但在发布模式下不崩溃？

我正在 VS 2012 中运行以下程序来尝试 Thrust 函数查找 include cuda runtime h include device launch parameters h include
为什么 Go 禁止取 (&) 映射成员的地址，却允许取 (&) 切片元素？

Go 不允许获取地图成员的地址 if I do this p mm abc Syntax Error cannot take the address of mm abc 理由是如果 Go 允许使用此地址那么当地图后台存储增长或缩小时该
python中的内存错误

Traceback most recent call last File run 1341144766 1067082874 solution py line 27 in main File run 1341144766 106708287
Java Runtime.getRuntime().freeMemory() 问题

我搜索并看到了一些线程但没有一个能够解决我遇到的具体问题我正在尝试使用以下方式监视我的内存使用情况Runtime getRuntime freeMemory Runtime getRuntime maxMemory and Runtim
Gradle 构建错误：内存不足

当我使用 gradle 构建时它失败并显示以下信息 OpenJDK 64 Bit Server VM warning INFO os commit memory 0x0000000788800000 89128960 0 failed e
通过 cuFFT 进行逆 FFT 缩放

每当我使用 cuFFT 绘制程序获得的值并将结果与 Matlab 的结果进行比较时我都会得到相同形状的图形并且最大值和最小值位于相同的点然而 cuFFT 得到的值比 Matlab 得到的值大得多 Matlab代码是 fs 1000 s
CUDA 中指令重放的其他原因

这是我从 nvprof CUDA 5 5 获得的输出 Invocations Metric Name Metric Description Min Max Avg Device Tesla K40c 0 Kernel MyKernel do
是否有 java.lang.String 的内存高效替代品？

看完之后这篇旧文章 http www javaworld com javaworld javatips jw javatip130 html page 2测量几种对象类型的内存消耗我惊讶地发现有多少内存String在Java中的使用 le
NUMA 在虚拟内存中是如何表示的？

有许多资源 https en wikipedia org wiki Non uniform memory access从硬件角度描述NUMA的架构性能影响 http practical tech com infrastructure num
PAE（物理地址扩展）如何实现大于4GB的地址空间？

维基百科文章的摘录物理地址扩展 http en wikipedia org wiki Physical Address Extension x86 处理器硬件架构通过用于选择附加内存的附加地址线进行了增强因此物理地址大小从 32 位增加到
大型跨平台软件项目的技巧/资源

我将开始一个大型软件项目涉及跨平台 GUI 和大量的数字运算我计划用 C 和 CUDA 编写大部分应用程序后端并用 Qt4 编写 GUI 我计划使用 Make 作为我的构建系统这将是一个只有两名开发人员的项目一旦我相对深入地了解它
CUDA：获取数组中的最大值及其索引

我有几个块每个块在整数数组的单独部分上执行举个例子块一从 array 0 到 array 9 块二从 array 10 到 array 20 我可以获得每个块的数组最大值的索引的最佳方法是什么示例块一 a 0 到 a 10 具有以下
对将英特尔傲腾 DC SSD 用作 IMDT 的额外 RAM 感到困惑吗？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我对英特尔傲腾 DC 有点困惑我希望我的 Optane DC 能够同时充当 DRAM 和存储一方面我了解到只有英特尔傲腾 DC 持
已删除的类实例上的方法仍然有效吗？

我在 Visual C 2010 上有这段代码 include
如何计算汇编中的内存位移？

我一直在研究 yasm 汇编语言并生成了一个包含以下内容的列表文件我需要帮助理解第一列中的内存位移是如何计算的提前致谢 1 line 1 1 memory asm 2 section data 3 00000000 04000000
估计 libGD 操作所需的内存

在尝试使用 libGD 在 PHP 中调整图像大小之前我想检查是否有足够的内存可用于执行该操作因为内存不足会完全终止 PHP 进程并且无法捕获我的想法是原始图像和新图像中的每个像素 RGBA 需要 4 字节内存 check av
C++ 类的互斥成员导致编译错误

我不确定为什么当我向 myClass 添加互斥体成员时会发生这种情况在本例中为 mu Error C2661 std tuple lt void thiscall MyNameSpace myClass void MyNameSpace
了解 Linux oom-killer 日志

我的应用程序被 oom killer 杀死了它是在实时 USB 上运行的 Ubuntu 11 10 无需交换 PC 具有 1 Gig 的 RAM 唯一运行的应用程序除了所有内置的 Ubuntu 东西是我的程序 flasherav 请注
存储整数列表的最有效方法

我最近一直在做一个项目其中一个目标是使用尽可能少的内存来使用 Python 3 存储一系列文件除了一个整数列表之外几乎所有文件都占用很少的空间大致333 000整数长且整数可达约8000在尺寸方面我目前正在使用pickle存储列表
在 python 中 pickling 数据时出现内存错误

我正在尝试使用 python 中提供的 dump 命令将字典转储为 pickle 格式字典的文件大小约为 150 mb 但仅转储 115 mb 的文件时会出现异常例外情况是 Traceback most recent call last

随机推荐

n 组位的高效随机排列

对于产生精确的位模式的问题n设置位我知道两种实用的方法但它们都有我不满意的局限性首先您可以枚举在预先计算的表中设置了那么多位的所有可能的字值然后在该表中生成一个随机索引以挑选出可能的结果这样做的问题是随着输出大小的增长候选输
使用电子邮件地址将文件上传到云端

所以我不确定这是否可能以及是否有意义我正在尝试在我的应用程序中学习和使用云空间因此作为示例我尝试创建一个应用程序来在 Google Drive 中上传文件我注册了我的应用程序并使用了谷歌提供的一些参考资料我现在可以上传文件了我
我可以有一个没有聚集索引的主键吗？另外我可以有多值聚集索引吗？

各位我想了解以下问题的答案我可以有一个没有聚集索引的主键吗我知道当我们在列上创建主键约束时它默认创建一个聚集索引那么在这种情况下我应该如何停用聚集索引我可以有一个包含多个列的聚集索引吗就像在非聚集中一样我可以为单个非聚集索
Django：如何为允许多个文件上传的字段编写干净的方法？

我有一个用于上传图像的表单如果我遵循 Django 的标准清理表单的特定字段属性这就是我的 clean 方法通常的样子 class UploadImagesForm forms Form image forms FileField de
填充二维 numpy 数组给定索引之间的值

给定一个 numpy 数组 a np zeros 10 10 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Windows 上需要 Mono 3.0 的配置文件

是否有一个教程告诉我如何编写 mono 3 0 的配置文件以便我可以使用它微软视觉工作室 2010 其背后的原因是我的应用程序使用绑定列表当我尝试在 Mono 中运行时我收到此错误 WindowsFormsApplication2
我正在学习java中的异常处理（基本上是继承）

看看下面的程序 import java io import java rmi class class1 public void m1 throws RemoteException System out println m1 in class
for循环内的回调完成后如何执行函数？

我在搜索函数中有一个 for 循环其中有一个在循环内执行回调的函数我想在循环之后以及所有回调完成之后执行 BUILD 函数我不知道如何做到这一点因为循环在所有回调完成之前完成回调是获取数据的 API 请求我想使用该数据进行 BU
使用 Angular formArray 动态添加表单字段

我有一些表单字段想要动态添加更多来自另一个视图的字段用户可以在其中输入表单字段类型长度和名称我需要使用这些值构造表单字段我如何设法构建一个字段 textbox name is one 但是如果我尝试添加另一个字段 textbox
pandas中如何判断某列是否包含某些元素

我想检查一下该列是否app包含元素myList import pandas as pd df pd DataFrame app a b c e f myList b f print df Output app 0 a b c 1 e f E
Android - 地图标记绕 X 轴和 Y 轴的动画旋转

我想知道是否可以为 Google 地图标记沿 x 轴和 y 轴旋转设置动画就像我们如何使用 ObjectAnimator 围绕 x 轴和或 y 轴旋转 ImageView 一样显然人们可以顺时针旋转改变标记的方向即沿着 z 轴
如何为服务器启用 AVIF 支持

AVIF 图像格式看起来是一种非常有前途的格式如何在网络服务器上编译和使用它我的具体是 Ubuntu 18 04 Nginx 但我正在寻找如何编译和开始转换图像的要点 AVIF似乎是一种新格式并没有找到太多信息但是让我们立即看看调
单击切换下拉菜单

我正在尝试创建一个下拉菜单该菜单在单击而不是悬停时激活到目前为止我已经使用一点 JavaScript 进行了单击操作但是虽然子菜单显示得很好并且如果单击另一个菜单则其他子菜单会隐藏但如果单击其父菜单我无法弄清楚如何隐藏子菜单
方向改变时 UIScrollview 内容大小

我有一个带分页的滚动视图在 viewDidLoad 中我检查当前方向是否为横向然后将其内容大小的高度设置为 440 if UIDeviceOrientationIsPortrait UIDevice currentDevice ori
如何检查Android应用程序是在后台运行还是在前台运行？

例如我的项目中有这个代码 public class Utilities extends Application private static int stateCounter public void onCreate super onCre
即使没有任何错误，我的discord.js 机器人也不会回复用户消息[重复]

这个问题在这里已经有答案了我的discord js 机器人版本为13 1 0 我的节点版本为16 7 0 我在终端中输入了这些命令 npm init创造包 json and npm install discord js安装不和谐包我把代
R：apply() 与 for 循环的混淆

我知道我应该避免 for 循环但我不太确定如何使用 apply 函数来做我想做的事情这是我正在尝试做的事情的一个稍微简化的模型因此本质上我有一个很大的预测变量矩阵并且我想在索引预测变量的每一侧使用 5 个预测变量的窗口来运行回归
从 emacs 调用 vim 或 TextMate

我使用 vi 已经有一段时间了在 Mac 上我有时会使用 TextMate 最后我发现了 emacs 的伟大之处而且我很可能会选择 emacs 问题是我有时需要其他 vi TextMate 编辑器来做一些事情并不是说 emac
ASP.NET 成员资格错误

我正在使用 ASP NET MVC 我将 ASP NET 成员资格表插入到我的数据库中但收到下面写的错误也许有解决方案谢谢 System Web Security SqlMembershipProvider 需要与架构版本 1 兼容的
CUDA 中全局内存与常量内存的使用

嘿我有以下代码 if USE CONST 1 constant double PNT SIZE else device double PNT endif 稍后我有 if USE CONST 0 cudaMalloc void PNT si

CUDA 中全局内存与常量内存的使用

CUDA 中全局内存与常量内存的使用 的相关文章

随机推荐

热门标签

CUDA 中全局内存与常量内存的使用的相关文章