使用常量内存打印地址而不是cuda中的值

2024-04-04

我试图在代码中使用常量内存，并从内核分配常量内存值，而不是使用 cudacopytosymbol。

 #include <iostream>
    using namespace std;
    #define N 10
    //__constant__ int constBuf_d[N];
    __constant__ int *constBuf;

__global__ void foo( int *results )
{
    int tdx = threadIdx.x;
    int idx = blockIdx.x * blockDim.x + tdx;


    if( idx < N )
    {
        constBuf[idx]=1;
         results[idx] = constBuf[idx];
    }
}

// main routine that executes on the host
int main(int argc, char* argv[])
{
    int *results_h = new int[N];
    int *results_d;


    cudaMalloc((void **)&results_d, N*sizeof(int));

    foo <<< 1, 10 >>> ( results_d );

    cudaMemcpy(results_h, results_d, N*sizeof(int), cudaMemcpyDeviceToHost);

    for( int i=0; i < N; ++i )
        printf("%i ", results_h[i] );
        delete(results_h);
}

输出显示

6231808 6226116 0 0 0 0 0 0 0 0

我希望程序在代码中打印通过内核分配给常量内存的值。

顾名思义，常量内存对于设备代码来说是常量/只读的。您尝试做的事情是非法的，无法实现。

要在常量内存中设置值，当前有两种选择：

通过主机代码设置值cudaMemcpyToSymbolAPI 调用（或其等效项）
在编译时使用静态初始化

在后一种情况下，类似这样的事情会起作用：

__constant__ int constBuf[N] = { 16, 2, 77, 40, 12, 3, 5, 3, 6, 6 };

__global__ void foo( int *results )
{
    int tdx = threadIdx.x;
    int idx = blockIdx.x * blockDim.x + tdx;


    if( tdx < N )
    {
        results[idx] = constBuf[tdx]; // Note changes here!
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA

gpuconstantmemory

使用常量内存打印地址而不是cuda中的值的相关文章

Cuda 计算模式和“CUBLAS_STATUS_ALLOC_FAILED”

我的集群中有一台主机有 8 个Nvidia K80我想将其设置为每个设备最多可以运行 1 个进程以前如果我在主机上运行多个作业并且每个作业都使用大量内存它们都会尝试访问同一设备并失败我将所有设备设置为计算模式 3 E Proces
C 中带括号和不带括号的循环处理方式不同吗？

我在调试器中单步执行一些 C CUDA 代码如下所示 for uint i threadIdx x i lt 8379 i 256 sum d PartialHistograms blockIdx x i HISTOGRAM64 BIN
CUDA错误：在python中使用并行时初始化错误

我的代码使用 CUDA 但运行速度仍然很慢因此我将其更改为使用 python 中的多处理 pool map 并行运行但我有CUDA ERROR initialization error 这是函数 def step M self ite
Ubuntu 11.10/12.04 上的 CUDA“无兼容设备”错误

一段时间以来我一直在尝试在我的笔记本电脑上设置 Ubuntu 环境来进行 CUDA 编程我目前双启动 Windows 8 和 Ubuntu 12 04 并想在 Ubuntu 上安装 CUDA 5 该笔记本电脑配有 GeForce GT
是否可以在设备函数中调用cufft库调用？

我在主机代码中使用 cuFFT 库调用它们工作正常但我想从内核调用 cuFFT 库早期版本的 CUDA 没有这种支持但是有了动态并行性这可能吗如果有任何关于如何实现这一目标的示例那就太好了尽管在 Kepler cc 3 5
Golang调用CUDA库

我正在尝试从 Go 代码中调用 CUDA 函数我有以下三个文件 test h int test add void test cu global void add int a int b int c c a b int test add v
CUDA：如何在设备上填充动态大小的向量并将其内容返回到另一个设备函数？

我想知道哪种技术可以填充设备上的动态大小数组 int row 在下面的代码中然后返回其内容以供另一个设备函数使用为了将问题置于上下文中下面的代码尝试使用在 GPU 上运行的高斯勒让德求积来跨越勒让德多项式基组中的任意函数 incl
用于类型比较的 Boost 静态断言

以下问题给我编译器错误我不知道如何正确编写它 struct FalseType enum value false struct TrueType enum value true template
如何将CUDA时钟周期转换为毫秒？

我想用一些代码来测量时间within我的内核需要我已经关注了这个问题 https stackoverflow com questions 11209228 timing different sections in cuda kernel连
在 cuda 的 nvcc 编译器中使用 C++20

我正在尝试使用std countr zero 函数从
cuda 共享内存 - 结果不一致

我正在尝试并行缩减以对 CUDA 中的数组求和目前我传递一个数组来存储每个块中元素的总和这是我的代码 include
如何优化这个 CUDA 内核

我已经分析了我的模型似乎该内核约占我总运行时间的 2 3 我一直在寻找优化它的建议代码如下 global void calcFlux double concs double fluxes double dt int idx blockI
如何在 Visual Studio 2010 中设置 CUDA 编译器标志？

经过坚持不懈的得到error identifier atomicAdd is undefined 我找到了编译的解决方案 arch sm 20旗帜但是如何在 VS 2010 中传递这个编译器标志呢我已经尝试过如下Project gt P
如何确定完整的 CUDA 版本 + 颠覆版本？

Linux 上的 CUDA 发行版曾经有一个名为version txt例如 CUDA Version 10 2 89 这非常有用但是从 CUDA 11 1 开始该文件不再存在我如何在 Linux 上通过命令行确定并检查 path t
CUDA Visual Studio 2010 Express 构建错误

我正在尝试在 64 位 Windows 7 上使用 Visual Studio 2010 Express 在 Windows 上开始 CUDA 编程我花了一段时间来设置环境然后我刚刚编写了我的第一个程序 helloWorld cu 目前
Yocto for Nvidia Jetson 由于 GCC 7 而失败 - 无法计算目标文件的后缀

我正在尝试将 Yocto 与 meta tegra 一起使用 https github com madisongh meta tegra https github com madisongh meta tegra 为 Nvidia Jets
尝试构建我的 CUDA 程序时出现错误 MSB4062

当我尝试构建我的第一个 GPU 程序时出现以下错误有什么建议可能会出什么问题吗错误 1 错误 MSB4062 Nvda Build CudaTasks SanitizePaths 任务无法从程序集 C Program 加载文件 M
使用 CUDA 进行逐元素向量乘法

我已经在 CUDA 中构建了一个基本内核来执行逐元素两个复向量的向量向量乘法内核代码插入如下 multiplyElementwise 它工作正常但由于我注意到其他看似简单的操作如缩放向量在 CUBLAS 或 CULA 等库中进行了
有没有一种有效的方法来优化我的序列化代码？

这个问题缺乏细节因此我决定创建另一个问题而不是编辑这个问题新问题在这里我可以并行化我的代码吗还是不值得 https stackoverflow com questions 17937438 can i parallelize my
__device__ __constant__ 常量

有什么区别吗在 CUDA 程序中定义设备常量的最佳方法是什么在 C 主机设备程序中如果我想将常量定义在设备常量内存中我可以这样做 device constant float a 5 constant float a 5 问题 1

随机推荐

具有伴生对象的类与同名的类和对象有什么区别？

Scala 类的伴生对象可以被视为具有与该类相同的完全限定名称的单例对象即相同的名称在同一包中它们用于保存类的所有实例共有的实用函数作为 Java 的替代品static方法然而在文档和问题的不同地方它说伴生对象必须在同一编
如何检测同一键盘按键仅按下一次

我正在设计一个键盘类它只能检测一次键盘按键但我仍然不知道如何做到这一点我的目标是仅检查并在持续按下或保持按住同一键时仅执行一次操作并且当同时按下 2 个操作键时不执行任何操作例如当我持续按住 A 键时操作 1 只会执行一次然
OpenCv错误无法通过视频采集打开相机

我通过 opencv 使用相机重新启动后突然运行我的代码它显示以下错误 WARN 0 global io opencv modules videoio src cap v4l cpp 802 open VIDEOIO ERROR V4L
将参考 SVG 图像嵌入 HTML 文件

我有一个项目我想将简单的图形背景放入表格单元格中背景图像和一个小的 svg 文件效果很好但我真的很想将源代码全部保存在一个文件中也就是说我希望能够在 HEAD 中定义图像并在内联 STYLE css 中引用它我已经尝试了 sv
JAXBElement.getValue() 返回 null

我的 Pojo 类中有一对多映射一家店有一家分店一个分店有很多家店铺这是商店代码 XmlAccessorType XmlAccessType FIELD XmlRootElement name Shop public class Sh
(Chez) 用于隐藏 lambda 的方案宏

我想编写一个宏来创建速记语法来隐藏更详细的 lambda 表达式但我很难理解如何编写宏我意识到这是反对使用它们的一个论据给出这个例子 define alist example x 1 2 3 y 4 5 6 z 7 8 9 defin
带开始/暂停和重置按钮的倒计时器

我想在 React JS 中创建一个倒计时器其中包含开始暂停和重置按钮以便操作计时器作为 React 和 JS 的初学者开发人员我创建了一个状态变量 secondsElapsed 以便输入计时器的时间以秒为单位 star
CSS3 在 ios 上的过渡缓慢/不工作

我正在尝试在我正在制作的响应式网站上开始使用一些 CSS3 转换并且在桌面 Chrome 和 Android 上的 Chrome 上一切正常但在 Chrome 和 Safari 的 iOS 设备上无法正常工作例如我用于菜单的 CSS
在 SwiftUI TabView 中禁用滑动手势

试图实施一个TabView with PageTabView风格SwiftUI 其中导航仅以编程方式完成并且所有滑动手势均被禁用这个解决方案 https stackoverflow com questions 63168014 swif
带背景颜色的盒装标签

如何绘制boxed label具有特定的background颜色如图例框你的意思是这样的吗 LABEL label in a box set obj 10 rect at 0 0 size char strlen LABEL char
获得无重力加速度

我是安卓开发新手我想获得手机的实际加速度我找到了一个获得加速度的代码但它给出了重力加速度请任何人帮助我找到一种在没有重力的情况下获得实际加速度的方法这是我找到的代码请帮我解决这个代码谢谢 package com SensorT
为什么我必须使用 watir-webdriver 和 firefox 来睡觉或等待？

好吧我想对 watir webdriver wait for page load gt 这个主题发表评论但由于我有 1 个代表所以我不能我正在将 watir 脚本升级到 watir webdriver 我在 Firefox 上运行的
如何在浏览器中编辑pdf并将其保存到服务器

以下是要求用户需要能够在浏览器中查看上传的 PDF 他们需要能够向 PDF 添加注释并将更新的 PDF 保存到服务器而无需将其保存到自己的计算机并在浏览器外部打开它欢迎任何关于如何实现这一目标的想法顺便说一下我正在使用一个 asp
错误：静态断言失败：std::thread 参数在转换为右值后必须可调用

我正在尝试向 std thread 添加 std function 我偶然发现了这个错误 error static assertion failed std thread arguments must be invocable after
与 XML 模式结合使用的表示法名称

我正在寻找这种风格的名称文字包含大括号中的完整命名空间 URI 后跟标识符名称 http www w3 org 2001 XMLSchema dateTime 这是 James Clark 提出的一种非常常用的表示法例如这就是 JAX
如何在 Visual Studio 2012 中禁用 F12 调试应用程序

如果我在应用程序在 Visual Studio 下以调试模式运行时按 F12 则 WM KEYDOWN 永远不会到达我的事件循环但它会立即触发断点是否可以禁用此功能或将其重新分配给另一个冲突较少的热键例如 CTRL F12 我认为这
使用动态规划解决背包问题的一个版本

我正在 OpenCourseWare 上完成 MIT6 0002 https ocw mit edu courses electrical engineering and computer science 6 0002 introducti
iphone/ipad dev - 如何以编程方式启动系统设置应用程序

在设置 gt 常规中有一个开关可以打开关闭定位服务在地图应用中当定位服务关闭时如果用户单击查找我按钮则会弹出警报并要求用户在设置中打开定位服务然后退出应用程序并启动设置应用程序我如何在我的应用程序中以编程方式执行此操作从
地图函数未在React jsx中呈现

我是 React 新手尝试使用 jsx 内的映射函数来渲染数组然而循环内没有任何内容被渲染我将数据传递给我的子组件如下所示 showMaterialConfirmModal
使用常量内存打印地址而不是cuda中的值

我试图在代码中使用常量内存并从内核分配常量内存值而不是使用 cudacopytosymbol include

使用常量内存打印地址而不是cuda中的值

使用常量内存打印地址而不是cuda中的值 的相关文章

随机推荐

热门标签

使用常量内存打印地址而不是cuda中的值的相关文章