为 CUDA 实现 32 位 memset 的“正确”方法是什么?

2023-12-06

CUDA有API调用

cudaError_t cudaMemset (void *devPtr, int value, size_t count)

它用单字节值填充缓冲区。我想用多字节值填充它。假设,为了简单起见,我想填充devPtr具有 32 位(4 字节)值,并假设我们可以忽略字节序。现在,CUDA 驱动程序具有以下 API 调用:

CUresult cuMemsetD32(CUdeviceptr dstDevice, unsigned int ui, size_t N)

那么我只需:获得CUdeviceptr从设备内存空间指针,然后进行驱动程序 API 调用?或者还有什么我需要做的吗?


从 CUDA 3.0 开始,运行时 API 设备指针(以及其他所有内容)都可以与驱动程序 API 进行互操作。所以是的,你可以使用cuMemsetD32用 32 位值填充运行时 API 分配。的大小CUdeviceptr将匹配的大小void *在您的平台上,可以安全地将指针从 CUDA API 转换为CUdeviceptr or 反之亦然.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

为 CUDA 实现 32 位 memset 的“正确”方法是什么? 的相关文章

随机推荐

  • “魔方”算法

    作为一个实验 我试图创建一个幻方程序 检查每个可能的包含九个数字的方格 对于那些不知道的人来说 幻方是由数字 1 9 组成的 3x3 网格 其中每行 每列和对角线的总和为 15 例如 我该如何使用 Lua 表格来检查每个方块 我从下表开始
  • Word命令行参数空间问题

    我想将参数传递给 winword 以便使用 Environment GetCommandLineArgs 在我的 vsto 插件中读取它 如果参数值包含空格 我无法转义字符串 这是工作 winword exe myVar1 C folder
  • 如何结合zend框架和Codeigniter?

    如何结合zend框架和Codeigniter 我有两个应用程序 一个是 zend 另一个是 codeigniter 是否可以将这两个框架合并到一个项目中 如果是这样 如何结合这两个框架以及其文件结构是什么 感谢您的帮助 当然有可能 我曾参与
  • $ 未在 JavaScript 中定义

    Firebug 报告称 未定义 中断此错误 function 我有一个简单的 index php 页面 它执行 php include 来包含我需要的内容 内容如下
  • 列表适配器中的回调方法不起作用

    我使用了上一个问题中指导使用的回调方法 这似乎不起作用 未调用 onClick 方法 回调方法似乎是一个非常广泛的概念 我不知道如何缩小搜索范围以获得相关信息 或者如何找到我得到的代码有什么问题 列表活动 适配器已初始化 并在此处设置点击侦
  • 如何识别脚本是否在tty上运行?

    我希望我的脚本在交互式 shell 会话中以及使用重定向的 stdout 运行时 例如 通过管道传输到其他命令时 以不同的方式运行 我如何识别 Python 脚本中发生这两者中的哪一个 现有程序中此类行为的示例 grep color aut
  • 在jQuery中,如何将多个delay()方法与css()一起使用?

    我怎样才能实现以下目标 了解如果我只能使用一次延迟setTimeout this css delay css delay css EDIT The CSS values altered are non numerical jQuery de
  • QT:QSqlDatabase:未加载 QMYSQL 驱动程序 [WINDOWS]

    萨拉姆 阿莱库姆 大家好 我正在尝试创建一个 QT 界面来连接到 MYSQL 数据库 但它总是给出一个错误 QSqlDatabase QMYSQL driver not loaded QSqlDatabase available drive
  • 反转数字中的数字

    我想在 python 中反转数字中的数字 这是我的两个实现 One 将数字转换为字符串并反转其中的每个字符 number 2376674032 number s str number index len number s 1 str lis
  • 使用 karma+jasmine 测试订阅角度 2 中的位置 (this.location.subscribe)

    我正在订阅角度定位服务在我的组件中 this location subscribe ev PopStateEvent gt this lastPoppedUrl ev url 我希望能够将它与我的组件的其余部分一起测试 现在我的 compo
  • hive中多行JSON文件查询

    我明白那个多数的JSON SerDe 格式期望 json文件以每行一条记录的方式存储 我有一个带有多行缩进的 S3 存储桶 json我想使用 Amazon Athena 查询的文件 不控制源 尽管我认为这通常也适用于 Hive 是否有 Se
  • android 中总是 FileNotFoundException 权限被拒绝

    为什么我总是收到此错误 FileNotFoundException Permission Denied 代码运行顺利 但是当我单击要下载的文件时 它不会被下载 请帮我 我对此很陌生 这是我的日志猫 03 28 09 19 34 695 E
  • 如何在 jQuery Mobile 中更改页面? [复制]

    这个问题在这里已经有答案了 我的代码是这样的 div div div div class ui content div div
  • 将嵌套 FOR 循环转换为 PARFOR 循环 matlab

    我有这些嵌套的 for 循环 我想将它们转换为 parfor row 1 for i 5 0 2 5 4 col 1 for j 2 0 5 2 5 matrx row col i j col col 1 end row row 1 end
  • 如何使用 Java 读取 AWS S3 文件?

    我尝试将文件从 AWS S3 读取到我的 java 代码中 File file new File s3n mybucket myfile txt FileInputStream fileInput new FileInputStream f
  • 打字稿表单重置()不起作用

    我正在使用打字稿重置表单 但它不起作用或打字稿编译器 1 0 3 版本 无法识别重置 函数 编译器给出错误 Build Interface HTMLFormElement incorrectly extends interface HTML
  • X11 在 Mac OSX 10.11.6 上的 XCode 中使用 CImg 标头时出现问题

    我将 X11 添加到我的标头搜索路径 库搜索路径中 并且在 XCode 的构建设置和构建阶段中将二进制文件链接到 X11 库 但是我仍然收到下图所示的错误 我 99 999 确定问题是 X11 因为当我禁用显示功能时 警告不存在 关于我下一
  • 使用 selenium(webdriver) 的 Python 程序不能作为单个且无控制台的 exe 文件运行 (pyinstaller)

    以下是我的Python代码 t py from tkinter import messagebox from tkinter import from selenium import webdriver def clicked iedrive
  • System V amd64 如何处理很长的返回值?

    我正在简要研究 amd64 x86 64 架构的 System V ABI 并且很好奇它如何处理超过 128 位的返回值 其中rax and rdx还不够 我在 Ubuntu 18 04 64 位 更一般地说 任何 amd64 POSIX
  • 为 CUDA 实现 32 位 memset 的“正确”方法是什么?

    CUDA有API调用 cudaError t cudaMemset void devPtr int value size t count 它用单字节值填充缓冲区 我想用多字节值填充它 假设 为了简单起见 我想填充devPtr具有 32 位