CUDA 内核调用中的隐式构造函数

2023-12-08

我正在尝试将一些 POD 传递给内核，该内核具有一些非 POD 作为参数，并且具有非显式构造函数。其背后的想法是：在主机上分配一些内存，将内存传递给内核，并将内存封装在对象中，而无需用户显式执行该步骤。

构造函数被标记为 __device__ 代码，但传递参数时不会调用它们，我不明白为什么。

我的问题实际上与我应该如何做这件事无关，而是试图了解幕后发生的事情。

这是一个示例（我使用的是 CUDA 5，GPU 的性能为 2.1，因此使用 printf）。

#include <stdio.h>

struct Test {
    __device__ Test() {
        printf("Default\n"),
        _n = 0;
    }
    __device__ Test(int n) {
        printf("Construct %d\n", n);
        _n = n;
    }
    __device__ Test(const Test &t) {
        printf("Copy constr %d\n", t._n);
        _n = t._n;
    }
    __device__ Test &operator=(const Test &t) {
        printf("Assignment %d\n", t._n);
        _n = t._n;
        return *this;
    }
    __device__ int calc() const {
        printf("Calculating %d\n", threadIdx.x + 10 * _n);
        return threadIdx.x + 10 * _n;
    }
    int _n;
};

__global__ void dosome(Test a, Test b) {
    printf("Kernel data %d %d\n", a._n, b._n);
    a.calc();
    b.calc();
}

int main(int argc, char **argv) {
    dosome<<<1, 2>>>(2, 3);
    cudaError_t cudaerr = cudaDeviceSynchronize();
    if (cudaerr != cudaSuccess)
        printf("kernel launch failed with error:\n\t%s\n",cudaGetErrorString(cudaerr));
    return 0;
}

编辑：忘了说，没有打印任何构造函数消息，但打印了 calc 和内核消息。

EDIT2：是否保证 CUDA 将初始化一个测试对象before将其复制到设备上？

您必须像普通方法一样看到构造函数。如果你用它来限定它__host__，那么您就可以将其称为主机端。如果你用它来限定它__device__，您可以将其称为设备端。如果你用两者来限定它，你就可以在两边调用它。

当你这样做时会发生什么dosome<<<1, 2>>>(2, 3);是这两个对象是隐式构造的（因为你的构造函数不是explicit，所以也许这也让你感到困惑）主机端然后memcpy到设备。该过程中不涉及复制构造函数。

让我们来说明一下：

    __global__ void dosome(Test a, Test b) {
        a.calc();
        b.calc();
    }

    int main(int argc, char **argv) {
        dosome<<<1, 2>>>(2, 3); // Constructors must be at least __host__
        return 0;
    }

// Outputs:
Construct 2 (from the host side)
Construct 3 (from the host side)

现在如果你改变你的内核ints 而不是Test:

__global__ void dosome(int arga, int argb) {
    // Constructors must be at least __device__
    Test a(arga);
    Test b(argb);
    a.calc();
    b.calc();
}

int main(int argc, char **argv) {
    dosome<<<1, 2>>>(2, 3);
    return 0;
}

// Outputs:
Construct 2 (from the device side)
Construct 3 (from the device side)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

CUDA

CUDA 内核调用中的隐式构造函数的相关文章

UTF8/UTF16 和 Base64 在编码方面有什么区别

In c 我们可以使用下面的类来进行编码 System Text Encoding UTF8 System Text Encoding UTF16 System Text Encoding ASCII 为什么没有System Text En
SSH 主机密钥指纹与模式 C# WinSCP 不匹配

我尝试通过 WinSCP 使用 C 连接到 FTPS 服务器但收到此错误 SSH 主机密钥指纹与模式不匹配经过大量研究我相信这与密钥的长度有关当使用服务器和协议信息下的界面进行连接时我从 WinSCP 获得的密钥是xx xx
写入和读取文本文件 - C# Windows 通用平台应用程序 Windows 10

有用但在显示任何内容之前您必须在文本框中输入内容我想那是因为我使用了 TextChanged 事件处理程序如果我希望它在没有用户交互的情况下显示文本文件的内容我应该使用哪个事件处理程序因此我想在按下按钮时将一些数据写入 C W
C# 用数组封送结构体

假设我有一个类似于 public struct MyStruct public float a 我想用一些自定义数组大小实例化一个这样的结构在本例中假设为 2 然后我将其封送到字节数组中 MyStruct s new MyStruct s
HttpClient 像浏览器一样请求

当我通过 HttpClient 类调用网站 www livescore com 时我总是收到错误 500 可能服务器阻止了来自 HttpClient 的请求 1 还有其他方法可以从网页获取html吗 2 如何设置标题来获取html内容当
A* 之间的差异 pA = 新 A;和 A* pA = 新 A();

在 C 中以下两个动态对象创建之间的确切区别是什么 A pA new A A pA new A 我做了一些测试但似乎在这两种情况下都调用了默认构造函数并且仅调用了它我正在寻找性能方面的任何差异 Thanks If A是 POD 类
如何在 Team Foundation 上强制发表有意义的签入评论？

我有一个开发团队有一个坏习惯他们写道poor签入评论当我们必须在团队基础上查看文件的历史记录时这使得它成为一场噩梦我已经启用了变更集评论政策这样他们甚至可以在签到时留下评论否则他们不会我们就团队的工作质量进行了一些讨论他们很
线程、进程和 Application.Exit()

我的应用程序由主消息循环 GUI 和线程 Task Factory 组成在线程中我调用一些第三方应用程序var p new Process 但是当我调用Application Exit 在消息循环中我可以看到在线程中启动的进程仍在内存中
初始化变量的不同方式

在 C 中初始化变量有多种方法 int z 3 与 int 相同z 3 Is int z z 3 same as int z z 3 您可以使用 int z z 3 Or just int z 3 Or int z 3 Or int z i
Windows 10 中 Qt 桌面应用程序的缩放不当

我正在为 Windows 10 编写一个简单的 Qt Widgets Gui 应用程序我使用的是 Qt 5 6 0 beta 版本我遇到的问题是它根本无法缩放到我的 Surfacebook 的屏幕上这有点难以判断因为 SO 缩放了图
像“1$”这样的位置参数如何与 printf() 一起使用？

By man I find printf d width num and printf 2 1 d width num 是等价的但在我看来第二种风格应该与以下相同 printf d num width 然而通过测试似乎man是对的为什
用 C 实现 Unix shell：检查文件是否可执行

我正在努力用 C 语言实现 Unix shell 目前正在处理相对路径的问题特别是在输入命令时现在我每次都必须输入可执行文件的完整路径而我宁愿简单地输入 ls 或 cat 我已经设法获取 PATH 环境变量我的想法是在字符处拆分
C 中的位移位

如果与有符号整数对应的位模式右移则 1 vacant bit will be filled by the sign bit 2 vacant bit will be filled by 0 3 The outcome is impleme
检查 url 是否指向文件或页面

我们需要以下内容如果文件确实是文件则从 URL 下载该文件否则如果它是一个页面则什么也不做举个简单的例子我有以下命令来下载文件 My Computer Network DownloadFile http www wired c
将应用程序从 Microsoft Access 迁移到 VB 或 C#.NET

我目前正试图说服管理层需要将我们的应用程序之一移植到 NET 该应用程序已经发展成为 Access 中的一个庞然大物 SQL 后端拥有 700 个链接表 650 个表单子表单 130 个模块和 850 个查询我几乎知道这样做的所有主要
已过时 - OpenCV 的错误模式

我正在使用 OpenCV 1 进行一些图像处理并且对 cvSetErrMode 函数它是 CxCore 的一部分感到困惑 OpenCV 具有三种错误模式叶调用错误处理程序后程序终止 Parent 程序没有终止但错误处理程序被调
ListDictionary 类是否有通用替代方案？

我正在查看一些示例代码其中他们使用了ListDictionary对象来存储少量数据大约 5 10 个对象左右但这个数字可能会随着时间的推移而改变我使用此类的唯一问题是与我所做的其他所有事情不同它不是通用的这意味着如果我在这里
在Linux中使用C/C++获取机器序列号和CPU ID

在Linux系统中如何获取机器序列号和CPU ID 示例代码受到高度赞赏 Here http lxr linux no linux v2 6 39 arch x86 include asm processor h L173Linux 内核似
如何在 C# 中播放在线资源中的 .mp3 文件？

我的问题与此非常相似question https stackoverflow com questions 7556672 mp3 play from stream on c sharp 我有音乐网址网址如http site com aud
如何连接字符串和常量字符？

我需要将 hello world 放入c中我怎样才能做到这一点 string a hello const char b world const char C string a hello const char b world a b co

随机推荐

Angular 2 Aot 错误：致命错误：CALL_AND_RETRY_LAST 分配失败 - JavaScript 堆内存不足

在运行 Angular 2 AOT rollup 时我遇到了上述问题 lt Last few GCs gt 144518 ms Mark sweep 1317 0 1404 4 gt 1317 0 1404 4 MB 1522 9 0 0
如何让一个进程等待多个资源？

我目前正在使用 SimPy 来建模和模拟服务器进程我希望该进程根据从何处接收此消息来执行不同的操作 SimPy 文档展示了如何等待多个事件例如 yield event1 事件2 不过我目前正在尝试等待多个商店提供资源场景如下服务器
将测试结果添加到 VSTS 中的测试运行（测试用例）

我需要将测试结果添加到 VSTS 中的测试用例中我是 VSTS 新手不确定我的代码出了什么问题 var ur new Uri https myaccount visualstudio com VssCredentials cr new
Vaadin 7 在组件之间触发自定义事件

我想创建自定义事件并在视图的某些部分触发它们以便更新删除刷新视图的其他部分我尝试过扩展 Component Event 和 Component Listener 但它不起作用我认为事件和侦听器必须仅限于同一组件实例 Vaadin
Cython 条件编译基于通过“setuptools”给出的外部值

我尝试从 Cython pyx 文件有条件地生成 C 代码我在 Cython 文档中找到了我可以使用的DEF定义一个值和IF根据定义的值有条件地生成代码但是如何从setup py via Extension from setuptool
如何从离子应用程序中删除闪屏

直接启动应用程序不会出现闪屏和白屏我正在开发一个离子应用程序我需要在加载应用程序之前删除应用程序启动时显示的启动屏幕我不想要任何闪屏需要删除完整的闪屏不知道该怎么做让我展示一下我的应用程序的机器设置 Your system in
Breeze.Server.WebAPI2“无法满足包依赖性约束”

我正在尝试添加Breeze Server WebAPI2Nuget 包到 Visual Studio Community 2015 RC 当我单击安装时我收到无法满足包依赖性约束列出的依赖项是 Microsoft AspNet Web
重启Android Studio

如何重启Android Studio来克服Gradle项目刷新失败错误无法在以下位置找到哈希字符串 Google Inc Google APIs 23 的目标 C Users Admin AppData Local Android sdk
html表格的浮动水平滚动条

我有一个非常高的 html 表格网页必须垂直滚动才能到达表格底部的滚动条当用户滚动页面并且表格可见时如果我可以将表格的水平滚动条浮动在浏览器窗口底部那就太好了这样的事可以做吗这是 jsFiddle 的情况示例 http jsfi
缩短/避免 if 语句中级联空检查的方法

我有这个条件 if Model Bids null Model Bids Items null Model Bids Items Count gt 0 问题是我认为这很丑陋我可以编写一个封装此函数的函数但我想知道是否还有其他东西可以帮
如何使用 Google Apps 脚本从 Google 电子表格单元格获取 url？

我有一个从 Excel 复制的谷歌电子表格我对此有一些问题这是我的文件https docs google com spreadsheets d 1Ok phu5OXtvKHLj3MLa7N3WV2qBdMWRz8dLHnTqjHrc e
Crystal Reports 图像在 Web 查看器中不可见

我在继承的应用程序 NET 1 1 中有一些 Crystal Reports V10 该应用程序部署在四个相同环境中在其中三种环境中它们运行良好在第四种情况下图表图形在 Web 查看器中不可见如果导出报告它们是可见的 IT
验证日期时间选择器的输入

如何在 XML 视图中为 datetimepicker 注册验证错误回调以及如何因无效日期输入而触发此事件 The 日期时间选择器控件是一个带有弹出日期选择器的输入框用户可以直接在输入中键入或使用所选日期来选择日期我可以向日期时间值添
“Microsoft.ACE.OLEDB.12.0”64x Sql Server 和 86x Office？

错误 OLE DB 提供程序 Microsoft ACE OLEDB 12 0 不能用于分布式查询因为该提供程序配置为在单线程单元模式下运行我看到的答案是 64 位 Sql Server 和 32 位 Office 之间存在冲突有没有
如何在android中将单个字符串转换为JsonArray？

我需要将 String 转换为 JsonArray 但我不知道如何转换我是 Android 开发新手我想在 MySQL 数据库中插入通话记录详细信息所以从 android 端我得到一个字符串但我不知道如何将该字符串转换为 Json
如何旋转这个 openGl 代码

在这段代码中我尝试绘制简单的奥林匹克环并旋转它下面的工作正常但我无法旋转环帮助我解决这个问题 void myReshape int width int height glViewport 0 0 width height glMat
什么是抑制异常？

一条评论由用户soc on an answer to 关于尾调用优化的一个问题提到Java 7有一个新功能叫做抑制异常因为 ARM的加入支持ARM CPU 在这种情况下什么是受抑制的异常在其他情况下抑制的异常是捕获然后忽略
致命错误：未捕获错误：调用未定义的函数 mysql_pconnect()

我在 Codeigniter 中遇到这些错误 Fatal error Uncaught Error Call to undefined function mysql pconnect in C xampp1 htdocs CI system
xtsible 对象，在 quantmod 中循环

我想循环遍历股票代码列表并使用以下命令打印它们chartSeries 这比总是改变论点要容易得多不幸的是当我想要循环或子集时我总是会收到错误 Error in try xts x error chartSeries requires
CUDA 内核调用中的隐式构造函数

我正在尝试将一些 POD 传递给内核该内核具有一些非 POD 作为参数并且具有非显式构造函数其背后的想法是在主机上分配一些内存将内存传递给内核并将内存封装在对象中而无需用户显式执行该步骤构造函数被标记为 device 代码

CUDA 内核调用中的隐式构造函数

CUDA 内核调用中的隐式构造函数 的相关文章

随机推荐

热门标签

CUDA 内核调用中的隐式构造函数的相关文章