c++/cuda并行累计求和

2023-11-19

文章目录

代码
CMakeLists.txt
结果

代码

#include<cuda_runtime.h>
#include<device_launch_parameters.h>
//#include<helper_cuda.h>
#include<cstdio>

__global__ void kernel(int* arr, int* sumv, const int size){
    for(int index=blockDim.x*blockIdx.x+threadIdx.x;
    index<size; index+=blockDim.x*gridDim.x)
    {
        arr[index] = index+1;
        atomicAdd(sumv,arr[index]);
    }
}

int main()
{
    int size = 5;
    int* arr = new int[size];
    int* sumv = new int;

    int* arrCuda;
    int* sumvCuda;
    cudaMalloc((void**)&arrCuda,size*sizeof(int));
    cudaMalloc((void**)&sumvCuda,1*sizeof(int));

    cudaMemcpy(arrCuda,arr,size*sizeof(int),cudaMemcpyHostToDevice);
    cudaMemcpy(sumvCuda,sumv,1*sizeof(int),cudaMemcpyHostToDevice);
    
    kernel<<<32,128>>>(arrCuda,sumvCuda,size);
    cudaDeviceSynchronize();

    cudaMemcpy(arr,arrCuda,size*sizeof(int),cudaMemcpyDeviceToHost);
    cudaMemcpy(sumv,sumvCuda,1*sizeof(int),cudaMemcpyDeviceToHost);

    for(int i=0;i<size;++i){
        printf("arr[%d]=%d\n",i, arr[i]);
    }
    printf("%d\n",*sumv);

    cudaFree(sumvCuda);
    cudaFree(arrCuda);
    delete sumv;
    delete[] arr;
    return 0;
}

CMakeLists.txt

CMAKE_MINIMUM_REQUIRED(VERSION 3.16)
PROJECT(MyProject LANGUAGES CUDA CXX)

include(CheckLanguage)
check_language(CUDA)

add_executable(out main.cu ${SRC})

结果

在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

cuda编程学习

c

算法

开发语言

c++/cuda并行累计求和的相关文章

clang 格式换行符在错误的位置

给出以下代码行 get abc manager get platform status abc platform status sw update status fill update status actions allowed stat
如何使用 zlib 制作 .zip 文件

我正在阅读zlib的文档它相当详细但我读到了这一行输出数据将位于zlib格式与 gzip 或zip formats http www zlib net zlib how html http www zlib net zlib how
分段错误（核心转储）错误

我的程序编译罚款但在输入文件时出现分段错误核心转储错误我没有正确处理 ostream 吗 include
从多线程程序中调用 system()

我们正在开发一个用 C 编写的多线程内存消耗应用程序我们必须执行大量的 shellscript linux 命令并获取返回码读完之后article http www linuxprogrammingblog com threads a
System.IO.IOException：由于意外>数据包格式，握手失败？

有谁知道这意味着什么 System Net WebException 底层连接已关闭发送时发生意外错误 gt System IO IOException 由于意外握手失败数据包格式在 System Net Security SslS
ASP.NET Core 与现有的 IoC 容器和环境？

我想运行ASP NET 核心网络堆栈以及MVC在已托管现有应用程序的 Windows 服务环境中以便为其提供前端该应用程序使用 Autofac 来处理 DI 问题这很好因为它已经有一个扩展Microsoft Extensions D
为什么Apache MPM prefork.c 使用互斥体来保护accept()？

我坐下来读书Apache 的 MPM prefork c http code metager de source xref apache httpd server mpm prefork prefork c这段代码使用了一个名为accept
CultureInfo 的实例（来自相同的文化）根据操作系统而变化

我有一个网站上面写着这样的日期 CultureInfo cultureInfo CultureInfo GetCultures CultureTypes AllCultures FirstOrDefault c gt string Equ
在 C# Winforms 应用程序中嵌入 Windows XP 主题

我有一个旧版 C Windows 窗体应用程序其布局是根据 Windows XP 默认主题设计的由于需要将其作为 Citrix 应用程序进行分发该应用程序现在看起来像经典主题应用程序因为 Citrix 不鼓励使用主题系统服务所以
将字符串转换为正确的 URI 格式？

有没有简单的方法可以将电子邮件地址字符串转换为正确的 URI 格式 Input http mywebsite com validate email 3DE4ED727750215D957F8A1E4B117C38E7250C33 email
C# 委托责任链

为了我的理解目的我实现了责任链模式 Abstract Base Type public abstract class CustomerServiceDesk protected CustomerServiceDesk nextHandle
使用 WF 的多线程应用程序的错误处理模式？

我正在写一个又长又详细的问题但只是放弃了它转而选择一个更简单的问题但我在这里找不到答案应用程序简要说明我有一个 WPF 应用程序它生成多个线程每个线程执行自己的 WF 处理线程和 WF 中的错误允许用户从 GUI 端进行交互
默认析构函数做了多少事情

C 类中的默认析构函数是否会自动删除代码中未显式分配的成员例如 class C public C int arr 100 int main void C myC new C delete myC return 0 删除 myC 会自动释放
.NET 客户端中 Google 表格中的条件格式请求

我知道如何在 Google Sheets API 中对值和其他格式进行批量电子表格更新请求但条件格式似乎有所不同我已正确设置请求 AddConditionalFormatRuleRequest formatRequest new Add
使用 mingw32 在 Windows 上构建 glew 时“DllMainCRTStartup@12”的多个定义

我关注了这个主题使用 mingw 使建筑物在 Windows 上闪闪发光 https stackoverflow com questions 6005076 building glew on windows with mingw 6005
0-1背包算法

以下 0 1 背包问题是否可解浮动正值和浮动权重可以是正数或负数背包的浮动容量 gt 0 我平均有这是一个相对简单的二进制程序我建议用蛮力进行修剪如果任何时候你超过了允许的重量你不需要尝试其他物品的组合你可以丢弃整
C 中带有指针的结构的内存开销[重复]

这个问题在这里已经有答案了我意识到当我的结构包含指针时它们会产生内存开销这里有一个例子 typedef struct int num1 int num2 myStruct1 typedef struct int p int num2
如何引用解决方案之外的项目？

我有一个 Visual Studio C 解决方案其中包含一些项目其中一个项目需要引用另一个不属于解决方案的项目一开始我引用了dll
C语言声明数组没有初始大小

编写一个程序来操纵温度详细信息如下所示输入要计算的天数主功能输入摄氏度温度输入功能将温度从摄氏度转换为华氏度独立功能查找华氏度的平均温度我怎样才能在没有数组初始大小的情况下制作这个程序 include
受限 AppDomain 中的代码访问安全异常

Goal 我需要在权限非常有限的 AppDomain 中运行一些代码它不应该访问任何花哨或不安全的内容 except对于我在其他地方定义的一些辅助方法我做了什么我正在创建一个具有所需基本权限的沙箱 AppDomain 并创建一个运行代

随机推荐

电脑上有哪些好用的视频剪辑软件

http www 360doc com content 18 0712 08 55889173 769741943 shtml 可以说现在视频正日益成为营销和社交媒体的一个组成部分这就是为什么会有视频编辑越来越火的原因这已随着视频在当
matlab 从点云中移除隐藏点

目录一功能概述 1 算法概述 2 主要函数二代码实现三结果展示四参考链接一功能概述 1 算法概述该函数使用如下步骤从指定的视点确定点云中的可见点 1 将点云与中心位于视点的坐标系相关联 2 使用球形投影进行反演创建一
nginx配置vue(history模式)

问题的原因项目本来使用 hash 的路由模式来部署因为需求关系现在要改成 history 的模式来部署了路径上不要有号第一步修改项目的 router index js 的配置 const router new VueRoute
modbus总线协议（一）modbus rtu

一介绍 Modbus协议由Modicon公司开发出来现在Modbus是工业领域全球最流行的协议硬件支持RS 232 RS 422 RS 485和以太网设备应用在PLC DCS 智能仪表等工控领域图片来源于网络二 modbus协议
template 的使用

插件介绍 template 是一个高性能的JavaScript模板引擎插件特性 1 性能卓越执行速度快 mustache 与 tmpl 的20多倍 2 支持运行时调试可精准定位异常模板所在语句 3 对 NodeJS Express 有
Java NIO Files类读取文件流方式详解

Java NIO Files类读取文件流方式详解 Files类原理概述 java nio file Files是Java标准库提供的一个工具类用于操作文件和目录它提供了一系列静态方法可以用于创建复制删除移动重命名读取写入文
Kaggle研究16,000+数据科学从业者并公开数据 !（附数据集下载）

来源机器之心本文长度为2540字建议阅读5分钟本文整理Kaggle对人工智能领域超过16 000受调查者的调查数据结果 Kaggle 是互联网上最著名的数据科学竞赛平台之一今年3月8日这家机构被谷歌收购 6月6日又宣布用户数量超
二进制.bin文件切分、bintopng、write

import numpy as np import cv2 import os Your file path file dep open r E data 3DHuman Detection withoutlabel 20180715 50
小白入门机器学习深度学习实战教程

课程介绍机器学习深度学习实战训练营开课了哔哩哔哩 bilibili 机器学习深度学习实战训练营开课了
Leetcode——350. 两个数组的交集 II

题目给你两个整数数组 nums1 和 nums2 请你以数组形式返回两数组的交集返回结果中每个元素出现的次数应与元素在两个数组中都出现的次数一致如果出现次数不一致则考虑取较小值可以不考虑输出结果的顺序输入 nums1 1 2
关于gitee的用法

一安装git 安装git git version 查看版本创建仓库 git 全局配置 git config global user name huangkaihk git config global user email 邮箱 git
2.6.1 ADSL技术

ADSL技术即非对称数字用户线技术利用数字技术对现有的模拟电话用户线进行改造使其能够承载宽带数字业务标准模拟电话信号的频带被限制在 300 3400 Hz 的范围内无法承载宽带数字业务但用户线本身可通过的信
超详细！4小时开发一个SpringBoot+vue前后端分离博客项目！！

小Hub领读前后端分离的博客项目终于出来啦真是花了好多心思录制咧文末直接进入B站看视频哈这次你找不到不关注我B站的理由了吧作者吕一明项目代码 https github com MarkerHub vueblog 项目视频 ht
Unity卡死情况

今天遇到了Unity点击播放后卡死用任务管理器强行关闭后重开打不开项目的情况解决方案检查USB接口设备有些设备可能会影响Unity工程启动比如VR头盔
使用java代码给Excel加水印，代码全，进阶版

以下代码亲测可以跑通 1 上一篇博客用了Apache POI库3 8的版本的形式对Excel加了水印但是最近主线版本用了4 1 2的形式由于为了保持版本的兼容性下面有开发了Apache POI的4 1 2的版本号的方案 pom文件为
使用selenium IDE开始简易自动化测试

使用selenium IDE开始简易自动化测试火狐浏览器有个很好用的selenium插件可以自动录制页面动作 selenium IDE 下载地址下载安装好笔者下载的2 9 0 我们以在百度搜索selenium为例首先启动IDE 点
链式二叉树的基本操作(C语言实现)

目录一链式二叉树的创建 1 1 定义节点结构 1 2 节点的创建 1 3 节点的链接二树的深度遍历 1 前序中序后序遍历 1 2 三种方式的遍历顺序图 2 代码实现 3 遍历检测三树的层序遍历 3 1 层序遍历 3 2 完全
Loadrunner录制登录，验证是否登录成功的几种方法

1 利用web reg find 优先使用 2 利用web image check 其次 3 利用web get int property函数 4 利用提交的status状态 5 利用对数据的操作查看是否登录 1 利用添加检查点web re
拼多多招收java开发的三轮面试题，你能撑到第几轮？

我相信面试一直是大家关注的问题包括最近有很多刚毕业或者刚实习的小伙伴跟我讲投了很多简历出去但却都像泥牛入海一样了无音讯了确实出于程序员的直觉今年着实是要比往年要更冷一些对于面试来说我相信大家都听过一个说法就是金九银十但是现
c++/cuda并行累计求和

文章目录代码 CMakeLists txt 结果代码 include

c++/cuda并行累计求和

文章目录

代码

CMakeLists.txt

结果

c++/cuda并行累计求和 的相关文章

随机推荐

热门标签

c++/cuda并行累计求和的相关文章