加速Cuda程序

2024-04-30

要更改哪一部分来加速此代码？代码到底在做什么？

__global_ void mat(Matrix a, Matrix b) 
{
   int[] tempData = new int[2];
   tempData[0] = threadIdx.x ;
   tempData[1] = blockIdx.x * blockDim;
   b.elements[tempData[1] + tempData[0]] = b.elements[tempData[1] + tempData[0]] * 5;
}

如果这就是所有有问题的代码，那么这就是愚蠢的：

int[] tempData = new int[2];
tempData[0] = threadIdx.x ;
tempData[1] = blockIdx.x * blockDim;

只需这样做：

__global__ void mat(Matrix a, Matrix b) 
{

   int tempData_0 = threadIdx.x ;
   int tempData_1 = blockIdx.x * blockDim;
   b.elements[tempData_1 + tempData_0] = b.elements[tempData_1 + tempData_0] * 5;
}

构造tempdata[0] + tempdata[1]正在有效地创建规范的 CUDA 1D 全局唯一线程索引：

int idx = threadIdx.x+blockDim.x*blockIdx.x;

通过构建的索引，您的主要代码是：

b.elements[idx] = b.elements[idx] * 5;

它获取向量（或矩阵，其中行或列连续存储）的元素并将它们乘以 5。

按照我为您提供的大纲，您的代码可能可以进一步简化以使其更易于阅读idx，但这些更改不会产生显着的性能差异。编译器可以计算出这些类型的转换。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

CUDA

加速Cuda程序的相关文章

Volatile.Read 和 Volatile.Write 背后的逻辑是什么？

来自 MSDN Volatile Read 读取字段的值在需要它的系统上插入一个阻止处理器重新排序内存的内存屏障操作如下如果在该方法之后出现读或写代码处理器无法移动它before这个方法 and Volatile Write
在 C# 中使用“using”关键字避免多次处置的最佳实践

当变量是 IDisposable 时我们有using关键字来管理处置但是如果我们在方法中返回值怎么办 using twice StringContent stringToStringContent string str using St
WebClient.DownloadDataAsync 冻结了我的 UI

我在 Form 构造函数中的 InitializeComponent 之后有以下代码 using WebClient client new WebClient client DownloadDataCompleted new Downloa
我如何知道 C 程序的可执行文件是在前台还是后台运行？

在我的 C 程序中我想知道我的可执行文件是否像这样在前台运行 a out 或者像这样 a out 如果你是前台工作 getpgrp tcgetpgrp STDOUT FILENO or STDIN FILENO or STDERR FIL
XPATH 查询、HtmlAgilityPack 和提取文本

我一直在尝试从名为 tim new 的类中提取链接我也得到了解决方案给出了解决方案片段和必要的信息here https stackoverflow com questions 2982862 extracting a table ro
叮当错误？命名空间模板类的朋友

以下代码在 clang 下无法编译但在 gcc 和 VS 下可以编译 template
并行化斐波那契序列生成器

我正在学习并行化在一项练习中我得到了一些我应该提高性能的算法其中之一是斐波那契数列生成器 array 0 0 array 1 1 for q 2 q lt MAX q array q array q 1 array q 2 我怀疑这
如果 JSON.NET 中的值为 null 或空格，则防止序列化

我有一个对象需要以这样的方式序列化即 null 和空白空或只是空格值都不会序列化我不控制对象本身因此无法设置属性但我知道所有属性都是字符串环境NullValueHandling显然忽略只能让我找到解决方案的一部分它似
在 ASP.NET MVC 中将模型从视图传递到控制器

我正在 ASP NET MVC 中开发我的第一个应用程序但遇到了一个我无法解决的问题即使在阅读了整个互联网之后也是如此因此我有几个使用视图模型创建的视图它们是报告这些视图模型是根据用户选择标准填充的我正在尝试构建一种接受模型并
C# 处理标准输入

我目前正在尝试通过命令行断开与网络文件夹的连接并使用以下代码 System Diagnostics Process process2 new System Diagnostics Process System Diagnostics Pr
C 中“complex”的默认类型

根据我读过的文档 C99 和更高版本的支持float complex double complex and long double complex作为复杂类型但是此代码在使用时编译时不会发出警告gcc Wall Wextra inclu
使用 C# 中的 Google 地图 API 和 SSIS 包获取行驶距离

更新找到了谷歌距离矩阵并尝试相应地修改我的代码我在这里收到无效参数错误 return new GeoLocation dstnc uri ToString catch return new GeoLocation 0 0 https 基
用于连接 DataTable 上的动态列的动态 LINQ

我目前遇到的情况不确定如何继续我有两个从数据库填充的数据表我还有一个可用的列名称列表可用于将这两个数据表连接在一起我希望编写一组 LINQ 查询这些查询将显示两个数据表中的行内部联接用于从一个数据表更新另一个数据表显示一个
如何使用递归查找数字中的最小元素 [C]

好的所以我正在准备我的 C 考试当谈到递归时我有点卡住了我是大学一年级的学生这对我来说似乎有点困难练习要求在给定的数字中使用递归函数我需要找到最小的元素例如 52873 是 2 程序需要打印 2 include
使用多线程进行矩阵乘法？

我应该使用线程将两个矩阵相乘有两件事当我运行程序时我不断得到 0 我还收到消息错误对于每个错误它在粗体行上显示警告从不兼容的指针类型传递 printMatrix 的参数1 我尝试打印输出还要注意第一个粗体块这是我解决问题
为什么 f(i = -1, i = -1) 是未定义的行为？

我正在读关于违反评估顺序 http en cppreference com w cpp language eval order 他们举了一个令我困惑的例子 1 如果标量对象上的副作用相对于同一标量对象上的另一个副作用是无序的则行为未定义
使用 xslt 将 xml 转换为 xsl-fo 时动态创建超链接？

我想使用 xsl 文件在 PDF 报告中创建标题如果源文件包含超链接则应将其呈现为超链接否则呈现为纯文本例如我的 xml 如下所示 a href http google com target blank This is the h
Autoconf 问题：“错误：C 编译器无法创建可执行文件”

我正在尝试使用 GNU 自动工具构建一个用 C 编写的程序但显然我设置错误因为当configure运行它吐出 configure error C compiler cannot create executables 如果我看进去con
“必须声明标量变量”错误[重复]

这个问题在这里已经有答案了必须声明标量变量 Id SqlConnection con new SqlConnection connectionstring con Open SqlCommand cmd new SqlCommand cm
将 Swagger 与命名空间版本的 WebApi 结合使用

我已经找到了如何使用基于名称空间的 WebAPI 版本这个班 https aspnet codeplex com SourceControl changeset view dd207952fa86 Samples WebApi Namesp

随机推荐

如何获取有权访问bigquery中的表的所有用户/组/服务帐户

from pprint import pprint from google oauth2 import service account import googleapiclient discovery credentials service
是否可以使用 Google Docs API 插入水平规则？

我一直在开发一个项目需要使用 PHP 将文本和其他类型的元素插入 Google 文档文档中我可以使用以下代码插入文本 requests requests new Google Service Docs Request insertTex
简化债务加权有向图的算法

我一直在使用我编写的一个小Python脚本来管理室友之间的债务它有效但缺少一些功能其中之一是简化不必要的复杂债务结构例如如果下面的加权有向图代表一些人箭头代表他们之间的债务爱丽丝欠鲍勃 20 美元查理欠 5 美元鲍勃欠查理
从Python中的一行中删除标签

我有一个具有以下架构的文本 word1 word2 br word3 word4 br 我想删除最后一部分并将我的结果存储在另一个文件中我已尝试以下操作仍然没有将结果保存在其他文件中 def main fileR open test
如何解决webview内容重叠的问题[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 嗨当背景设置为透明时如何解决we
变量范围的 Java 文档 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案任何人都可以指导我查看 java 文档以了解变量的范围我想查看 java 8 中的类变量和成员变量的
如何使用 numpy 数组加速分形生成？

这是我为使用牛顿方法制作分形而编写的一个小脚本 import numpy as np import matplotlib pyplot as plt f np poly1d 1 0 0 1 x 3 1 fp np polyder f def
我可以在 Open Graph 中使用相对路径吗？ [复制]

这个问题在这里已经有答案了我正在尝试设置相对路径og image元数据如下在共享调试器时我收到以下警告推断属性 og image 属性应该明确提供即使可以从其他标签推断出值有没有办法在Open Graph中使用相对路径不 o
JPA：@JoinColumn 和 @PrimaryKeyJoinColumn 之间的区别？

两者之间的确切区别是什么 JoinColumn and PrimaryKeyJoinColumn You use JoinColumn对于属于外键一部分的列典型的列可能如下所示例如在具有附加属性的连接表中 ManyToOne Join
Django 模板文件夹

我正在尝试 Django 并弄清楚如何设置urls py 以及 URL 如何工作我已经配置了urls py在项目的根目录中定向到我的博客和管理员但现在我想向我的主页添加一个页面所以在localhost 8000 所以我将以下代码添加
如何在 Windows Phone 7 中创建自定义文本框？

是否可以通过创建自定义文本框来处理 sip 我想创建一个自定义文本框 gt 创建获得焦点事件 gt 在我的自定义文本框的焦点上而不是 SIP 上我的自定义键盘应该打开要求如何创建自定义文本框打开自定义键盘而不是 SIP 获取文本字段
Python 终端菜单？终端着色？终端进度显示？

我有一个广泛使用 Python 2 风格的项目我想知道是否有终端菜单库或类似的东西我希望通过使用箭头键突出显示选项一些颜色等简化一些选项为我的脚本注入一些风味和活力我隐约记得有一种方法可以制作 bash shell 终端菜单但
Java初学者网络开发工具包/环境

我的任务是使用 java 和 mysql 开发一个交互式网站使用 servlet 检索和处理数据使用小程序对客户端数据进行特殊处理并处理客户端对不同数据视图的请求您会推荐什么作为使用 java 进行 Web 开发的合适的通用工具包
DynamoDBMappingException：HASH 键没有映射

编写 DynamoDB Java 应用程序时如果表及其数据模型配置不正确则在写入表或从表中检索时您可能会收到无 HASH 键映射错误完整的异常类似于 com amazonaws services dynamodbv2 datam
Django (JSONField) 和 tastypie

我通过使用 JSONField 在 mysql 中创建了一个 TextField django 类型的表这就是我的模型的样子 from django db import models from json field import JSON
我什么时候应该在 ASP.NET MVC 中使用部分视图？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我已经完成了示例 asp net m
在 Tridion 2011 SP1 中实现存储扩展时，未定义名为 No bean

我正在尝试使用下面的示例来实现存储扩展 http www sdltridionworld com articles sdltridion2011 tutorials extending content delivery storage sd
错误 C2601：“main”：本地函数定义非法 - MS VS 2013 编译器

我正在用 C 编写一个小程序当我尝试使用 MS VS 2013 编译器编译它时出现错误 C2601 main 本地函数定义非法这是什么意思我的代码是 include
在新选项卡或窗口中打开链接[重复]

这个问题在这里已经有答案了是否可以开一个a href链接在新选项卡而不是同一选项卡中 a href http your url here html Link a 您应该添加target blank and rel noopener nor
加速Cuda程序

要更改哪一部分来加速此代码代码到底在做什么 global void mat Matrix a Matrix b int tempData new int 2 tempData 0 threadIdx x tempData 1 blockI

加速Cuda程序

加速Cuda程序 的相关文章

随机推荐

热门标签

加速Cuda程序的相关文章