使用 CUDA 占用计算器

2024-03-07


我正在使用占用率计算器,但我无法理解如何获取每个线程的寄存器/每个块的共享内存。我阅读了文档。我使用 Visual Studio 。所以在 CUDA 构建规则下的项目属性中->命令行->附加选项 I添加 --ptxas-options=-v。程序编译正常。但我没有看到任何输出。有人可以帮忙吗? 谢谢


打开此开关后,编译器输出窗口上应该有一行告诉您寄存器的数量和共享内存的数量。
您在编译器输出窗口中看到什么了吗?您可以将其复制并粘贴到问题中吗?
它应该看起来像

ptxas info : Used 3 registers, 2084+1060 bytes smem, 40 bytes cmem[0], 12 bytes cmem[1]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 CUDA 占用计算器 的相关文章

  • 如何获取要执行的 PTX 文件

    我知道如何生成 ptx文件来自 cu以及如何生成 cubin文件来自 ptx 但我不知道如何获得最终的可执行文件 更具体地说 我有一个sample cu文件 编译为sample ptx 然后我使用 nvcc 来编译sample ptx to
  • 加强托管线程和操作系统线程之间的关系(CUDA 用例)

    Problem 我正在尝试创建一个与 net 良好集成的 CUDA 应用程序 设计目标是拥有多个可以从托管代码调用的 CUDA 函数 数据还应该能够在函数调用之间保留在设备上 以便可以将其传递给多个 CUDA 函数 重要的是 每个单独的数据
  • C 中带括号和不带括号的循环处理方式不同吗?

    我在调试器中单步执行一些 C CUDA 代码 如下所示 for uint i threadIdx x i lt 8379 i 256 sum d PartialHistograms blockIdx x i HISTOGRAM64 BIN
  • 如何在 gitlab-ci docker 执行器中使用 cuda

    我们正在使用 gitlab 持续集成来构建和测试我们的项目 最近 其中一个项目添加了 CUDA 的要求以启用 GPU 加速 我不想改变我们的管道 docker 和 gitlab ci 对我们来说运行良好 所以我想以某种方式让 docker
  • 为什么GK110有192个核心和4个扭曲?

    我想感受一下开普勒的架构 但这对我来说没有意义 如果一个 warp 有 32 个线程 其中 4 个被调度 执行 则意味着 128 个核心正在使用 64 个核心处于空闲状态 白皮书中提到了独立指令 那么64核是为这些指令保留的吗 如果是这样
  • Ubuntu 11.10/12.04 上的 CUDA“无兼容设备”错误

    一段时间以来 我一直在尝试在我的笔记本电脑上设置 Ubuntu 环境来进行 CUDA 编程 我目前双启动 Windows 8 和 Ubuntu 12 04 并想在 Ubuntu 上安装 CUDA 5 该笔记本电脑配有 GeForce GT
  • Golang调用CUDA库

    我正在尝试从 Go 代码中调用 CUDA 函数 我有以下三个文件 test h int test add void test cu global void add int a int b int c c a b int test add v
  • cudaMemcpyToSymbol 的问题

    我正在尝试复制到恒定内存 但我不能 因为我对 cudaMemcpyToSymbol 函数的用法有误解 我正在努力追随this http developer download nvidia com compute cuda 4 1 rel t
  • 为什么 gcc 和 NVCC (g++) 会看到两种不同的结构大小?

    我正在尝试将 CUDA 添加到 90 年代末编写的现有单线程 C 程序中 为此 我需要混合两种语言 C 和 C nvcc 是 c 编译器 问题在于 C 编译器将结构视为特定大小 而 C 编译器将相同的结构视为略有不同的大小 那很糟 我对此感
  • 当我有表面声明时,如何为 sm_1X 和 sm_2X 编译 CUDA 程序

    我正在编写一个使用表面 重新采样并写入纹理 来提高性能的库 surface
  • CUDA程序导致nvidia驱动程序崩溃

    当我超过大约 500 次试验和 256 个完整块时 我的 monte carlo pi 计算 CUDA 程序导致我的 nvidia 驱动程序崩溃 这似乎发生在 monteCarlo 内核函数中 任何帮助都会受到赞赏 include
  • 传递给 CUDA 的结构中的指针

    我已经搞砸了一段时间了 但似乎无法正确处理 我正在尝试将包含数组的对象复制到 CUDA 设备内存中 然后再复制回来 但当我遇到它时我会跨过那座桥 struct MyData float data int dataLen void copyT
  • 如何优化这个 CUDA 内核

    我已经分析了我的模型 似乎该内核约占我总运行时间的 2 3 我一直在寻找优化它的建议 代码如下 global void calcFlux double concs double fluxes double dt int idx blockI
  • 运行时 API 应用程序中的 cuda 上下文创建和资源关联

    我想了解如何在 cuda 运行时 API 应用程序中创建 cuda 上下文并与内核关联 我知道这是由驱动程序 API 在幕后完成的 但我想了解一下创作的时间线 首先 我知道 cudaRegisterFatBinary 是第一个 cuda a
  • CUDA Visual Studio 2010 Express 构建错误

    我正在尝试在 64 位 Windows 7 上使用 Visual Studio 2010 Express 在 Windows 上开始 CUDA 编程 我花了一段时间来设置环境 然后我刚刚编写了我的第一个程序 helloWorld cu 目前
  • __syncthreads() 死锁

    如果只有部分线程执行 syncthreads 会导致死锁吗 我有一个这样的内核 global void Kernel int N int a if threadIdx x
  • 在 __device/global__ CUDA 内核中动态分配内存

    根据CUDA 编程指南 http developer download nvidia com compute cuda 3 2 prod toolkit docs CUDA C Programming Guide pdf 第 122 页 可
  • cuda中有模板化的数学函数吗? [复制]

    这个问题在这里已经有答案了 我一直在寻找 cuda 中的模板化数学函数 但似乎找不到 在普通的 C 中 如果我调用std sqrt它是模板化的 并且将根据参数是浮点数还是双精度数执行不同的版本 我想要这样的 CUDA 设备代码 我的内核将真
  • cudaSetDevice() 对 CUDA 设备的上下文堆栈有何作用?

    假设我有一个与设备关联的活动 CUDA 上下文i 我现在打电话cudaSetDevice i 会发生什么 Nothing 主上下文取代了堆栈顶部 主上下文被压入堆栈 事实上 这似乎是不一致的 我编写了这个程序 在具有单个设备的机器上运行 i
  • cuda中内核的并行执行

    可以说我有三个全局数组 它们已使用 cudaMemcpy 复制到 GPU 中 但 c 中的这些全局数组尚未使用 cudaHostAlloc 分配 以便分配页面锁定的内存 而不是简单的全局分配 int a 100 b 100 c 100 cu

随机推荐

  • Scrapy:捕获具有特定 HTTP 服务器代码的响应

    我们有一个非常标准的 Scrapy 项目 Scrapy 0 24 我想捕获特定的 HTTP 响应代码 例如 200 500 502 503 504 等 像这样的东西 class Spider def parse processes HTTP
  • Google 地理编码 API 找不到地点 API 返回的地址

    我无法让 google 的地理编码 api 识别该地址 斯奎尔 12 号酒店机场60549 美因河畔法兰克福 Germany Squaire 是法兰克福机场的一座建筑 它似乎没有正常的街道地址 但 The Squaire 的许多企业都有类似
  • 如何将已上传图像的 URL 添加到 Dropzone?

    我已经检索到已上传到网站的图像的 URL 如何以编程方式将此图像添加到我的 Dropzone 组件并立即查看其预览 我尝试了以下代码 但未显示图像 var mockFile name image jpg size 12345 imgUrl
  • 如何在 ipython 提示符中显示当前目录

    有没有办法在 IPython 提示符中显示当前目录 Instead of this In 1 Something like this In lt user src proj1 gt 1 您可以使用os getcwd 当前工作目录 或在本机操
  • 按列对数据帧多索引级别进行排序

    更新 pandas 版本 0 23 0 解决了这个问题 按列和索引级别的组合排序 https pandas pydata org docs whatsnew v0 23 0 html sorting by a combination of
  • 在 Rails 中将 JSON 字符串转换为 JSON 数组?

    我在 Rails 中有一个 JSON 字符串 如下所示 content 1D createdTime 09 06 2011 00 59 content 2D createdtime 09 06 2011 08 00 它们是具有内容和创建时间
  • _pickle.PicklingError:无法序列化对象:TypeError:无法pickle _thread.RLock对象

    我想使用 Kafka 和 Spark 进行情感分析 我想要做的是从 Kafka 读取流数据 然后使用 Spark 对数据进行批处理 之后 我想使用我使用 Tensorflow 制作的函数情感预测 来分析批处理 这就是我到目前为止所做的 im
  • 将 ContextMenu 放入 WPF 样式中

    我试图将 ContextMenu 置于以下样式中 以便所有文本框可以共享它
  • 我的 Redux 状态发生了变化,为什么 React 没有触发重新渲染?

    我正在尝试设计一个通知组件 其中通知会在某些情况下出现 例如连接问题 成功修改等 我需要通知在几秒钟后消失 因此我触发状态更改以从 Redux 状态中删除通知setTimeout在通知内componentDidMount 我可以看到状态确实
  • Firebase 最大项目和应用程序

    我可以从一个帐户在一个项目中创建多少个应用程序 以及可以在 Firebase for Cloud Messaging 中创建多少个项目 截至目前 2017 年 12 月 8 日 我最多获得 5 个项目 我在创建新项目时收到此消息 并且只有
  • 商务/节假日日期处理[关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找一个与 Perl 模块类似的 C 类 库Date Manip http search cpa
  • RDLC过滤嵌套表

    我正在创建一个 RDLC 报告 其中数据集由多个数据表组成 有一张父表和几张子表 我想做的是显示父表中每一行的每个子表的相关数据 这是一个简化的示例 table1 Purchase 具有 PurhcaseID PurchaseNumber
  • 为什么 c++ std::min 在 O0 上编译时不能使用静态字段作为其参数?

    同样的代码 用O0编译 会报错 Name test cpp Author Version Copyright Your copyright notice Description Hello World in C Ansi style inc
  • 制作应用程序时使用的易失性变量

    我是这个领域的新手 以前 我在进行微控制器编程时 使用易失性变量来避免编译器优化 但我从来没有在变量声明之前看到过这样的 volatile 声明 这是否意味着编译是在 Arago 构建中没有进行任何优化的情况下完成的 这里我有两个问题 如何
  • (图书馆问题)

    我正在使用 Sencha Architect 和 Extjs 4 并按照此处的基本示例进行操作 http geoext org tutorials quickstart html basic example http geoext org
  • 如何将时间跨度转换为小数?

    我的值正好是1 08 43 23在我的文本框中 它等于 1d 08 43 23 我想将该值转换为十进制 以便将其乘以另一个十进制值 但是当我使用Convert ToDecimal它返回错误 输入字符串的格式无效 Is Convert ToD
  • 为 Asp.net core web api 启用 HTTPS 安全连接

    我有使用 ASP NET Core 2 1 创建的 REST API 应用程序 REST API 由 WebHostBuilder 创建并由 Kestrel 托管 Startup Kernel kernel restApiServer ne
  • Ajax 自动完成(或自动建议)与 TAB 完成/自动填充类似于 shell 命令行完成?

    我正在实现 AJAX 自动完成 自动建议功能 我不仅想要执行与用户键入的内容类似的常规显示建议 而且还想让用户完成部分完成以节省键入 所以 想象我的字典中有这些值 青苹果 青梨 绿色水果 蓝天 蓝色水 蓝色唤醒 如果用户输入 g 建议应该是
  • GetElementById() 找不到标签?

    我有一个有效的 XML 文件正在由以下 NET C windows 服务读取 有问题的标签 u1 000 绝对在元素中
  • 使用 CUDA 占用计算器

    我正在使用占用率计算器 但我无法理解如何获取每个线程的寄存器 每个块的共享内存 我阅读了文档 我使用 Visual Studio 所以在 CUDA 构建规则下的项目属性中 gt 命令行 gt 附加选项 I添加 ptxas options v