CUDA和Compute Capability

2023-05-16

CUDA-Enabled GPUs (Cuda支持的GPU)

在这个参考包含了GPU的Compute Capacity列表。

比如我的笔记本搭载了一块Geforce830m，查询列表就可以发现如下图
在这里插入图片描述
那么这块830M GPU的Compute Capability是5.0

Compute Capability

参考

Compute Capability指示GPU硬件能够支持的特性，可以被应用参考哪些特性可以运行。
这里能够找到不同Compute Capability对应的硬件特性。比如我的笔记本搭载了一块Geforce830m，Compute Capability为5.0，硬件特性为
在这里插入图片描述另外有关技术细节比如1d,2d贴图的内存大小的指标也可以从表格中找到。

GPU architecture

不同的compute capacity对应不同的GPU architecture,比如

另外5.x是Maxwell架构，3.x是Kepler架构，9.x是Hopper,

CUDA

CUDA的版本和compute capacity的编号不同，仅仅是用于标记开发的版本号。但是较高版本的CUDA可能会不支持较早架构的GPU，比如CUDA 7.0 和 CUDA 9.0开始不支持Tesla 和 Fermi架构，当然这两种架构已经很老了。

写这篇文章的时候，最新的CUDA是12.0(下载页面)，可以查询对应的文档,其中明确表明支持我的具有Maxwell架构的Geforce830m

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA

Compute

Capability

CUDA和Compute Capability 的相关文章

如何获取要执行的 PTX 文件

我知道如何生成 ptx文件来自 cu以及如何生成 cubin文件来自 ptx 但我不知道如何获得最终的可执行文件更具体地说我有一个sample cu文件编译为sample ptx 然后我使用 nvcc 来编译sample ptx to
将 GPUJPEG 项目移植到 Windows

我目前正在尝试移植 GPUJPEG 在 Sourceforge 上 http sourceforge net projects gpujpeg 库基于 CUDA 从 Unix 到 Windows 现在我被卡住了我不知道发生了什么或为什么
cudaMemcpyToSymbol 的问题

我正在尝试复制到恒定内存但我不能因为我对 cudaMemcpyToSymbol 函数的用法有误解我正在努力追随this http developer download nvidia com compute cuda 4 1 rel t
cudaMallocManaged() 返回“不支持的操作”

在 CUDA 6 0 中尝试托管内存给了我operation not supported打电话时cudaMallocManaged include cuda runtime h include
CUDA素数生成

当数据大小增加超过 260k 时我的 CUDA 程序停止工作它不打印任何内容有人能告诉我为什么会发生这种情况吗这是我的第一个 CUDA 程序如果我想要更大的素数如何在 CUDA 上使用大于 long long int 的数据类型
传递给 CUDA 的结构中的指针

我已经搞砸了一段时间了但似乎无法正确处理我正在尝试将包含数组的对象复制到 CUDA 设备内存中然后再复制回来但当我遇到它时我会跨过那座桥 struct MyData float data int dataLen void copyT
仅使用 CUDA 进行奇异值计算

我正在尝试使用新的cusolverDnSgesvdCUDA 7 0 用于计算奇异值的例程完整代码如下 include cuda runtime h include device launch parameters h include
无法在 CUDA 中执行设备内核

我正在尝试在全局内核中调用设备内核我的全局内核是矩阵乘法我的设备内核正在查找乘积矩阵每列中的最大值和索引以下是代码 device void MaxFunction float Pd float max int x threadIdx
加速Cuda程序

要更改哪一部分来加速此代码代码到底在做什么 global void mat Matrix a Matrix b int tempData new int 2 tempData 0 threadIdx x tempData 1 blockI
Cuda 6.5 找不到 - libGLU。（在 ubuntu 14.04 64 位上）

我已经在我的ubuntu上安装了cuda 6 5 我的显卡是 GTX titan 当我想要制作 cuda 样本之一时模拟粒子我收到这条消息 gt gt gt WARNING libGLU so not found refer to C
尝试构建我的 CUDA 程序时出现错误 MSB4062

当我尝试构建我的第一个 GPU 程序时出现以下错误有什么建议可能会出什么问题吗错误 1 错误 MSB4062 Nvda Build CudaTasks SanitizePaths 任务无法从程序集 C Program 加载文件 M
cuda中有模板化的数学函数吗？ [复制]

这个问题在这里已经有答案了我一直在寻找 cuda 中的模板化数学函数但似乎找不到在普通的 C 中如果我调用std sqrt它是模板化的并且将根据参数是浮点数还是双精度数执行不同的版本我想要这样的 CUDA 设备代码我的内核将真
cudaSetDevice() 对 CUDA 设备的上下文堆栈有何作用？

假设我有一个与设备关联的活动 CUDA 上下文i 我现在打电话cudaSetDevice i 会发生什么 Nothing 主上下文取代了堆栈顶部主上下文被压入堆栈事实上这似乎是不一致的我编写了这个程序在具有单个设备的机器上运行 i
在 cudaFree() 之前需要 cudaDeviceSynchronize() 吗？

CUDA 版本 10 1 帕斯卡 GPU 所有命令都发送到默认流 void ptr cudaMalloc ptr launch kernel lt lt lt gt gt gt ptr cudaDeviceSynchronize Is th
有没有一种有效的方法来优化我的序列化代码？

这个问题缺乏细节因此我决定创建另一个问题而不是编辑这个问题新问题在这里我可以并行化我的代码吗还是不值得 https stackoverflow com questions 17937438 can i parallelize my
__device__ __constant__ 常量

有什么区别吗在 CUDA 程序中定义设备常量的最佳方法是什么在 C 主机设备程序中如果我想将常量定义在设备常量内存中我可以这样做 device constant float a 5 constant float a 5 问题 1
CUDA、NPP 滤波器

CUDA NPP 库支持使用 nppiFilter 8u C1R 命令过滤图像但不断出现错误我可以毫无问题地启动并运行 boxFilterNPP 示例代码 eStatusNPP nppiFilterBox 8u C1R oDeviceS
cudaMemcpy() 与 cudaMemcpyFromSymbol()

我试图找出原因cudaMemcpyFromSymbol 存在似乎 symbol func 可以做的所有事情 nonSymbol cmd 也可以做 symbol func 似乎可以轻松移动数组或索引的一部分但这也可以使用 nonSymbo
无法在内存位置找到异常源：cudaError_enum

我正在尝试确定 Microsoft C 异常的来源 test fft exe 中 0x770ab9bc 处的第一次机会异常 Microsoft C 异常内存位置 0x016cf234 处的 cudaError enum 我的构建环境是 I
将 nvidia 运行时添加到 docker 运行时

我正在运行虚拟机GCP配备特斯拉 GPU 并尝试部署一个PyTorch基于应用程序使用 GPU 加速我想让 docker 使用这个 GPU 可以从容器访问它我设法在主机上安装了所有驱动程序并且该应用程序在那里运行良好但是当我尝试在

随机推荐

直方图均衡化及算法步骤

2019 07 16 xff0c 科学家首次拍摄到一种量子纠缠的照片量子领域还不懂 xff0c 先不研究猛一看和今年刚出的黑洞照片倒有几分相似黑洞照片看起来还是比较清晰地 xff0c 这个是黑白的 xff0c 亮度不均 xff0c 肉
解决mongodb启动报错ERROR: child process failed, exited with error number 14的问题

在使用mongodb导入数据时 xff0c 数据库无法链接 xff0c 关闭service 后仍然无法启动可能的原因 xff1a service mongodb restart时启动失败没有正常关闭mongodb引起的 xff0c 比如直
面向对象分析(4)：步骤

面向对象分析通常按照下面的步骤来进行 xff1a xff08 1 xff09 标识对象和类可以从应用领域开始 xff0c 逐步确定形成整个应用的基础类和对象这一步需要分析领域中目标系统的责任 xff0c 调查系统的环境 xff0c 从而
NTFS for Mac - 免费让 Mac 原生支持NTFS读写

使用 Mac 电脑的朋友可能都遇过 xff0c 在使用 NTFS 文件格式的移动硬盘或U盘时 xff0c 默认只能以只读模式打开 xff0c 也就是说你只能读取复制文件而不能移动修改重命名或删除里面的东西这确实很不便 xff0c
C++ 将十六进制字符串转换为二进制字符串

C 43 43 将十六进制字符串转换为二进制字符串前言一源代码前言一种简单的方法将十六进制字符串转为二进制字符串 xff0c 不限制十六进制的字节数一源代码传入的十六进制字符串需要转换为大写 xff01 X toupper s
python——paramiko详解

目录一 SSHClient类 ssh远程连接服务器 connet 远程主机没有本地主机密钥或HostKeys对象时的连接方法 xff0c 需要配置set missing host key policy policy 远程执行命令在远程服
绿盟网站安全防护服务(vWAF)

平台 xff1a linux 类型 xff1a 虚拟机镜像软件包 xff1a basic software devops nsfocus security waf 服务优惠价按服务商许可协议云服务器费用查看费用立即部署产品详情
华为服务器操作系统EulerOS V2.0

平台 xff1a linux 类型 xff1a 虚拟机镜像软件包 xff1a java 1 8 0 php 5 4 16 python 2 7 5 qt 4 8 5 tomcat 7 0 69 basic software euleros
星环一站式大数据平台-4.6

平台 xff1a arm 类型 xff1a ARM 模板软件包 xff1a 星环一站式大数据平台 basic software big data hadoop tdh tos transwarp 大数据星环科技星环一站式大数据平台云
故障排除：无法启动、访问或连接到 Azure 虚拟机上运行的应用程序

有多种原因可导致无法启用或连接到在 Azure 虚拟机 VM 上运行的应用程序原因包括应用程序未在预期端口上运行或侦听侦听端口受到阻止 xff0c 或网络规则未将流量正确传递到应用程序本文说明有条理地找到问题并更正问题如果在使用 R
文件系统损坏导致虚拟机无法正常启动的问题及解决方法

简介计算机的文件系统是一种存储和组织计算机数据的方法 xff0c 它使得对其访问和查找变得容易 xff0c 文件系统使用文件和树形目录的抽象逻辑概念代替了硬盘和光盘等物理设备使用数据块的概念 xff0c 用户使用文件系统来保存数据不必关心
连接到 Azure (Resource Manager) 上的 SQL Server 虚拟机

概述本主题介绍如何连接到运行于 Azure 虚拟机的 SQL Server 实例它介绍了一些常规连接方案 xff0c 并提供了在 Azure VM 中配置 SQL Server 连接的详细步骤 Note Azure 具有用于创建和处理资
网络安全组（NSG）简介

韩源 xff0c 资深工程师 xff0c 存储和灾备专家 Azure 网络安全解析作为公有云最重要环节之一 xff0c 网络安全一直是 Azure 的重中之重在 Azure 中 xff0c 多种安全技术共同构成了立体的网络保护 xff1
gnome manjaro设置无法打开

本文转载自 xff1a https joshtronic com 2018 04 02 unable to open gnome settings on arch linux after gnome upgrade 我经常会写关于主题的博客
手动将经典 VM 从 VHD 迁移到新的 ARM 托管磁盘 VM

本部分有助于将现有 Azure VM 从经典部署模型迁移到资源管理器部署模型中的托管磁盘计划迁移到托管磁盘本部分可帮助你针对 VM 和磁盘类型做出最佳决策位置选取 Azure 托管磁盘可用位置如果要迁移到高级托管磁盘 xff0c
适用于 Azure 虚拟网络的常见 PowerShell 命令

如果想要创建虚拟机 xff0c 需要创建虚拟网络或了解可在其中添加 VM 的现有虚拟网络通常情况下 xff0c 创建 VM 时 xff0c 还需考虑创建本文所述资源有关安装最新版 Azure PowerShell 选择订阅和登录到帐户的
创建包含多个子网的虚拟网络

本教程介绍如何创建包含独立公共子网和专用子网的基本 Azure 虚拟网络虚拟网络中的资源可以彼此通信 xff0c 并可以与连接到虚拟网络的其他网络中的资源通信可在虚拟网络中相同或不同的子网中创建 Azure 资源 xff0c 如虚拟机
matplotlib笔记

文章目录 matplotlib笔记cmap选择cmap创建cmap 子图断点轴 Broken axis 子图大小坐标轴scale matplotlib笔记有一个在线使用matplotlib的网址 cmap 选择cmap choose c
Fortran pgplot安装

pgplot 首先确保已经安装了gfortran 以下为linux下安装流程从这里下载安装包解压tar zxvf pgplot5 2 tar gz到某个目录比如 src pgplot创建一个文件夹xxx pgplot用于安装 xff0c
CUDA和Compute Capability

CUDA Enabled GPUs Cuda支持的GPU 在这个参考包含了GPU的Compute Capacity列表比如我的笔记本搭载了一块Geforce830m xff0c 查询列表就可以发现如下图那么这块830M GPU的Comp

热门标签