cudaMallocManaged() 返回“不支持的操作”

2024-04-16

在 CUDA 6.0 中尝试托管内存给了我operation not supported打电话时cudaMallocManaged().

#include "cuda_runtime.h"

#include <stdio.h>

#define CHECK(r) {_check((r), __LINE__);}

void _check(cudaError_t r, int line) {
  if (r != cudaSuccess) {
    printf("CUDA error on line %d: %s\n", line, cudaGetErrorString(r), line);
    exit(0);
  }
}

int main()
{
  int *c;
  CHECK(cudaMallocManaged(&c, sizeof(int)));
  *c = 0;
  return 0;
}

GeForce GTX 750 Ti (Maxwell)，使用compute_50、sm_50 使用 CUDA 6.0 进行编译。 Windows 7 64 位。使用驱动程序 335.23 (whql) 和 337.50 (beta) 进行测试。 Visual Studio 2012。尝试了 32 位调试和发布版本。

C:\rd\projects\cpp\test_cuda6\test_cuda6>"C:\Program 文件\NVIDIA GPU计算工具包\CUDA\v6.0\bin\nvcc.exe” -gencode=arch=compute_50,code=\"sm_50,compute_50\" --use-local-env --cl-version 2012 -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 11.0\VC\bin" -I\C\common\inc -I"C:\Program Files\NVIDIA GPU 计算工具包\CUDA\v6.0\include" -I"C:\Program Files\NVIDIA GPU 计算工具包\CUDA\v6.0\包括“--keep-dir发布-maxrregcount = 0 --machine 32 --compile -cudart静态-DWIN32 -DNDEBUG -D_CONSOLE -D_MBCS -Xcompiler“/ EHsc / W3 /nologo /O2 /Zi /MD " -o Release\kernel.cu.obj “C:\rd\projects\cpp\test_cuda6\test_cuda6\kernel.cu”

如果我替换，程序运行不会出错cudaMallocManaged() with cudaMalloc().

关于如何获得的任何想法cudaMallocManaged()在职的？

尝试过 32 位调试和发布版本。

使用 64 位调试或发布版本。

From 文档 http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#um-requirements:

J.1.4。系统要求

统一内存有三个基本要求：

•具有 SM 架构 3.0 或更高版本的 GPU（Kepler 级或更高版本）

• 64 位主机应用程序和操作系统（Android 除外）

•Linux或Windows

64 位主机应用程序意味着您无法编译 32 位调试或发布版本。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA

cudaMallocManaged() 返回“不支持的操作” 的相关文章

CUDA 调试 - Windows 工作站上的 VS，Linux 服务器上的 GPU？

有人有过在工作站上编码时在服务器上调试 CUDA 代码的经验吗我的笔记本电脑 Thinkpad T400 不支持 CUDA 但我可以访问带有一对运行 Linux 的 NVIDIA GTX 295 卡的服务器我可以使用 NVidia 的
如何使 TensorFlow 在具有 2.x 功能的 GPU 上运行？

我已在 Linux Ubuntu 16 04 上成功安装了tensorflow GPU 并进行了一些小的更改以使其能够与新的 Ubuntu LTS 版本配合使用然而我认为谁知道为什么我的 GPU 满足计算能力大于 3 5 的最低要
ImportError：libcublas.so.9.0：无法打开共享对象文件

目前我在 Gpu 支持系统中安装了 cuda 8 0 和 cuda 9 0 我在从 keras 模块导入时遇到了这个错误它说无法加载本机张量流运行时我收到的错误日志是 Traceback most recent call last Fi
使用非均匀节点优化 CUDA 内核插值

原问题我有以下内核使用非均匀节点执行插值我想对其进行优化 global void interpolation cufftDoubleComplex Uj double points cufftDoubleComplex result i
如何在 Linux 中分析 PyCuda 代码？

我有一个简单的经过测试的 pycuda 应用程序正在尝试对其进行分析我尝试过 NVidia 的 Compute Visual Profiler 它运行该程序 11 次然后发出以下错误 NV Warning Ignoring the
使用常量内存打印地址而不是cuda中的值

我试图在代码中使用常量内存并从内核分配常量内存值而不是使用 cudacopytosymbol include
将 GPUJPEG 项目移植到 Windows

我目前正在尝试移植 GPUJPEG 在 Sourceforge 上 http sourceforge net projects gpujpeg 库基于 CUDA 从 Unix 到 Windows 现在我被卡住了我不知道发生了什么或为什么
cudaMemcpyToSymbol 与 cudaMemcpy [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 我试图找出
如何用Go语言的cgo编译Cuda源码？

我用 cuda c 编写了一个简单的程序它可以在 eclipse nsight 上运行这是源代码 include
寻找 CUDA 中的最大值

我正在尝试在 CUDA 中编写代码来查找最大值对于给定的一组数字假设您有 20 个数字并且内核在 2 个块每块 5 个线程上运行现在假设 10 个线程同时比较前 10 个值并且thread 2找到最大值因此线程 2 正在更新
CUDA程序导致nvidia驱动程序崩溃

当我超过大约 500 次试验和 256 个完整块时我的 monte carlo pi 计算 CUDA 程序导致我的 nvidia 驱动程序崩溃这似乎发生在 monteCarlo 内核函数中任何帮助都会受到赞赏 include
CUDA素数生成

当数据大小增加超过 260k 时我的 CUDA 程序停止工作它不打印任何内容有人能告诉我为什么会发生这种情况吗这是我的第一个 CUDA 程序如果我想要更大的素数如何在 CUDA 上使用大于 long long int 的数据类型
Visual Studio - 过滤掉 nvcc 警告

我正在编写 CUDA 程序但收到令人讨厌的警告 Warning Cannot tell what pointer points to assuming global memory space 这是来自 nvcc 我无法禁用它有没有办法过
MPI+CUDA 与纯 MPI 相比有何优势？

加速应用程序的常用方法是使用 MPI 或更高级别的库例如在幕后使用 MPI 的 PETSc 并行化应用程序然而现在每个人似乎都对使用 CUDA 来并行化他们的应用程序或使用 MPI 和 CUDA 的混合来解决更雄心勃勃更大的问题感兴
仅使用 CUDA 进行奇异值计算

我正在尝试使用新的cusolverDnSgesvdCUDA 7 0 用于计算奇异值的例程完整代码如下 include cuda runtime h include device launch parameters h include
如何并行从数组中删除零值

如何使用 CUDA 并行有效地从数组中删除零值有关零值数量的信息是预先可用的这应该可以简化这项任务重要的是数字必须保持源数组中的顺序当被复制到结果数组时 Example 该数组将例如包含以下值 0 0 19 7 0 3 5 0 0
运行时 API 应用程序中的 cuda 上下文创建和资源关联

我想了解如何在 cuda 运行时 API 应用程序中创建 cuda 上下文并与内核关联我知道这是由驱动程序 API 在幕后完成的但我想了解一下创作的时间线首先我知道 cudaRegisterFatBinary 是第一个 cuda a
设置最大 CUDA 资源

我想知道是否可以设置 CUDA 应用程序的最大 GPU 资源例如如果我有一个 4GB GPU 但希望给定的应用程序只能访问 2GB 如果它尝试分配更多就会失败理想情况下这可以在进程级别或 CUDA 上下文级别上设置不目前没有允
加速Cuda程序

要更改哪一部分来加速此代码代码到底在做什么 global void mat Matrix a Matrix b int tempData new int 2 tempData 0 threadIdx x tempData 1 blockI
在 __device/global__ CUDA 内核中动态分配内存

根据CUDA 编程指南 http developer download nvidia com compute cuda 3 2 prod toolkit docs CUDA C Programming Guide pdf 第 122 页可

随机推荐

使用连接、分组依据和聚合函数的 SQL 选择查询

我有两个带有以下字段的表 emp table emp id emp name salary increase emp id inc date inc amount 我需要编写一个查询其中提供员工详细信息员工加薪的次数最大加薪金额以及加
可安装发动机安装在什么路径上

我需要从可安装引擎的布局内部知道它当前安装在什么路径上该怎么做呢例如我的routes rb 包含以下行 mount BackendCore Engine gt backend 从 BackendCore 内部我需要访问 backen
BLL和DAL之间的通信

解决方案设置 DAL 类库 BLL 类库常见类库一些常见功能枚举日志记录异常等应用程序 1 Windows 应用程序应用程序2 Windows应用程序 WebApp 网络应用程序假设我有一个Customer实体即 SQL
在 R 中生成可能排列的随机、非重复子集

Given p离散变量我想随机选择 k他们可能的排列换句话说对于变量a in 0 1 and b in 1 2 3 两个随机排列将是 0 2 and 1 3 我想在不首先生成所有可能排列的表的情况下生成这些变量因为随着变量数量及其可
将以毫秒为单位的日期时间转换为双精度或整数？

我有一个看起来不错的字符串如下所示 TimeString 2011 01 02 22 06 52 091 现在我想将其转换为双精度数并将其保存为双精度数我是用c 做的我该怎么做呢网上实在找不到答案 Edit 时间是一种金融货币报价
Google Analytics“用户计数”与大查询“用户计数”不匹配

我们的 Google Analytics 用户计数与我们的大查询用户计数不匹配我计算得正确吗通常 GA 和 BQ 非常接近尽管不完全一致最近 GA 与 BQ 中的用户数并不一致我们的每个用户的会话数通常非常正常分配在过
如何编写自定义操作 DLL 以在 MSI 中使用？

这是我打算自己回答的问题但请随意添加其他方法来完成此任务我正在打包一个应用程序以用于各种配置并且我确定在 MSI 中执行自定义逻辑的最可靠方法是编写我自己的自定义操作 DLL 该 DLL 能够从 PROPERTY 表中读取写入终止
在 Monogame 中使用 BMP 图像作为字体

有没有办法使用 BMP 图像加载自定义字体我在网上看到了 Microsoft 提供的解决方案但在尝试运行此解决方案时我不断收到内容加载异常看起来这曾经适用于 XNA 但对于 Monogame 可能不再是这样了我想要自己的自定义字体
Git：推送到多个远程

Short 如果您将多个远程存储库链接到本地文件是否有一种方法可以同时推送到它们 Long 由于工作原因我的代码必须使用gitlab和github遥控器因此一旦我进行了一些本地更改我就想更新这两个存储库我的 git confi
重新渲染子视图后，主干事件会多次触发

我们有一个由侧边栏和几个子视图组成的主干视图为简单起见我们决定让侧边栏和子视图由单个视图管理render功能但是那click edit单击侧边栏项目之一后事件似乎会多次触发例如如果我从常规开始并单击 edit then h
Vim: set langmap=e;h 破坏 supertab 插件

我是 Vim 新手正在尝试设置一些插件到目前为止我已经安装了 Pathogen pyflakes 和 supertab 后者似乎不起作用紧迫tab而在插入模式下只需写入字符串
如何从 UWP（又名 .NET Core）中的 Type 对象获取 Assembly

Type 类在 NET Framework 中有一个Assembly 属性然而当您编写使用 NET Core 的 UWP 时此属性就消失了仅 AssemblyQualifiedName 属性可用我怎样才能从这个名字进入Assemb
R：如何用文本框注释 ggplot？

我希望添加一个小的白色文本框并在 ggplot 绘图的正文中添加自定义文本我要添加的文本是为了标识我要添加到绘图中的水平线 ggplot cb emp geom point aes x grossunits y rate color a
在 StringTokenizer 中使用多个分隔符

我想知道如何在 java 中使用 StringTokenizer 的多个分隔符例如其中之一将作为分隔符出现而且一次只会有一个 Use the 有两个参数的构造函数 http docs oracle com javase 6 docs
r - 如何清除 rJava 使用的内存？

我正在使用 xlsx 包创建工作簿工作表将数据写入工作表然后保存工作簿然而当我多次重复这组操作时我开始出现错误消息 gt Error in jcheck silent FALSE java lang OutOfMemoryErr
DbSet、模型构建器和 EF 导航属性

我正在尝试实现一个多租户应用程序在其中通过租户对象查询数据库而不是直接从上下文中查询在我拥有这个之前 public User GetUserByEmail string email using var db CreateContext
为子域设置了 Cookie，但 IE 开发工具在根域显示 Cookie。我缺少什么？

我们有许多网站挂在根域上例如 dev mydomain co nz test mydomain co nz www mydomain co nz 我使用 Fiddler 监控与 dev mydomain co nz 的连接并收到一个带有
Eclipse：无法加载 JNI 共享库“C:\Program Files(x86)\Java\jdk1.7.0_15\bin\..\jre\bin\client\jvm.dll

我正在尝试安装 Eclipse 为了安装我已经完成了以下操作安装JDK 7u15 64位实际下载名称 jdk 7u15 windows i586 exe 在C Program Files x86 Java JDK 1 7 0 15 我在
使用 Python 可视化 LDA 模型

我有一个 LDA 模型包含 10K 文档中 10 个最常见的主题现在它只是对每个主题的单词及其相应概率分布的概述我想知道 python 是否有可用的东西来可视化这些主题 pyLDAvis https pypi python org p
cudaMallocManaged() 返回“不支持的操作”

在 CUDA 6 0 中尝试托管内存给了我operation not supported打电话时cudaMallocManaged include cuda runtime h include

cudaMallocManaged() 返回“不支持的操作”

cudaMallocManaged() 返回“不支持的操作” 的相关文章

随机推荐

热门标签