CUDA 调试 - Windows 工作站上的 VS,Linux 服务器上的 GPU?

2024-03-14

有人有过在工作站上编码时在服务器上调试 CUDA 代码的经验吗?

我的笔记本电脑 (Thinkpad T400) 不支持 CUDA,但我可以访问带有一对运行 Linux 的 NVIDIA GTX 295 卡的服务器。

我可以使用 NVidia 的 Visual Studio 工具在服务器上进行远程调试吗?

如果做不到这一点,我的笔记本电脑上还运行着一个 Ubuntu 虚拟机。 Linux下有没有可以在服务器上使用的调试器?

我真的不想再买一台带有双 NVidia 卡的笔记本电脑。


在远程 Linux 机器(比如你的服务器)上用 c 语言开发是很常见的。您可以从任何客户端(例如您的笔记本电脑)通过 ssh 连接到服务器来编译和运行代码,就像您坐在计算机前一样,并且可以使用gdb http://www.gnu.org/software/gdb/在终端中调试您的代码。您还可以使用ddd http://www.gnu.org/software/ddd/作为 gdb 或 Linux IDE 的图形前端,例如eclipse http://www.eclipse.org/linuxtools/通过 ssh 转发 X11。

您可以使用cuda-gdb http://developer.nvidia.com/content/cuda-gdb以完全相同的方式在终端中调试 CUDA 代码。不幸的是,目前还没有适用于 Linux 的 Visual Cuda 调试器。但是,看来您可以将 ddd 与 cuda-gdb 一起使用[source] http://forums.nvidia.com/index.php?showtopic=87996,因为你有两个 GPU。我不确定在 Eclipse 中使用 cuda-gdb http://forums.nvidia.com/index.php?showtopic=153283.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA 调试 - Windows 工作站上的 VS,Linux 服务器上的 GPU? 的相关文章

  • Delphi 2010远程调试-无法使断点工作

    我最近发布了这个问题 https stackoverflow com questions 4579654 no breakpoints when remote debugging with delphi 2010 so stuck on d
  • 使用 Intellij 在远程服务器上部署/调试 Java 代码

    我想在远程服务器上运行我的java代码以获得更快的速度 该服务器非常强大 我想要的是将我的 Intellij 连接到该远程服务器并运行我的代码 但我仍然想在我的本地计算机 即我的笔记本电脑 上使用 IntelliJ 我在 IntelliJ
  • Windows 调试工具未安装

    我正在尝试通过 Windows SDK 安装 Windows 调试工具 两次尝试后我不知道该怎么做 我开始安装 没有收到任何错误 但调试工具 windbg 和 kd 却找不到 日志几乎毫无用处 9 16 59 PM Monday July
  • 无法从静态初始化代码启动 CUDA 内核

    我有一个在其构造函数中调用内核的类 如下所示 标量场 h include
  • 构建 Erlang 服务器场(用于业余爱好项目)最便宜的方法是什么? [关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 假设我们有一个 本质上并行 的问题需要用 Erlang 软件来解决 我们有很多并行进程 每个进程都执行顺序代码 不是数字运算 并且我们向它们投入的 C
  • CUDA错误:在python中使用并行时初始化错误

    我的代码使用 CUDA 但运行速度仍然很慢 因此 我将其更改为使用 python 中的多处理 pool map 并行运行 但我有CUDA ERROR initialization error 这是函数 def step M self ite
  • 使用常量内存打印地址而不是cuda中的值

    我试图在代码中使用常量内存 并从内核分配常量内存值 而不是使用 cudacopytosymbol include
  • libstdc++.so.6 与 cuda 相关的链接器问题

    今天我在链接我编译的 cuda 内容时遇到了问题 我有一个最新的 debian 测试 w 2 6 32 3 amd64 我整天都在写我的代码 不时编译 没有问题 但在进行了较小的代码更改后 我收到以下错误 gcc o pa CUDA o h
  • Cuda Bayer/CFA 去马赛克示例

    我编写了一个 CUDA4 Bayer 去马赛克例程 但它比在 16 核 GTS250 上运行的单线程 CPU 代码慢 块大小是 16 16 图像暗淡是 16 的倍数 但更改此值并不会改善它 我做了什么明显愚蠢的事情吗 calling rou
  • cudaMallocManaged() 返回“不支持的操作”

    在 CUDA 6 0 中尝试托管内存给了我operation not supported打电话时cudaMallocManaged include cuda runtime h include
  • 在 cuda 的 nvcc 编译器中使用 C++20

    我正在尝试使用std countr zero 函数从
  • IntelliJ 调试器:连接但不会注意到代码何时遇到断点

    我尝试使用 IntelliJ IDEA 11 1 Ultimate 调试应用程序服务器 WebLogic 调试器配置以前有效 我没有更改任何内容 发生的情况是 IntelliJ 告诉我 连接到目标虚拟机 地址 snip 9009 传输 so
  • CUDA程序导致nvidia驱动程序崩溃

    当我超过大约 500 次试验和 256 个完整块时 我的 monte carlo pi 计算 CUDA 程序导致我的 nvidia 驱动程序崩溃 这似乎发生在 monteCarlo 内核函数中 任何帮助都会受到赞赏 include
  • CUDA素数生成

    当数据大小增加超过 260k 时 我的 CUDA 程序停止工作 它不打印任何内容 有人能告诉我为什么会发生这种情况吗 这是我的第一个 CUDA 程序 如果我想要更大的素数 如何在 CUDA 上使用大于 long long int 的数据类型
  • CUDA Thrust 和 sort_by_key

    我正在寻找 CUDA 上的排序算法 它可以对元素数组 A 双精度 进行排序 并返回该数组 A 的键 B 数组 我知道sort by keyThrust 库中的函数 但我希望元素数组 A 保持不变 我能做些什么 我的代码是 void sort
  • 是否可以使用 Visual Studio 远程调试 VirtualBox?

    我在 Sun 的开源平台上运行我们应用程序的不同版本虚拟盒子 http www virtualbox org 是否可以使用 Visual Studio 从主机操作系统远程调试应用程序 问题是 在 Visual Studio 中 当我想要连接
  • 如何并行从数组中删除零值

    如何使用 CUDA 并行有效地从数组中删除零值 有关零值数量的信息是预先可用的 这应该可以简化这项任务 重要的是数字必须保持源数组中的顺序 当被复制到结果数组时 Example 该数组将例如包含以下值 0 0 19 7 0 3 5 0 0
  • Nvcc 的版本与 CUDA 不同

    我安装了 cuda 7 但是当我点击 nvcc version 时 它打印出 6 5 我想在 GTX 960 卡上安装 Theano 库 但它需要 nvcc 7 0 我尝试重新安装cuda 但它没有更新nvcc 当我运行 apt get i
  • 无法在 CUDA 中执行设备内核

    我正在尝试在全局内核中调用设备内核 我的全局内核是矩阵乘法 我的设备内核正在查找乘积矩阵每列中的最大值和索引 以下是代码 device void MaxFunction float Pd float max int x threadIdx
  • PyCharm 上的远程调试

    我的源代码存储在远程计算机上 我想远程编码和调试我的Python源代码 我应该如何配置PyCharm启用远程调试 对于远程调试 您需要将源代码复制到本地计算机 设置项目 配置到远程计算机的部署并添加远程 Python 解释器以在远程系统上运

随机推荐