我正在尝试在启用 GPU 的情况下在 Google Colab 上初始化张量。
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
t = torch.tensor([1,2], device=device)
但我收到了这个奇怪的错误。
RuntimeError: CUDA error: device-side assert triggered
CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1
即使将该环境变量设置为 1 似乎也没有显示任何进一步的细节。
有人遇到过这个问题吗?
虽然我尝试了您的代码,并且它没有给我错误,但我可以说,通常调试 CUDA Runtime Errors: device-sideassert 像您这样的最佳实践是将协作转向 CPU 并重新创建错误。它会给你一个更有用的回溯错误。
大多数时候,CUDA 运行时错误可能是导致某些索引不匹配的原因,就像您尝试在具有 15 个标签的数据集上训练具有 10 个输出节点的网络一样。这个 CUDA 错误的问题是,一旦您收到此错误一次,您使用 torch.tensors 执行的每个操作都会收到该错误。这会强制您重新启动笔记本。
我建议您重新启动笔记本,通过转移到 CPU 来获得更准确的回溯,并检查其余代码,特别是当您在某处的目标集上训练模型时。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)