cos-extensions 安装 gpu 无法在 GCP Compute Engine 虚拟机上下载驱动程序签名

2024-03-13

我正在 GCP 计算引擎上使用支持 GPU 的虚拟机。

作为操作系统,我使用容器优化版本(COS 89-16108.403.47 LTS),它支持通过 SSH 运行“cos-extensions install gpu”来安装简单的 GPU 驱动程序(请参阅谷歌文档 https://cloud.google.com/container-optimized-os/docs/how-to/run-gpus).

到目前为止,这一直工作得很好,直到几天前我开始收到一条错误消息,指出某些驱动程序签名的下载失败(请参阅下面的完整错误消息),从那以后我就无法让它工作。

有人可以确认我在这里遇到错误或帮助我解决此问题吗?

提前谢谢了!

~ $ cos-extensions install gpu
Unable to find image 'gcr.io/cos-cloud/cos-gpu-installer:v2.0.3' locally
v2.0.3: Pulling from cos-cloud/cos-gpu-installer
419e7ae5bb1e: Pull complete 
6f6ec2441524: Pull complete 
11d24f918ba9: Pull complete 
Digest: sha256:1cf2701dc2c3944a93fd06cb6c9eedfabf323425483ba3af294510621bb37d0e
Status: Downloaded newer image for gcr.io/cos-cloud/cos-gpu-installer:v2.0.3
I0618 06:33:49.227680    1502 main.go:21] Checking if this is the only cos_gpu_installer that is running.
I0618 06:33:49.258483    1502 install.go:74] Running on COS build id 16108.403.47
I0618 06:33:49.258505    1502 installer.go:187] Getting the default GPU driver version
I0618 06:33:49.285265    1502 utils.go:72] Downloading gpu_default_version from https://storage.googleapis.com/cos-
tools/16108.403.47/gpu_default_version
I0618 06:33:49.353149    1502 utils.go:120] Successfully downloaded gpu_default_version from https://storage.google
apis.com/cos-tools/16108.403.47/gpu_default_version
I0618 06:33:49.353381    1502 install.go:85] Installing GPU driver version 450.119.04
I0618 06:33:49.353461    1502 cache.go:69] error: failed to read file /root/var/lib/nvidia/.cache: open /root/var/l
ib/nvidia/.cache: no such file or directory
I0618 06:33:49.353482    1502 install.go:120] Did not find cached version, installing the drivers...
I0618 06:33:49.353491    1502 installer.go:82] Configuring driver installation directories
I0618 06:33:49.421021    1502 installer.go:196] Updating container's ld cache
I0618 06:33:49.526673    1502 signature.go:30] Downloading driver signature for version 450.119.04
I0618 06:33:49.526712    1502 utils.go:72] Downloading 450.119.04.signature.tar.gz from https://storage.googleapis.
com/cos-tools/16108.403.47/extensions/gpu/450.119.04.signature.tar.gz
E0618 06:33:49.657028    1502 artifacts.go:106] Failed to download extensions/gpu/450.119.04.signature.tar.gz from 
public GCS: failed to download 450.119.04.signature.tar.gz, status: 404 Not Found
E0618 06:33:49.657487    1502 install.go:175] failed to download driver signature: failed to download driver signat
ure for version 450.119.04: failed to download extensions/gpu/450.119.04.signature.tar.gz

这似乎是一个已知问题,您可以找到已报告的问题here https://issuetracker.google.com/issues/191302490以及具有解决方法的类似线程here https://issuetracker.google.com/issues/164134488.
看起来新 COS 版本的发布和更新驱动程序的发布之间存在延迟。

然而,我跑了cos-extensions list刚才,似乎有可用的驱动程序:

$ cos-extensions list
Available extensions for COS version 89-16108.403.47:

[gpu]
450.119.04 [default]
450.80.02

还有签名:

$ wget https://storage.googleapis.com/cos-tools/16108.403.47/extensions/gpu/450.119.04.signature.tar.gz
--2021-06-21 12:49:58--  https://storage.googleapis.com/cos-tools/16108.403.47/extensions/gpu/450.119.04.signature.tar.gz
Resolving storage.googleapis.com... 173.194.198.128, 64.233.191.128, 173.194.74.128, ...
Connecting to storage.googleapis.com|173.194.198.128|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 4588 (4.5K) [application/octet-stream]
Saving to: '450.119.04.signature.tar.gz'

450.119.04.signature.tar.gz  100%[=============================================>]   4.48K  --.-KB/s    in 0s      

2021-06-21 12:49:58 (62.0 MB/s) - '450.119.04.signature.tar.gz' saved [4588/4588]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

cos-extensions 安装 gpu 无法在 GCP Compute Engine 虚拟机上下载驱动程序签名 的相关文章

  • Spring RESTful控制器方法改进建议

    我是 Spring REST 和 Hibernate 的新手 也就是说 我尝试组合一个企业级控制器方法 我计划将其用作未来开发的模式 您认为可以通过哪些方法来改进 我确信有很多 RequestMapping value user metho
  • IE9-11 检测变换样式:preserve-3d

    我为一个项目制作了一个 3d 类型的菜单 自然 IE 会引起问题 因为 IE10 即使 3d 变换工作 也不支持变换样式 preserve 3d 我尝试了解决方法 通过对 3d 菜单容器的每个子元素应用变换 但至少可以说 动画看起来很糟糕
  • 文本溢出:省略号显示不同的字符

    我这里遇到了一些 CSS 问题 看这张图片 https www flickr com photos 125543025 N07 saved 1 在此图像中 我为文本 INTENSE TRAINING 添加了 CSS 样式 sample st
  • 我们什么时候应该在 Django 中使用“db_index=True”?

    当我们应该定义db index True在模型字段上 我正在尝试优化应用程序并且我想了解更多信息db index 什么情况下我们应该使用它 文档说使用db index True在模型字段上用于加速查找 但在存储和内存方面略有缺点 我们应该使
  • 使用 QtWebEngine 将 C++ 对象暴露给 Qt 中的 Javascript

    使用 QtWebkit 可以通过以下方式将 C 对象公开给 JavascriptQWebFrame addToJavaScriptWindowObject如中所述https stackoverflow com a 20685002 5959
  • Python 中的字符串slugification

    我正在寻找 slugify 字符串的最佳方法 蛞蝓 是什么 https stackoverflow com questions 427102 in django what is a slug 我当前的解决方案基于这个食谱 http code
  • 如何在 kubernetes 中将秘密标记为可选?

    来自文档 除非将秘密标记为可选 否则必须先创建秘密 然后再将其作为环境变量在 pod 中使用 引用不存在的 Secret 将阻止 pod 启动 如何将秘密标记为可选 您正在寻找的是 name ENV NAME valueFrom secre
  • ASP.NET Core MVC 视图组件搜索路径

    在此处的文档中 https learn microsoft com en us aspnet core mvc views view components view aspnetcore 2 2 https learn microsoft
  • xsi:type 属性搞乱了 C# XML 反序列化

    我使用 XSD exe 根据 XML 架构 xsd 文件 自动生成 C 对象 我正在反序列化 OpenCover 输出 但其中一个部分类未正确生成 这是导致异常的行
  • If else 在 Web 网格列中

    如何在 webgrid 列中添加条件 if else grid GetHtml tableStyle table table bordered columns grid Columns grid Column RealName Name g
  • View.post(),以及当Runnables被执行时

    我最初的问题是需要知道我的根的高度和宽度View这样我就可以进行程序化的布局更改 就我的目的而言 我不一定需要在onCreate 对于我来说 以编程方式添加我的孩子就足够了View根布局完成后 因此我很乐意使用onWindowFocusCh
  • Azure Functions 计时器触发器线程安全

    我想知道是否有人知道如果您在 Azure 函数上设置了 Cron 设置 如果其任务执行时间超过 5 分钟 则每 5 分钟运行一次 会发生什么情况 它备份吗 或者我应该实现一个锁定功能 以防止某些东西 例如在循环中 处理先前调用已经处理的数据
  • SimpleIoC - 在缓存中找不到类型:Windows.UI.Xaml.Controls.Frame

    第一次由 SimpleIoC 实例化我的 ViewModel 时 我遇到了以下错误 我相信我已经按应有的方式设置了容器 但由于某种原因 我仍然收到以下错误 任何想法或帮助将非常感激 Microsoft Practices ServiceLo
  • svn 强制迁移

    我正在考虑将我们的 svn 代码库迁移到 perforce 看看谷歌搜索结果 我确实找到了两个具有相同功能的工具 P4转换ftp ftp perforce com pub perforce tools p4convert docs inde
  • React 错误:目标容器不是 DOM 元素

    我刚刚开始使用 React 所以这可能是一个非常简单的错误 但我们开始吧 我的html代码非常简单 load staticfiles
  • 从 JavaScript 中的 OnClientClick 事件中阻止 C# 中的 asp:Button OnClick 事件?

    我有一个asp Button在我的网页上 它调用 JavaScript 函数和代码隐藏方法 后者进行调用以导航到另一个页面 在 JavaScript 函数中 我正在检查条件 如果不满足这个条件 我想中止导航 以便OnClick方法未被调用
  • PLS-00103:遇到符号“;”当预期出现以下情况之一时:

    我正在尝试插入用户安全问题的答案 以用于密码重置功能 Ellucian 横幅 v8 提供了一个用于运行此 API 的 API 我对他们的 API 非常陌生 从下面的错误消息来看 我还远远没有正确运行它 任何帮助表示赞赏 我尝试在 Oracl
  • Keystore getEntry 在 Android 9 上返回 NULL

    c我已对存储在 Android 密钥库中的登录密码进行了加密和解密 在 Android 9 上 我观察到应用程序在尝试解密密码时崩溃 我无法重现它 但拥有 Pixel 3 的用户是崩溃的设备之一 下面是我如何从密钥库解密密码 private
  • 计算包含字母/数字的行数

    我想要实现的目标很简单 但是解释起来有点困难 我不知道在 postgres 中这是否真的可能 我处于相当基础的水平 SELECT FROM WHERE LEFT JOIN ON HAVING 等等基本的东西 我正在尝试计算包含特定字母 数字
  • 如何使用 dql 从数据表中获取唯一值?

    我有一个表 其中有一列存储了各种值 我想使用 dql 从该表中检索唯一值 Doctrine Query create gt select rec school gt from Records rec gt where rec city ci

随机推荐

  • 将单词 (.docx) 转换为 docbook

    我的任务是找到一种将大量 docx 文件转换为 docbook 5 的方法 目前 我们在 openoffice 中打开该文件并保存到 docbook 这是一项耗时的任务 但我相信有更好的方法 然后 这些文件将被进一步处理为我们的自定义rel
  • 如何在 CMake 中删除字符串中的一行文本,解决 CMake 缺乏基于行的正则表达式匹配的问题?

    我发现 CMake 并没有按照我预期的方式执行 RegEx 显然 其他人也遇到了同样的问题 https cmake org pipermail cmake 2007 October 017107 html问题是 CMake 不是基于行的 当
  • Pip无法安装枕头

    当尝试使用 pip 安装枕头时 会产生此错误 我尝试过重新安装安装工具 但没有效果 我在安装了 Diet Pi 的 pi 0 上运行 pip install pillow Looking in indexes https pypi org
  • Objective-C 中的文本解析?

    是否有任何库可以在 Objective C iPhone 应用程序中解析 Textile Textile 到 HTML C 库也可以工作 Update 我在 C Obj C 中找不到任何足够开发的库 但我确实找到了一个用 Javascrip
  • 多态性、泛型和匿名类型 C#

    考虑以下场景 文档 gt 部分 gt 正文 gt 项目 文档有部分 部分包含正文 正文有一些文本和项目列表 这些项目就是问题的内容 有时项目是基本的字符串列表 但有时项目包含自定义数据类型的列表 So public class Docume
  • 为什么 git Remote prune origin 会删除我的本地标签?

    我有几个标记引用来自本地分支和远程跟踪分支的提交 或这些提交的祖先 我想删除对分支和标签的引用origin跑完后git fetch git remote prune origin dry run 但输出表明它会修剪我的本地标签 即使是我手动
  • YDN DB 包含问题

    我已经包含了 YDN DB 文件 ydn db isw core crypt qry dev js 来加密角度应用程序中的索引数据库 它被添加到 socket io 1 4 5 js 之后的 index html 主体部分中 加载器 spi
  • 从 saber API 发出票据

    我们已经成功实施了 sabre 低价搜索和预订工作流程并创建了 PNR 现在 我想使用 api 开具该 PNR 的机票 My workflow is 1 BargainFinderMaxRQ find 2 EnhancedAirBook b
  • 通过surfaceview使用zxing条码阅读器

    我正在创建一个扫码机应用程序 我想使用Zxing要读取条形码 我的应用程序有一个表面视图并向其中显示相机 但现在我想从 SurfaceView 相机扫描条形码 我使用它的原因是我的布局中的表面视图下有两个 Edittexts 来显示条形码的
  • 如何处理损坏的 Git 对象文件?

    当我接近配额时 我做了一次 Git pull 结果 我认为 得到了一个损坏的文件 git pull walk dffbfa18916a9db95ef8fafc6d7d769c29a445aa fatal object d4a0e759949
  • 是否可以从 Scala(spark) 调用 python 函数

    我正在创建一个 Spark 作业 需要使用用 python 编写的函数将列添加到数据帧中 其余的处理是使用 Scala 完成的 我找到了如何从 pyspark 调用 Java Scala 函数的示例 https community hort
  • 安装 MSDeploy 包时如何保留现有文件?

    我需要保留一些由我的网站生成的文件 是否可以使 MSDeploy 不删除任何文件 并且仅当包包含较新版本的文件时才覆盖现有文件 enableRule 跳过新文件规则将跳过对具有较新写入时间的文件的更新 enableRule 不删除规则将阻止
  • 如何移动然后删除MySQL中的字段

    我试图将字段从一个表移动到另一个表 然后从第一个表中删除它 我遇到的问题是它可以很好地移动数据 但不会从第一个表中删除它 这是我的代码 INSERT INTO out tickets SELECT FROM tickets DELETE F
  • 什么推理导致“包含递归定义的序列表达式编译不正确”

    问题尽管尾调用位置存在堆栈溢出 但仅限 64 位 https stackoverflow com q 35751350 1243762导致发现一个bug https github com Microsoft visualfsharp iss
  • 参数类型“Map Function()”无法分配给参数类型“Map

    这最初可能有效 但在 firebase 更新后 现在给我这个错误 我已在给出错误的部分添加了星号 错误消息已添加到代码下方 import package cloud firestore cloud firestore dart class
  • Grails 从服务中渲染视图?

    我刚刚开始在 Grails 中使用服务 在尝试从服务内部渲染页面时遇到问题 我尝试了如下所示的几种方法 但没有成功 服务电话 1 GroupCheckService isEnabled userObjects group notenable
  • 在 AuthorizeAttribute Mvc Core Web Api 中获取控制器实例

    我使用下面的类来控制我的 api 方法请求 并设置 BaseController 类的一些属性以在方法中常用 这个来自 Asp Net Mvc Web Api using System using System Collections Ge
  • 如何使用 R 找到数据中最常见的序列?

    我正在尝试弄清楚如何使用rollapply函数 从Zoo包 来查找数据集中最常见字符串的序列 但我还需要对某些变量 例如日期 行等 进行分组 在进一步讨论之前 值得注意的是 该查询建立在我之前在此发布的一个问题的基础上 如何使用 Table
  • React/Router/MemoryRouter - 如何传递历史属性并在子组件中使用push()?

    我正在构建一个 React 应用程序 我不希望更新浏览器中的 URL 我没有使用 react router dom 而只使用 react router 和 MemoryRouter https reacttraining com react
  • cos-extensions 安装 gpu 无法在 GCP Compute Engine 虚拟机上下载驱动程序签名

    我正在 GCP 计算引擎上使用支持 GPU 的虚拟机 作为操作系统 我使用容器优化版本 COS 89 16108 403 47 LTS 它支持通过 SSH 运行 cos extensions install gpu 来安装简单的 GPU 驱