V100 和 P100 在 Google Compute Engine 上的可用性

2024-04-15

描述

我刚刚尝试了一段时间,使用我的个人帐户设置或保留用于机器学习的虚拟机,我在 n1 上使用了几个月,具有大约 8 GB 或更多 GB RAM 以及用于机器学习的 P100 或 V100,现在尝试了至少一半具有 P100/V100 可用性的区域,并且总是收到如下所示的资源错误:

操作类型 [插入] 失败,并显示消息“区域 'projects/lexical-list-285719/zones/us-central1-c' 没有足够的可用资源来满足请求。请尝试其他区域,或稍后重试。”

zone-x 中没有可用资源。我最近从试用中转过来。

问题:

A)这种情况常见吗?

B) 有解决办法吗?

C) 我可以做什么(如果有的话)来获得具有这些规格或类似性能的机器?

我知道这是因为该区域没有可用的这些规范,我应该尝试切换。我也知道托管实例组。但这不会那么困难,不是吗?

谷歌已经订满了吗?

可能的解决方案

目前我的修复想法是:

  • 多区域托管组(仍需检查我的项目是否与之兼容)
  • 遍历所有可用区域的云 shell 脚本(需要研究 shell 脚本如何工作)

非常感谢任何有此主题经验的人分享他们的解决方案或更好的解决方案的经验。

对我来说一个好的答案是not包括以下任何一项:

  • 区域切换(尝试过)

  • 较小的机器(尝试过,项目不适用于太小的机器)

  • 保留(尝试过)

  • 等待(已经知道这一点,如果我现在想要一台机器,那没有帮助)

不过我建议任何没有那么持久或紧急问题的人也去做这些事情。


这不是问题,这样的事件时有发生。

该错误消息的意思是特定区域的 Google 端没有 CPU/RAM/GPU 等可用资源。您可以在文档中找到更多详细信息VM 创建故障排除 https://cloud.google.com/compute/docs/troubleshooting/troubleshooting-instances#vm-not-created部分资源可用性 https://cloud.google.com/compute/docs/troubleshooting/troubleshooting-vm-creation#resource_availability:

当您尝试在区域中请求新资源时发生资源错误 由于当前无法满足您的请求 Compute Engine 资源,例如 GPU 或 CPU。

资源错误仅适用于区域中的新资源请求,并且不会 不影响现有资源。资源错误与您无关 Compute Engine 配额,仅适用于您在中指定的资源 您发送请求时的请求,而不是发送到中的所有资源 该区域。

资源可用性取决于用户请求,因此是动态的。

有几种方法可以解决这个问题:

  1. 尝试在另一个地方创建您的实例GPU可用的区域 https://cloud.google.com/compute/docs/gpus/gpu-regions-zones (要求增加配额 https://cloud.google.com/compute/quotas#requesting_additional_quota如果需要的话)。
  2. 等待一段时间,然后重试。
  3. 请求一些较小的虚拟机(如果可能),稍后您将能够尝试请求一些更大的虚拟机(与配额请求 https://stackoverflow.com/a/62128974/12428794).
  4. 储备资源 https://cloud.google.com/compute/docs/instances/reserving-zonal-resources对于您的虚拟机,请遵循文档以避免将来出现此类问题(需要额外付款).
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

V100 和 P100 在 Google Compute Engine 上的可用性 的相关文章

  • Google Cloud Text To Speech API 快速入门示例

    我是这个论坛的新手 我正在尝试让 Google Cloud TTS API 正常工作 但遇到了一些问题 页面是 https cloud google com text to speech docs quickstart protocol h
  • google-cloud-sdk 安装在 CentOS /usr/local/bin 中找不到正确的 Python 2.7 版本

    我们的服务器操作系统是CentOS 6 8 我试图安装google cloud sdk 即使我安装了 usr local bin 中的 python 2 7 它仍在查看旧版本 usr bin 中的 python 2 6 我尝试给予expor
  • Amazon s3 putObject 标记不起作用

    我正在尝试使用 putObject 方法上传到 Amazon s3 时添加标签 根据文档 我已将标签创建为字符串类型 我的文件已上传到 Amazon s3 但我无法使用提供的标签数据查看文件对象的对象级别标签 根据文档遵循以下代码示例 va
  • V100 和 P100 在 Google Compute Engine 上的可用性

    描述 我刚刚尝试了一段时间 使用我的个人帐户设置或保留用于机器学习的虚拟机 我在 n1 上使用了几个月 具有大约 8 GB 或更多 GB RAM 以及用于机器学习的 P100 或 V100 现在尝试了至少一半具有 P100 V100 可用性
  • 数据融合 - http post 插件问题

    我正在尝试使用 DataFusion 进行 http 调用 来源 GCS csv 文件 接收器 HTTP POST API 期望该文件作为 HTTP 请求的一部分 执行此操作后 我在 API 日志中收到以下错误 所需的请求部分 文件 不存在
  • 为什么我在部署容器时看到此错误:“错误:(gcloud.run.deploy) PERMISSION_DENIED:调用者没有权限”?

    假设我有一个cloudbuild yaml文件如下所示 还假设我可以在使用时手动运行和部署有问题的容器gcloud用于单独的功能 构建和运行 部署的时候第三步就出现错误ERROR gcloud run deploy PERMISSION D
  • 针对 Google IAP 使用 Salesforce 命名凭据

    Goal 我已经构建了一个在 Google App Engine 上运行的 REST API 受保护谷歌云应用内购买 https cloud google com iap 身份感知代理 我的目标是使用服务帐号 https cloud goo
  • getDownloadUrl 是付费操作吗?

    我想知道是否getDownloadUrl在 Firebase 存储 Google Cloud Storage 上 一种获取存储上文件的公共 URL 的方法 是付费操作 即使读完之后文档 https cloud google com stor
  • 如何检查 Google VM 实例是否已具有 gcloud 凭据

    为了不每次都打电话 gcloud auth login 这会中断用户输入的脚本 我想查看用户是否已经通过身份验证 任何用户 并且只有在没有用户的情况下 才调用gcloud auth login 我想要一个比抓取输出更优雅 可靠的解决方案gc
  • 将变量传递给 Google Cloud Functions

    我刚刚在 Beta Python 3 7 运行时中使用 HTTP 触发器编写了 Google Cloud Function 现在我试图弄清楚如何在调用函数时将字符串变量传递给函数 我已阅读文档 但没有找到任何相关内容 我的触发器类似于 ht
  • Google Dataproc 支持 Apache Impala 吗?

    我刚开始使用云服务 并且浏览 Google 的云平台相当令人生畏 当谈到 Google Dataproc 时 他们确实宣传 Hadoop Spark 和 Hive 我的问题是 Impala 是否可用 我想使用所有这四种工具来做一些基准测试项
  • 允许在 Google 计算引擎 (GCE) 中使用 WebSocket

    我正在使用计算引擎 GCE 通过 Socket IO Node js 运行我的套接字服务器 它仅适用于轮询 当我尝试使用网络客户端时 我收到以下错误代码 WebSocket connection to ws myapp socket app
  • 如何在 Google Dataproc 集群中安装 python 包

    创建并运行集群后 是否可以在 Google Dataproc 集群中安装 python 包 我尝试使用 pip install xxxxxxx 在主命令行中 但它似乎不起作用 Google的Dataproc文档没有提及这种情况 创建集群后
  • Google PubSub / Gmail Webhook:发送电子邮件时始终从 PubSub 接收多个 POST 请求

    我设置了一个 webhook 它使用 Google Cloud PubSub API 和 Java 中的 Gmail API 监听和处理 Gmail 中收件箱和发送文件夹中的更改 我看到的问题是 当我向另一个用户发送消息时 PubSub 似
  • 请求头字段X-Requested

    我正在尝试访问谷歌云存储上的存储桶中的文件 我已经为存储桶设置了 CORS 配置 但当我通过 https 发出请求时 出现此错误 它适用于通过 http 发出的请求 XMLHttpRequest 无法加载 FILENAME 预检响应中的 A
  • Ruby Stack 无法在 Google Developers Console 上部署

    我尝试使用 Google Developers Console 部署 Ruby 堆栈 但没有成功 我在其他项目中尝试了几次 错误总是相同的 如下 你知道为什么它总是失败吗 2014 10 23 15 59 44 rubyStackBox P
  • Kubernetes:无法创建存储库

    我正在跟进Kubernetes 入门指南 http kubernetes io docs hellonode 一切都很顺利 直到我跑步 gcloud docker push gcr io
  • Python Asyncio run_forever() 和任务

    我改编了这段代码 以便在异步 Python 中使用 Google Cloud PubSub https github com cloudfind google pubsub asyncio https github com cloudfin
  • 将文件从远程服务器复制到谷歌云存储桶

    如何将文件从远程服务器复制到 Google 存储桶 例如 gcloud compute scp username server path to file gs my bucket 这个方法会报错 All sources must be lo
  • Jenkinsfile 泊坞窗

    我正在 docker 容器内的 GCE 上运行一个 jenkins 实例 并希望从此 Jenkinsfile 和 Github 执行多分支管道 我正在使用GCE詹金斯 https cloud google com solutions con

随机推荐

  • .NET 中的引导字节顺序

    我正在创建一个像这样的GUID Guid g new Guid new byte 0 1 2 3 4 5 6 7 8 9 0xA 0xB 0xC 0xD 0xE 0xF Console WriteLine g 这输出 03020100 05
  • 无法使用 PySpark 和 Databricks Connect 连接到 Azure Data Lake Gen2

    最近 Databricks 推出Databricks Connect that 允许您使用 Spark 本机 API 编写作业 并让它们在 Azure Databricks 群集上远程执行 而不是在本地 Spark 会话中执行 除非我尝试访
  • 从图片中选择主颜色

    我是 Dart Flutter 框架的新手 我仍在探索它们的可能性 我知道在 Android 中可以拍照并以编程方式从中提取主要颜色值 我想知道 在纯 Dart 中如何实现这一点 我希望它能够兼容 iOS 和 Android 操作系统 这是
  • Clojure 测试:测试断言的否定

    这对我有用 is thrown AbstractMethodError fun obj 1 但这却炸了 is not thrown AbstractMethodError fun obj 1 出现以下错误 java lang Runtime
  • Roslyn:如何加载 Visual Studio 之外的现有项目

    正如这个问题中所写 我可以从 MsBuild Task 类中访问 MsBuildWorkspace 吗 https stackoverflow com questions 27948207 can i access the msbuildw
  • 根据用户输入在 Laravel 中创建新表?

    我正在尝试根据 Laravel 框架中的用户输入创建新的 mysql 表 用户提交一个在控制器中处理的表单 保存表单数据 然后根据用户的输入创建一个新表 以便稍后接收数据 在 Laravel 中 可以使用 schema create 创建表
  • 使用 unique_ptr 的 value_type 构造 unordered_map

    这段代码似乎不起作用 因为唯一的指针被存储到一个pair对象中 然后尝试从中复制 这可以避免吗 std unordered map
  • OpenGL C++ 鼠标光线拾取 glm:unproject

    我目前正在开发 C 游戏引擎 我想在应用程序中构建鼠标交互 我之前通过光线拾取完成了此操作 但当时我使用了固定的鼠标位置 现在我想不使用它 我读到您可以使用 glm unProject 函数来执行此操作 但我的函数不起作用 该函数给出的坐标
  • 分页:找出项目所在的页面(给定主键和排序顺序)

    假设我像这样进行分页 SELECT article id article content FROM articles ORDER BY article rating OFFSET page 1 items per page LIMIT it
  • git push origin 和 git push origin master 有什么区别

    将本地 git 存储库的 master 分支推送到名为 origin 的远程存储库的 master 分支有什么区别吗 git push origin master或与git push origin 默认动作为git push and git
  • Go中如何使用剪贴板?

    如何使用 Go 复制到剪贴板或从中获取数据 我有点担心有文档中没有结果 http golang org search q clipboard and 谷歌给了我这个结果 https groups google com forum msg g
  • OpenGL alpha 测试 - 如何替换已弃用的 AlphaFunc?

    我正在尝试用 Alpha 绘制球体 但我的 Z 缓冲区有问题 有些像素是透明的 但会写入 Zbuffer 因此后面的不透明像素会被隐藏 这是我的设置 gl Enable gl DEPTH TEST gl DepthFunc gl LEQUA
  • 哪些 Java 库可用于生成 KML? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 如何正确计算两个日期之间的实际月份数?

    我已经按照方法getDiffDateMap计算两个日期之间的差异并返回Map分别表示毫秒 秒 分钟 小时 天 月和年的整数 public static Map
  • 业务逻辑是主观的吗? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 使用 Visual Studio 2013 和 Intel Fortran 编译混合 C++/C 代码

    我正在尝试编译一个简单的 C Fortran 混合程序 但存在链接问题 我使用的是Visual Studio 2013 Ultimate和Intel Visual Fortran Compiler XE 14 该程序非常简单 是从网上的某个
  • 我正在制作 PEMDAS 求解器,但不知道该写什么

    我正在尝试做一个PEMDAS https en wikipedia org wiki Order of operations用户输入 PEMDAS 问题的求解器 例如 他们输入 4 4 2 5 程序就会为他们解答 是否有任何代码可以让 py
  • OnNewText 事件后何时重绘 VirtualTreeView?

    我使用此代码来填充 VirtualStringTree 并允许重命名项目 Structure for the tree struct TVSTdata UnicodeString Name Initialization o
  • 如何停止散景服务器?

    我确实使用散景来绘制本地 LAN 上的实时传感器数据 Bokeh 是使用 popen 从我的 python 应用程序中启动的 Popen bokeh serve host localhost 5006 host 192 168 8 100
  • V100 和 P100 在 Google Compute Engine 上的可用性

    描述 我刚刚尝试了一段时间 使用我的个人帐户设置或保留用于机器学习的虚拟机 我在 n1 上使用了几个月 具有大约 8 GB 或更多 GB RAM 以及用于机器学习的 P100 或 V100 现在尝试了至少一半具有 P100 V100 可用性