V100 和 P100 在 Google Compute Engine 上的可用性

2024-04-15

描述

我刚刚尝试了一段时间，使用我的个人帐户设置或保留用于机器学习的虚拟机，我在 n1 上使用了几个月，具有大约 8 GB 或更多 GB RAM 以及用于机器学习的 P100 或 V100，现在尝试了至少一半具有 P100/V100 可用性的区域，并且总是收到如下所示的资源错误：

操作类型 [插入] 失败，并显示消息“区域 'projects/lexical-list-285719/zones/us-central1-c' 没有足够的可用资源来满足请求。请尝试其他区域，或稍后重试。”

zone-x 中没有可用资源。我最近从试用中转过来。

问题：

A）这种情况常见吗？

B) 有解决办法吗？

C) 我可以做什么（如果有的话）来获得具有这些规格或类似性能的机器？

我知道这是因为该区域没有可用的这些规范，我应该尝试切换。我也知道托管实例组。但这不会那么困难，不是吗？

谷歌已经订满了吗？

可能的解决方案

目前我的修复想法是：

多区域托管组（仍需检查我的项目是否与之兼容）
遍历所有可用区域的云 shell 脚本（需要研究 shell 脚本如何工作）

非常感谢任何有此主题经验的人分享他们的解决方案或更好的解决方案的经验。

⁣

对我来说一个好的答案是not包括以下任何一项：

区域切换（尝试过）
较小的机器（尝试过，项目不适用于太小的机器）
保留（尝试过）
等待（已经知道这一点，如果我现在想要一台机器，那没有帮助）

不过我建议任何没有那么持久或紧急问题的人也去做这些事情。

这不是问题，这样的事件时有发生。

该错误消息的意思是特定区域的 Google 端没有 CPU/RAM/GPU 等可用资源。您可以在文档中找到更多详细信息VM 创建故障排除 https://cloud.google.com/compute/docs/troubleshooting/troubleshooting-instances#vm-not-created部分资源可用性 https://cloud.google.com/compute/docs/troubleshooting/troubleshooting-vm-creation#resource_availability:

当您尝试在区域中请求新资源时发生资源错误由于当前无法满足您的请求 Compute Engine 资源，例如 GPU 或 CPU。

资源错误仅适用于区域中的新资源请求，并且不会不影响现有资源。资源错误与您无关 Compute Engine 配额，仅适用于您在中指定的资源您发送请求时的请求，而不是发送到中的所有资源该区域。

资源可用性取决于用户请求，因此是动态的。

有几种方法可以解决这个问题:

尝试在另一个地方创建您的实例GPU可用的区域 https://cloud.google.com/compute/docs/gpus/gpu-regions-zones (要求增加配额 https://cloud.google.com/compute/quotas#requesting_additional_quota如果需要的话）。
等待一段时间，然后重试。
请求一些较小的虚拟机（如果可能），稍后您将能够尝试请求一些更大的虚拟机（与配额请求 https://stackoverflow.com/a/62128974/12428794).
储备资源 https://cloud.google.com/compute/docs/instances/reserving-zonal-resources对于您的虚拟机，请遵循文档以避免将来出现此类问题（需要额外付款).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

V100 和 P100 在 Google Compute Engine 上的可用性的相关文章

Google Cloud Text To Speech API 快速入门示例

我是这个论坛的新手我正在尝试让 Google Cloud TTS API 正常工作但遇到了一些问题页面是 https cloud google com text to speech docs quickstart protocol h
google-cloud-sdk 安装在 CentOS /usr/local/bin 中找不到正确的 Python 2.7 版本

我们的服务器操作系统是CentOS 6 8 我试图安装google cloud sdk 即使我安装了 usr local bin 中的 python 2 7 它仍在查看旧版本 usr bin 中的 python 2 6 我尝试给予expor
Amazon s3 putObject 标记不起作用

我正在尝试使用 putObject 方法上传到 Amazon s3 时添加标签根据文档我已将标签创建为字符串类型我的文件已上传到 Amazon s3 但我无法使用提供的标签数据查看文件对象的对象级别标签根据文档遵循以下代码示例 va
V100 和 P100 在 Google Compute Engine 上的可用性

描述我刚刚尝试了一段时间使用我的个人帐户设置或保留用于机器学习的虚拟机我在 n1 上使用了几个月具有大约 8 GB 或更多 GB RAM 以及用于机器学习的 P100 或 V100 现在尝试了至少一半具有 P100 V100 可用性
数据融合 - http post 插件问题

我正在尝试使用 DataFusion 进行 http 调用来源 GCS csv 文件接收器 HTTP POST API 期望该文件作为 HTTP 请求的一部分执行此操作后我在 API 日志中收到以下错误所需的请求部分文件不存在
为什么我在部署容器时看到此错误：“错误：(gcloud.run.deploy) PERMISSION_DENIED：调用者没有权限”？

假设我有一个cloudbuild yaml文件如下所示还假设我可以在使用时手动运行和部署有问题的容器gcloud用于单独的功能构建和运行部署的时候第三步就出现错误ERROR gcloud run deploy PERMISSION D
针对 Google IAP 使用 Salesforce 命名凭据

Goal 我已经构建了一个在 Google App Engine 上运行的 REST API 受保护谷歌云应用内购买 https cloud google com iap 身份感知代理我的目标是使用服务帐号 https cloud goo
getDownloadUrl 是付费操作吗？

我想知道是否getDownloadUrl在 Firebase 存储 Google Cloud Storage 上一种获取存储上文件的公共 URL 的方法是付费操作即使读完之后文档 https cloud google com stor
如何检查 Google VM 实例是否已具有 gcloud 凭据

为了不每次都打电话 gcloud auth login 这会中断用户输入的脚本我想查看用户是否已经通过身份验证任何用户并且只有在没有用户的情况下才调用gcloud auth login 我想要一个比抓取输出更优雅可靠的解决方案gc
将变量传递给 Google Cloud Functions

我刚刚在 Beta Python 3 7 运行时中使用 HTTP 触发器编写了 Google Cloud Function 现在我试图弄清楚如何在调用函数时将字符串变量传递给函数我已阅读文档但没有找到任何相关内容我的触发器类似于 ht
Google Dataproc 支持 Apache Impala 吗？

我刚开始使用云服务并且浏览 Google 的云平台相当令人生畏当谈到 Google Dataproc 时他们确实宣传 Hadoop Spark 和 Hive 我的问题是 Impala 是否可用我想使用所有这四种工具来做一些基准测试项
允许在 Google 计算引擎 (GCE) 中使用 WebSocket

我正在使用计算引擎 GCE 通过 Socket IO Node js 运行我的套接字服务器它仅适用于轮询当我尝试使用网络客户端时我收到以下错误代码 WebSocket connection to ws myapp socket app
如何在 Google Dataproc 集群中安装 python 包

创建并运行集群后是否可以在 Google Dataproc 集群中安装 python 包我尝试使用 pip install xxxxxxx 在主命令行中但它似乎不起作用 Google的Dataproc文档没有提及这种情况创建集群后
Google PubSub / Gmail Webhook：发送电子邮件时始终从 PubSub 接收多个 POST 请求

我设置了一个 webhook 它使用 Google Cloud PubSub API 和 Java 中的 Gmail API 监听和处理 Gmail 中收件箱和发送文件夹中的更改我看到的问题是当我向另一个用户发送消息时 PubSub 似
请求头字段X-Requested

我正在尝试访问谷歌云存储上的存储桶中的文件我已经为存储桶设置了 CORS 配置但当我通过 https 发出请求时出现此错误它适用于通过 http 发出的请求 XMLHttpRequest 无法加载 FILENAME 预检响应中的 A
Ruby Stack 无法在 Google Developers Console 上部署

我尝试使用 Google Developers Console 部署 Ruby 堆栈但没有成功我在其他项目中尝试了几次错误总是相同的如下你知道为什么它总是失败吗 2014 10 23 15 59 44 rubyStackBox P
Kubernetes：无法创建存储库

我正在跟进Kubernetes 入门指南 http kubernetes io docs hellonode 一切都很顺利直到我跑步 gcloud docker push gcr io
Python Asyncio run_forever() 和任务

我改编了这段代码以便在异步 Python 中使用 Google Cloud PubSub https github com cloudfind google pubsub asyncio https github com cloudfin
将文件从远程服务器复制到谷歌云存储桶

如何将文件从远程服务器复制到 Google 存储桶例如 gcloud compute scp username server path to file gs my bucket 这个方法会报错 All sources must be lo
Jenkinsfile 泊坞窗

我正在 docker 容器内的 GCE 上运行一个 jenkins 实例并希望从此 Jenkinsfile 和 Github 执行多分支管道我正在使用GCE詹金斯 https cloud google com solutions con

随机推荐

.NET 中的引导字节顺序

我正在创建一个像这样的GUID Guid g new Guid new byte 0 1 2 3 4 5 6 7 8 9 0xA 0xB 0xC 0xD 0xE 0xF Console WriteLine g 这输出 03020100 05
无法使用 PySpark 和 Databricks Connect 连接到 Azure Data Lake Gen2

最近 Databricks 推出Databricks Connect that 允许您使用 Spark 本机 API 编写作业并让它们在 Azure Databricks 群集上远程执行而不是在本地 Spark 会话中执行除非我尝试访
从图片中选择主颜色

我是 Dart Flutter 框架的新手我仍在探索它们的可能性我知道在 Android 中可以拍照并以编程方式从中提取主要颜色值我想知道在纯 Dart 中如何实现这一点我希望它能够兼容 iOS 和 Android 操作系统这是
Clojure 测试：测试断言的否定

这对我有用 is thrown AbstractMethodError fun obj 1 但这却炸了 is not thrown AbstractMethodError fun obj 1 出现以下错误 java lang Runtime
Roslyn：如何加载 Visual Studio 之外的现有项目

正如这个问题中所写我可以从 MsBuild Task 类中访问 MsBuildWorkspace 吗 https stackoverflow com questions 27948207 can i access the msbuildw
根据用户输入在 Laravel 中创建新表？

我正在尝试根据 Laravel 框架中的用户输入创建新的 mysql 表用户提交一个在控制器中处理的表单保存表单数据然后根据用户的输入创建一个新表以便稍后接收数据在 Laravel 中可以使用 schema create 创建表
使用 unique_ptr 的 value_type 构造 unordered_map

这段代码似乎不起作用因为唯一的指针被存储到一个pair对象中然后尝试从中复制这可以避免吗 std unordered map
OpenGL C++ 鼠标光线拾取 glm:unproject

我目前正在开发 C 游戏引擎我想在应用程序中构建鼠标交互我之前通过光线拾取完成了此操作但当时我使用了固定的鼠标位置现在我想不使用它我读到您可以使用 glm unProject 函数来执行此操作但我的函数不起作用该函数给出的坐标
分页：找出项目所在的页面（给定主键和排序顺序）

假设我像这样进行分页 SELECT article id article content FROM articles ORDER BY article rating OFFSET page 1 items per page LIMIT it
git push origin 和 git push origin master 有什么区别

将本地 git 存储库的 master 分支推送到名为 origin 的远程存储库的 master 分支有什么区别吗 git push origin master或与git push origin 默认动作为git push and git
Go中如何使用剪贴板？

如何使用 Go 复制到剪贴板或从中获取数据我有点担心有文档中没有结果 http golang org search q clipboard and 谷歌给了我这个结果 https groups google com forum msg g
OpenGL alpha 测试 - 如何替换已弃用的 AlphaFunc？

我正在尝试用 Alpha 绘制球体但我的 Z 缓冲区有问题有些像素是透明的但会写入 Zbuffer 因此后面的不透明像素会被隐藏这是我的设置 gl Enable gl DEPTH TEST gl DepthFunc gl LEQUA
哪些 Java 库可用于生成 KML？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何正确计算两个日期之间的实际月份数？

我已经按照方法getDiffDateMap计算两个日期之间的差异并返回Map分别表示毫秒秒分钟小时天月和年的整数 public static Map
业务逻辑是主观的吗？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
使用 Visual Studio 2013 和 Intel Fortran 编译混合 C++/C 代码

我正在尝试编译一个简单的 C Fortran 混合程序但存在链接问题我使用的是Visual Studio 2013 Ultimate和Intel Visual Fortran Compiler XE 14 该程序非常简单是从网上的某个
我正在制作 PEMDAS 求解器，但不知道该写什么

我正在尝试做一个PEMDAS https en wikipedia org wiki Order of operations用户输入 PEMDAS 问题的求解器例如他们输入 4 4 2 5 程序就会为他们解答是否有任何代码可以让 py
OnNewText 事件后何时重绘 VirtualTreeView？

我使用此代码来填充 VirtualStringTree 并允许重命名项目 Structure for the tree struct TVSTdata UnicodeString Name Initialization o
如何停止散景服务器？

我确实使用散景来绘制本地 LAN 上的实时传感器数据 Bokeh 是使用 popen 从我的 python 应用程序中启动的 Popen bokeh serve host localhost 5006 host 192 168 8 100
V100 和 P100 在 Google Compute Engine 上的可用性

描述我刚刚尝试了一段时间使用我的个人帐户设置或保留用于机器学习的虚拟机我在 n1 上使用了几个月具有大约 8 GB 或更多 GB RAM 以及用于机器学习的 P100 或 V100 现在尝试了至少一半具有 P100 V100 可用性

V100 和 P100 在 Google Compute Engine 上的可用性

描述

问题：

可能的解决方案

V100 和 P100 在 Google Compute Engine 上的可用性 的相关文章

随机推荐

热门标签

V100 和 P100 在 Google Compute Engine 上的可用性的相关文章