描述
我刚刚尝试了一段时间,使用我的个人帐户设置或保留用于机器学习的虚拟机,我在 n1 上使用了几个月,具有大约 8 GB 或更多 GB RAM 以及用于机器学习的 P100 或 V100,现在尝试了至少一半具有 P100/V100 可用性的区域,并且总是收到如下所示的资源错误:
操作类型 [插入] 失败,并显示消息“区域 'projects/lexical-list-285719/zones/us-central1-c' 没有足够的可用资源来满足请求。请尝试其他区域,或稍后重试。”
zone-x 中没有可用资源。我最近从试用中转过来。
问题:
A)这种情况常见吗?
B) 有解决办法吗?
C) 我可以做什么(如果有的话)来获得具有这些规格或类似性能的机器?
我知道这是因为该区域没有可用的这些规范,我应该尝试切换。我也知道托管实例组。但这不会那么困难,不是吗?
谷歌已经订满了吗?
可能的解决方案
目前我的修复想法是:
- 多区域托管组(仍需检查我的项目是否与之兼容)
- 遍历所有可用区域的云 shell 脚本(需要研究 shell 脚本如何工作)
非常感谢任何有此主题经验的人分享他们的解决方案或更好的解决方案的经验。
对我来说一个好的答案是not包括以下任何一项:
不过我建议任何没有那么持久或紧急问题的人也去做这些事情。
这不是问题,这样的事件时有发生。
该错误消息的意思是特定区域的 Google 端没有 CPU/RAM/GPU 等可用资源。您可以在文档中找到更多详细信息VM 创建故障排除 https://cloud.google.com/compute/docs/troubleshooting/troubleshooting-instances#vm-not-created部分资源可用性 https://cloud.google.com/compute/docs/troubleshooting/troubleshooting-vm-creation#resource_availability:
当您尝试在区域中请求新资源时发生资源错误
由于当前无法满足您的请求
Compute Engine 资源,例如 GPU 或 CPU。
资源错误仅适用于区域中的新资源请求,并且不会
不影响现有资源。资源错误与您无关
Compute Engine 配额,仅适用于您在中指定的资源
您发送请求时的请求,而不是发送到中的所有资源
该区域。
资源可用性取决于用户请求,因此是动态的。
有几种方法可以解决这个问题:
- 尝试在另一个地方创建您的实例GPU可用的区域 https://cloud.google.com/compute/docs/gpus/gpu-regions-zones (要求增加配额 https://cloud.google.com/compute/quotas#requesting_additional_quota如果需要的话)。
- 等待一段时间,然后重试。
- 请求一些较小的虚拟机(如果可能),稍后您将能够尝试请求一些更大的虚拟机(与配额请求 https://stackoverflow.com/a/62128974/12428794).
-
储备资源 https://cloud.google.com/compute/docs/instances/reserving-zonal-resources对于您的虚拟机,请遵循文档以避免将来出现此类问题(需要额外付款).
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)