AI Platform 中的 PyTorch 模型部署

2023-11-29

我正在 Google Cloud AI Platform 中部署 Pytorch 模型，出现以下错误：

ERROR: (gcloud.beta.ai-platform.versions.create) Create Version failed. Bad model detected with error: Model requires more memory than allowed. Please try to decrease the model size and re-deploy. If you continue to have error, please contact Cloud ML.

配置：

setup.py

from setuptools import setup

REQUIRED_PACKAGES = ['torch']

setup(
    name="iris-custom-model",
    version="0.1",
    scripts=["model.py"],
    install_requires=REQUIRED_PACKAGES
)

模型版本创建

MODEL_VERSION='v1'
RUNTIME_VERSION='1.15'
MODEL_CLASS='model.PyTorchIrisClassifier'

!gcloud beta ai-platform versions create {MODEL_VERSION} --model={MODEL_NAME} \
            --origin=gs://{BUCKET}/{GCS_MODEL_DIR} \
            --python-version=3.7 \
            --runtime-version={RUNTIME_VERSION} \
            --package-uris=gs://{BUCKET}/{GCS_PACKAGE_URI} \
            --prediction-class={MODEL_CLASS}

需要使用与云AI平台兼容的Pytorch编译包包信息here

这个桶包含与 Cloud AI Platform 预测兼容的 PyTorch 编译包。这些文件是从官方版本镜像的https://download.pytorch.org/whl/cpu/torch_stable.html

来自文档

为了在Cloud AI Platform Online上部署PyTorch模型预测，您必须将这些包之一添加到 packageURI 中您部署的版本上的字段。选择与您的 Python 匹配的包和 PyTorch 版本。包名称遵循以下模板：

包名 =torch-{TORCH_VERSION_NUMBER}-{PYTHON_VERSION}-linux_x86_64.whl在哪里PYTHON_VERSION= cp35-cp35m 适用于具有运行时版本的 Python 3 = 1.15 的 Python 3

例如，如果我要部署基于 PyTorch 的 PyTorch 模型 1.1.0 和 Python 3，我的 gcloud 命令如下所示：
gcloud beta ai-platform versions create {VERSION_NAME} --model {MODEL_NAME} 
 ...
--package-uris=gs://{MY_PACKAGE_BUCKET}/my_package-0.1.tar.gz,gs://cloud->ai-pytorch/torch-1.1.0-cp35-cp35m-linux_x86_64.whl

总之：

1) 删除torch从你的install_requires依赖于setup.py

2) 包括torch创建版本模型时的包。

!gcloud beta ai-platform versions create {VERSION_NAME} --model {MODEL_NAME} \
 --origin=gs://{BUCKET}/{MODEL_DIR}/ \
 --python-version=3.7 \
 --runtime-version={RUNTIME_VERSION} \
 --package-uris=gs://{BUCKET}/{PACKAGES_DIR}/text_classification-0.1.tar.gz,gs://cloud-ai-pytorch/torch-1.3.1+cpu-cp37-cp37m-linux_x86_64.whl \
 --prediction-class=model_prediction.CustomModelPrediction

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

googlecloudml

AI Platform 中的 PyTorch 模型部署的相关文章

我收到错误消息，服务帐户无法读取 gs:// 路径

我用于 ML 作业的 GCS 存储桶遇到访问错误如何确保服务帐户具有所需的权限我通过输入以下内容解决了这个问题 gcloud beta ml 初始化项目请参阅下面的详细信息 https cloud google com ml docs
使用 keras 在 gcloud ml-engine 上处理 TB 数据的最佳方法

我想使用 gcloud 存储上约 2TB 的图像数据训练模型我将图像数据保存为单独的 tfrecords 并尝试按照此示例使用张量流数据 api https medium com moritzkrger speeding up keras
定义云机器学习预测的实例键（索引号）

我遵循了入门云机器学习引擎教程并进行部署我可以将包含 JSON 实例的输入文件传递给批量预测服务它会返回包含预测的文件如何通过应用程序图不改变地传递实例键索引号以便预测包含该键并且我知道哪个 JSON 预测属于哪个 JSON
无法在 google cloud ml 上进行预测，而相同的模型正在本地计算机上运行

我正在尝试使用谷歌云中的张量流库训练机器学习模型创建存储桶后我可以在云中训练模型当我尝试使用现有模型进行预测时我遇到了这个问题代码和数据可以在以下 Github 目录中找到 https github com terminator1
Google Cloud ML Engine - 作业因内部错误而失败。无法执行作业

这是我之前训练成功的一个ml job 但当我今天尝试时它不起作用所以在那之后我尝试删除桶中的所有东西并重新开始但它仍然不起作用给出以下错误发生内部错误请在几分钟后重试如果您仍然遇到错误请联系 Cloud ML None
在Google云机器学习上部署Retrained inception模型

我设法使用通用初始模型重新训练我的特定分类模型tutorial 我现在想将其部署在谷歌云机器学习上steps 我已经设法将其导出为 MetaGraph 但我无法获得正确的输入和输出在本地使用它我的图表入口点是DecodeJpeg con
如何将 CloudML Alpha 模型转换为 SavedModel？

在CloudML在线预测服务的alpha版本中导出模型的格式为 inputs x x y bytes y g add to collection inputs json dumps inputs outputs a a b bytes b
使用每晚 TensorFlow 构建通过 Cloud ML Engine 进行训练

如果我需要在 Cloud ML Engine 训练作业中使用夜间 TensorFlow 构建该怎么做从以下位置下载每晚构建版本https github com tensorflow tensorflow installation htt
预测失败：内容必须是标量

我已成功训练导出并上传我的 retrained graph pb 到 ML Engine 我的导出脚本如下 import tensorflow as tf from tensorflow python saved model import
在 Vertex AI 上的 Kubeflow Pipelines 中运行 ID

我正在尝试使用 GCP 上的新 Vertex AI 运行 Kubeflow Pipelines 以前在 Kubeflow Pipelines 中我能够通过利用在我的 Pipeline 中使用运行 IDdsl RUN ID PLACEHO
资源上的权限“artifactregistry.repositories.downloadArtifacts”被拒绝

虽然工件存储库已成功创建但即使向我在 gcloud cli 上使用的会计授予所有工件权限后运行 docker Push 将图像推送到 google 工件注册表也会失败并出现权限错误推送图片的命令 docker push us cent
腌制的 scipy 稀疏矩阵作为输入数据？

我正在研究一个多类分类问题其中包括对简历进行分类我使用 sklearn 及其 TfIdfVectorizer 来获得一个大的 scipy 稀疏矩阵在酸洗后将其输入到 Tensorflow 模型中在我的本地计算机上我加载它将小批量
如何将base64编码的图像传递给Tensorflow预测？

我有一个 google cloud ml 模型我可以通过传递 float32 的 3 维数组来运行预测 instances input 0 0 0 5 0 8 然而这不是传输图像的有效格式所以我想传递 base64 编码的 png 或
如何使用 Tensorflow 对象检测 API 继续训练对象检测模型？

我在用着Tensorflow 对象检测 API https github com tensorflow models tree master research object detection tensorflow object detec
Google Cloud AI 平台上的 Tensorflow 2

Google Cloud AI 平台何时支持 Tensorflow 2 有消息吗根据列表 1 15是最后支持的版本 https cloud google com ml engine docs runtime version list ht
导入错误：没有名为 cloud.ml 的模块

我正在尝试按照说明在张量流中使用本地预测如下所述here https cloud google com sdk gcloud reference ml engine local predict 运行命令gcloud ml engine l
Google Cloud ML：输出的外部尺寸必须未知

我们在本地得到了一个工作的导出模型正在创建一个新的模型版本谷歌云机器学习如下 Create Version failed Model validation failed Outer dimension for outputs must b
为什么在线预测失败并显示“无法从 feed 中获取元素作为字节”？

在线预测失败并显示无法从源中获取字节形式的元素这是什么意思以及如何解决它我使用以下代码生成预测 request data examples pickup longitude 73 885262 pickup latitude 40
在 Google Cloud ML 中运行作业后出错

我尝试在 Google Cloud ML 上运行来自 github 的 word RNN 模型提交作业后我在日志文件中收到错误这是我提交的培训内容 gcloud ml engine jobs submit training word
524 错误和 Jupyterlab api 状态 - 不健康

我们如何解决 GCP JupyterLab 上的以下错误尝试了 stackoverflow google cloud 上已有的解决方案但没有一个有效请帮忙 1 https i stack imgur com IfVWt png htt

随机推荐

T(n) = T(n/10) + T(an) + n，如何解决这个问题？

更新我仍在寻找不使用外部资源的解决方案 Given T n T n 10 T an n对于一些a 然后 T n 1 if n lt 10 我想检查以下是否可能对于某些a值我想找到最小的可能 a For every c gt 0 the
如何访问共享点库中的自定义列 - 图形 API

我使用自定义列将子项列出在文档库的根目录中当我使用 MS graph REST API 进行以下调用时不会为子项返回任何自定义列数据 https graph microsoft com beta sites
Android 4.4 (KitKat) 上的 Android Gallery 返回 Intent.ACTION_GET_CONTENT 的不同 URI

在 KitKat 之前或者在新 Gallery 之前 Intent ACTION GET CONTENT返回一个像这样的 URI 内容媒体外部图像媒体 3951 使用ContentResolver并查询MediaStore Ima
未导航到本机反应中的特定屏幕

我是原生反应新手我创建了两个文件 Browse js 和 Drawer js 我在 Browse js 中有一些按钮但是当我在 Drawer js 中完成完整的 Browse js 时像这样 gt import React Compo
添加与 Ruby Gem Mailboxer 的所属关系

我正在构建一个电子商务应用程序并希望实现诸如消息传递系统之类的东西在应用程序中所有对话都将与Product模型或Order模型在这种情况下我想将相关对象类型 id 我想存储到Conversation object 要添加字段
是否可以声明一个包含另一个常量数组的常量数组？

我想做这样的事情 const MyFirstConstArray array 0 1 of string Hi Foo MySecondConstArrayWhichIncludesTheFirstOne array 0 2 of stri
在 core_cm4.h 上为什么有类似 ((uint32_t)(int32_t)IRQn) 的转换？

在 core cm4 h 的以下代码中为什么存在双重转换 uint32 t int32 t IRQn 例如在以下函数中 STATIC INLINE void NVIC EnableIRQ IRQn Type IRQn NVIC gt IS
如何根据 swing 中的 JPanel(table) 行数增加 JFrame 大小

我有 Swing 应用程序它执行以下操作 public void init jFrame new JFrame jFrame add sortingDataInputComponent asComponent jFrame setDefa
如何在 ttk.OptionMenu 周围制作边框

在尝试制作入口框架时我遇到了一个问题我无法在 ttk OptionMenu 周围制作边框以使其看起来与 ttk Entry 相似图中是相邻的两个制作选项菜单 option ttk OptionMenu bottom containe
DatabaseMetaData.getColumns 返回同义词的空结果集

方法getColumns 元数据上的同义词返回空结果集对于表和视图它正确返回列列表这种情况发生在 Oracle 11g Express 并使用最新的 Oracle JDBC 驱动程序 11 2 3 上其他 SQL 服务器也会发生这种
我们如何在 SwiftUI 中访问 List 的 DisclosureGroup？

我使用此代码在 SwiftUI 2 0 和 macOs 10 15 7 的列表中显示我的父母和孩子数据默认情况下我的父母处于折叠状态我喜欢强制其中一些通过我的按钮操作进行扩展我有那个按钮有谁知道如何解决这个问题这是我的代码 im
设置 DAY_OF_WEEK 返回意外结果

我想将给定日历实例的时间戳设置为一周的开始星期一相反它返回一个看似完全不相关的时间戳除非我在这样做之前访问日历的任何字段我在下面提供了一个示例另请参阅此可运行示例Ideone 这是预期的行为吗这背后的逻辑是什么是的我听说过
!important 已覆盖

我正在使用 JQuery mobile 我希望我的应用程序上的所有文本都是紫色的我这样做了 color 7A68AE important in my body我的 CSS 部分然后我尝试在 firebug 中调试它并注意到我的 impo
PHP DomDocument 更改条件注释

我有这个带有条件注释的 html 文件
在搜索结果中显示整行

在 Visual Studio Code vscode 中当我搜索某些内容时每个搜索结果中的行开头可能会被切断怎样才能看到被剪掉的部分呢例如假设我搜索 directory 搜索结果可能会显示以下内容 require directo
如何期待 Robotium 中的异常？

这是我的测试用例 public void testStartActivityWithoutExtraData try getActivity Assert fail Should have thrown IllegalStateExcept
perl删除连续的重复行

我想删除连续的重复行即例如 test txt car speed is good bike slower than car plane super fast super fast bullet train super fast 这将删除除
Firebase 数据库结构

我目前正在为 iOS 创建一个电子商务应用程序但我无法决定如何为用户通过关键字搜索项目的场景构建数据库我不确定存储关键字数组或仅存储该项目的关键字字符串是否会更好如果大家有什么建议请告诉我谢谢这是我现在的单个项目的结构 ite
Ajax.BeginForm 导致重定向到部分视图而不是就地视图

我的 Search cshtml 有一个名为 search results 的 div 需要更新 SearchResults 是操作名称我已经在 MVC2 VS2008 项目上做过很多次了但这是我第一次使用 MVC3 和 VS2010
AI Platform 中的 PyTorch 模型部署

我正在 Google Cloud AI Platform 中部署 Pytorch 模型出现以下错误 ERROR gcloud beta ai platform versions create Create Version failed B

AI Platform 中的 PyTorch 模型部署

AI Platform 中的 PyTorch 模型部署 的相关文章

随机推荐

热门标签

AI Platform 中的 PyTorch 模型部署的相关文章