vertex ai 中的自定义容器部署

2024-03-23

我正在尝试在 vertex ai 端点中部署自定义容器以进行预测。申请内容如下。

烧瓶-app.py

import pandas as pd
from flask import Flask, jsonify,request
import tensorflow
import pre_process
import post_process


app = Flask(__name__)


@app.route('/predict',methods=['POST'])
def predict():
    req = request.json.get('instances')
    
    input_data = req[0]['email']

    #preprocessing
    text = pre_process.preprocess(input_data)
    vector = pre_process.preprocess_tokenizing(text)

    model = tensorflow.keras.models.load_model('model')

    #predict
    prediction = model.predict(vector)

    #postprocessing
    value = post_process.postprocess(list(prediction[0])) 
    
    return jsonify({'output':{'doc_class':value}})


if __name__=='__main__':
    app.run(host='0.0.0.0')

Dockerfile

FROM python:3.7

WORKDIR /app

COPY . /app

RUN pip install --trusted-host pypi.python.org -r requirements.txt 


CMD ["gunicorn", "--bind", "0.0.0.0:5000", "app:app"]

EXPOSE 5050

预处理.py

#import 
import pandas as pd
import pickle
import re
import tensorflow as tf
from tensorflow.keras.preprocessing.sequence import pad_sequences


def preprocess(text):
    """Do all the Preprocessing as shown above and
    return a tuple contain preprocess_email,preprocess_subject,preprocess_text for that Text_data"""
         
    
    #After you store it in the list, Replace those sentances in original text by space.
    text = re.sub("(Subject:).+"," ",text,re.I)
    
    #Delete all the sentances where sentence starts with "Write to:" or "From:".
    text = re.sub("((Write to:)|(From:)).+","",text,re.I)
    
    #Delete all the tags like "< anyword >"
    text = re.sub("<[^><]+>","",text)
    
    #Delete all the data which are present in the brackets.
    text = re.sub("\([^()]+\)","",text)
    
    #Remove all the newlines('\n'), tabs('\t'), "-", "".
    text = re.sub("[\n\t\\-]+","",text)
    
    #Remove all the words which ends with ":".
    text = re.sub("(\w+:)","",text)
    
    #Decontractions, replace words like below to full words.

    lines = re.sub(r"n\'t", " not", text)
    lines = re.sub(r"\'re", " are", lines)
    lines = re.sub(r"\'s", " is", lines)
    lines = re.sub(r"\'d", " would", lines)
    lines = re.sub(r"\'ll", " will", lines)
    lines = re.sub(r"\'t", " not", lines)
    lines = re.sub(r"\'ve", " have", lines)
    lines = re.sub(r"\'m", " am", lines)
    text = lines
    
        #replace numbers with spaces
    text = re.sub("\d+"," ",text)
    
        # remove _ from the words starting and/or ending with _
    text = re.sub("(\s_)|(_\s)"," ",text)
    
        #remove 1 or 2 letter word before _
    text = re.sub("\w{1,2}_","",text)
    
        #convert all letters to lowercase and remove the words which are greater 
        #than or equal to 15 or less than or equal to 2.
    text = text.lower()
    
    text =" ".join([i for i in text.split() if len(i)<15 and len(i)>2])
    
    #replace all letters except A-Z,a-z,_ with space
    preprocessed_text = re.sub("\W+"," ",text)

    return preprocessed_text

def preprocess_tokenizing(text):
        
    #from tf.keras.preprocessing.text import Tokenizer
    #from tf.keras.preprocessing.sequence import pad_sequences
    
    tokenizer = pickle.load(open('tokenizer.pkl','rb'))

    max_length = 1019
    tokenizer.fit_on_texts([text])
    encoded_docs = tokenizer.texts_to_sequences([text])
    text_padded = pad_sequences(encoded_docs, maxlen=max_length, padding='post')
    
    return text_padded

post_process.py

def postprocess(vector):
    index = vector.index(max(vector))
    classes = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
    return classes[index]

要求.txt

gunicorn
pandas==1.3.3
numpy==1.19.5
flask
flask-cors
h5py==3.1.0
scikit-learn==0.24.2
tensorflow==2.6.0

model
分词器.pkl

我正在关注这个博客顶点人工智能部署 https://medium.com/mlearning-ai/serverless-prediction-at-scale-part-2-custom-container-deployment-on-vertex-ai-103a43d0a290用于 gcloud 控制台命令将模型容器化并将其部署到端点。但是该模型需要很长时间才能部署，最终无法部署。

在本地主机中运行容器后，它按预期运行，但没有部署到 vertex ai 端点。我不明白问题是否出在 Flask app.py 或 Dockerfile 中，或者问题是否出在其他地方。

我能够通过向 http 服务器添加健康路由来解决此问题。我在我的烧瓶应用程序中添加了以下代码。

@app.route('/healthz')
def healthz():
    return "OK"

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Flask

Dockerfile

googlecloudvertexai

vertex ai 中的自定义容器部署的相关文章

使用“flask run”或“python run”哪个？

Reading http flask pocoo org docs 1 0 quickstart http flask pocoo org docs 1 0 quickstart 描述使用 flask run 来启动基于 Flask 的应用
WTForm“OR”条件验证器？（电子邮件或电话均可）

class ContactForm Form name StringField Name validators DataRequired Length max 255 email StringField Email validators O
使用 Flask 代理到另一个 Web 服务

我想将对 Flask 应用程序发出的请求代理到计算机上本地运行的另一个 Web 服务我宁愿使用 Flask 而不是更高级别的 nginx 实例这样我们就可以重用应用程序中内置的现有身份验证系统我们越能保持这种单点登录越好是否有现
Python Flask 未与 docker-compose 一起运行 [重复]

这个问题在这里已经有答案了我有一个简单的 Flask 应用程序由 Web 部分和数据库部分组成代码可以找到here https github com wiwa1978 flask employees 在本地运行这个 Flask 应用程
Flask 的 jsonify() 中缩小的 JSON

Flask 提供了方便的jsonify 函数它从 Python 变量返回 JSON 对象 from flask import Flask jsonify app Flask name app route def json hello re
Flask 运行与 Python

我很难使用 python 方法运行我的烧瓶应用程序我使用没有问题 export FLASK APP microblog py flask run 但尝试使用 python microblog py 会导致以下错误 ImportError
Flask-WTF - validate_on_submit() 永远不会执行

我正在使用 Flask WTF 这是我的表格 from flask ext wtf import Form TextField class BookNewForm Form name TextField Name 这是控制器 book ro
使用 Docker Jenkins 容器管道构建 docker 映像时找不到 Docker

我有一个 Jenkins 作为 docker 容器运行现在我想使用管道构建 Docker 映像但 Jenkins 容器总是告诉 Docker 未找到 simple tdd pipeline Running shell script do
Python Flask：我有一个 Flask 中间件，我想在其中计算请求所花费的时间并将其添加到响应的标头中

我有以下中间件 from werkzeug wrappers import Request from datetime import datetime class TimingMiddleware object def init self
在 Flask 中使用 SqlAlchemy 模型

我使用 SqlAlchemy 创建了一些模型来最初设置数据库最初我解析一些 XML 文件并填充数据库这是一次性的事情当我在服务器上设置应用程序时需要完成 Base declarative base class Movie Base
保护在 MacOS 上 Docker 中的 0.0.0.0 本地运行的 Flask/Celery 应用程序的本地主机端口

我的应用程序有一个 Flask 后端和一个 Angular Electron 前端该应用程序在 Mac Catalina 上本地运行 Flask Celery 和 Redis 位于单独的 docker 容器中而前端位于 Docker 外
如何在表单的 __init__ 函数中绑定字段

class Example Form Form field 1 TextAreaField field 2 TextAreaField def init self type kwargs super Example Form self in
如何让 Celery 工作人员返回任务结果

我有一个调用任务的烧瓶应用程序该任务从数据库中提取数据绘制折线图并返回在 html 页面上呈现的 html 内容如果没有 Celery Flask 应用程序可以正常工作并在客户端呈现折线图但现在我想委托 celery 通过以下方式运
docker run 使用包含变量的 ENTRYPOINT

我有一个私人 git 存储库github com http github com我想自动化docker build过程使用Dockerfile 我天真地认为最好的地方Dockerfile位于我的存储库的根文件夹中例子 git clone
如何将 pandas 数据框显示到现有的 Flask html 表中？

这听起来可能是一个菜鸟问题但我一直坚持这个问题因为 Python 不是我最好的语言之一我有一个 html 页面里面有一个表格我想在其中显示一个 pandas 数据框最好的方法是什么使用 pandas dataframe to
使用 Flask-Login 在 Flask 中获取“str”对象没有属性“is_authenticated”

我正在尝试使用 Flask Login 设置 Flask 登录我有一个供用户使用的 CouchDB 客户文档有一个称为用户的对象 class User UserMixin def init self user self name us
无法在 Flask 后端提取 React 前端上传的图像文件

我正在尝试将图像文件驻留在本地从我的反应单页前端应用程序发送到我的烧瓶后端我尝试过但不限于捕获我的内容类型并在前端指示 encType 的一些事情尽管如此 post请求表明它是成功的但是当我记录 requests files r
如何访问 Flask 路由中的查询字符串？

如何访问 Flask 路由中的查询参数或查询字符串从 Flask 文档来看这一点并不明显示例路线 data下面说明了我想要访问该数据的上下文如果有人要求类似的东西example com data abc 123 我想访问该字符串 a
如何从 Flask 调用另一个 Web 服务 api

我在 Flask 服务器中使用重定向来调用另一个 Web 服务 api e g app route hello def hello return redirect http google com 网址逻辑上会更改为 google com 但
跳过一个端点的 Flask 日志记录？

我有一个 Python Flask 应用程序有一项运行状况检查经常访问一个端点但我不想在日志中看到它如何仅禁用一个 GET 端点的日志记录而保留其他所有端点的日志记录艾蒂安贝尔萨克为我指明了正确的方向这就是我的实现方式 fro

随机推荐

删除查询的 Hibernate 版本更新后出现子树意外结束异常

当我从表中删除所有数据时出现奇怪的异常自从我将 Hibernate 版本从 3 x x 更新到 4 2 6 后就出现了异常我调用从表中删除数据的 Dao 方法 Override public void deleteAll Entit
无法加载 DLL 'sqlite3' - 对于 Windows Universal Mobile

我使用带有 SP2 的 Visual Studio 2015 我尝试使用 sqlite 创建 Windows 通用应用程序我添加了适用于通用 Windows 平台的 SQLite 和 SQLite Net PCl 这是我的简单代码 var
Next JS 在刷新之前无法正确加载 Material UI 样式

EDIT 可重现的错误https github com ganavol409 next material ui classes bug https github com ganavol409 next material ui classes
如何以编程方式将喜欢的网页发布到 Facebook 提要？

我正在努力让它发挥作用 https developers facebook com blog post 465 https developers facebook com blog post 465 Step 1 我正在获取访问令牌 Ste
如何从外部属性文件填充 Liquibase 参数值？

有什么办法可以让我填充参数 http www liquibase org documentation changelog parameters html在基于外部属性文件内容的 Liquibase 变更日志文件中就像我想说
读取写入管道的信息后无法退出 while 循环

TLDR 您必须关闭所有子项中所有管道的写入端仅当没有进程的写入端仍然打开时读取才会检测到 EOF 感谢 Bodo 作为操作系统课程作业的一部分我试图从格式为以下的文件中读取行x operand y并将这些行分配给不同的子进程以便每
如何在 UITableView 的顶部添加额外的分隔符？

我有一个 iPhone 视图它基本上分为两部分上半部分是信息显示下半部分是用于选择操作的 UITableView 问题是 UITableView 中的第一个单元格上方没有边框或分隔符因此列表中的第一项看起来很有趣如何在表格顶部添加
Tomcat 8 中的 HTTP/2 支持

经过一番研究我很惊讶在 Tomcat 中没有找到任何关于 HTTP 2 支持的资源 8 0 的变更日志表明对 SPDY 的实验性支持并且 wiki 将 HTTP 2 称为受支持的规范 http wiki apache org tomca
在 python 中为 lambda 函数编写文档字符串的最佳方法是什么？

我通常使用带有的多行文档字符串来注释我的函数如下所述 https www python org dev peps pep 0257 https www python org dev peps pep 0257 def func1 x T
matplotlib：在函数中绘制图，然后将每个图添加到单个子图中

我一直无法找到解决方案假设我定义了一些绘图函数这样我就不必每次制作类似的绘图时都复制粘贴大量代码我想做的是使用这个函数单独创建一些不同的图然后将它们作为子图组合到一个图中这可能吗我已经尝试过以下操作但它只返回空白 import
Windows 上的 Git Bash 命令，未找到纱线命令

我按照这个在线教程从 GIT HUB 下载和安装 Web 文件我开始讨论主题启动我们的静态网站系统会提示我输入命令来下载和安装 Web 文件但是当我输入命令yarn install时出现以下提示 bash yarn comman
数组或未定义或默认数组作为函数的参数

我想将一个数组选择性地传递给一个函数或一个将其设置为默认值的数组这是典型的方式 function myfunc values Array
如何计算具有两个变量的表中的行数

我有一个名为 dF 的数据框有两列名称区域例如 Name Region a EU a EU b AM C AP 如果我执行 table dF 它将显示一个包含两个变量的表比如像这样 table int 1 325 1 3 Regi
Python 中使用 argparse 的条件命令行参数

我想要一个程序需要 action 标志其中有效选择是dump and upload with upload是默认值如果且仅当 dump已选择我希望还有一个 dump format 选项有没有办法使用 argparse 来表达这一
在 VHDL 中使用 SB_RGBA_DRV 原语

我在使用为 Lattice ICE40UP fpga 提供的 SB RGBA DRV 原语时遇到问题技术库提供了一个 verilog 示例我可以使用它但是当我尝试在 VHDL 中使用它时 P R 失败输出以下消息错误非法连接 S
Vue3 Codesandbox 使用

vertex ai 中的自定义容器部署

vertex ai 中的自定义容器部署 的相关文章

随机推荐

vertex ai 中的自定义容器部署的相关文章