使用 CustomAttributes 调用 sagemaker 端点

2024-01-29

我正在尝试调用我的 SageMaker 端点并传递指定的 CustomAttributes 参数here https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/sagemaker-runtime.html#SageMakerRuntime.Client.invoke_endpoint.

我想知道的是如何检索模型端点中的 CustomAttributes？

我为端点创建了一个 inference.py 文件，其结构如下：

imports

def get_device():
    device = 'cuda:0' if torch.cuda.is_available() else 'cpu'
    return device

def model_fn(model_dir):
    return model

def transform_fn(model, request_body, content_type, accept)
   return json.dumps(predictions)

正如 request_body、content_type、accept 被传递给transform_fn 一样，我想传递 CustomAttributes。这可能吗？如果可以我该怎么做？

提前致谢！

通过完全控制所有底层步骤，可以方便地构建推理代码。

正如文档“调整您自己的推理容器 https://docs.aws.amazon.com/sagemaker/latest/dg/adapt-inference-container.html”建议，您可以安排 4 个功能：model_fn, input_fn, predict_fn and output_fn.

除此之外，您还可以创建自己的处理程序来处理调用端点时传递的所有属性（“如何实现预处理和/或后处理处理程序 https://sagemaker.readthedocs.io/en/stable/frameworks/tensorflow/deploying_tensorflow_serving.html#how-to-implement-the-pre-and-or-post-processing-handler-s").

您可以拥有input_handler / output_handler pair的函数或single handler功能。

以下是通用推理脚本的代码示例。

在端点调用块内：

import boto3
import json

runtime = boto3.Session().client('sagemaker-runtime')

runtime_client.invoke_endpoint(
    EndpointName = your_endpoint_name,
    Body = your_data,
    CustomAttributes = json.dumps(your_attributes_dict),
    ContentType = your_content_type
)

在你的 inference.py 中：

import json

def handler(data, context):
    processed_input = _process_input(data, context)
    custom_attrs = json.loads(context.custom_attributes)

    # here place your function to parse and use your custom_attrs json

    response = requests.post(context.rest_uri, data=processed_input)
    return _process_output(response, context)

def _process_input(data, context):
   # your _process_input to decode the request_content_type

    if context.request_content_type == YOUR_CONTEXT_TYPE:
        return your_process_func(data)

    raise ValueError('{{"error": "unsupported content type {}"}}'.format(
        context.request_content_type or "unknown"))

def _process_output(data, context):
    if data.status_code != 200:
        raise ValueError(data.content.decode('utf-8'))

    response_content_type = context.accept_header
    prediction = data.content
    return prediction, response_content_type

请注意此注释：

请注意，如果实现了处理函数，则 input_handler 和 output_handler 被忽略。

这意味着，如果您使用 TensorFlow 或 PyTorch 等框架，您将必须了解如何从默认处理程序开始重写这些方法。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

amazonwebservices

amazonsagemaker

使用 CustomAttributes 调用 sagemaker 端点的相关文章

从 EC2 W2008 实例创建 AMI - 为什么从来没有获得密码？

我正在尝试做什么我正在尝试克隆 EC2视窗2008通过管理控制台实例该实例基于 Windows Server2008 i386 Base v104 ami 92ba43fb 但上面安装了许多应用程序我想为新实例保留这些应用程序发生了
如何在我的 AWS EC2 实例上安装特定字体？

我有一个在 AWS EC2 Amazon Linux Elastic Beanstalk 实例上运行的 Python 应用程序该实例需要某些特定字体才能生成输出并且想知道如何在部署或实例启动过程中安装它们我的代码在本地计算机 OS X
从本地计算机连接到 AWS 上的 Neptune

我正在尝试从办公室的本地计算机连接到 AWS 实例中的 Neptune DB 就像从办公室连接到 RDS 一样是否可以从本地计算机连接 Neptune 数据库 Neptune 数据库是否公开可用开发人员有什么方法可以从办公室连接 Nep
如何在 PuTTY 中保存并运行 Java 文件？

我是 AWS 亚马逊网络服务的新手所以这可能是一个基本问题我在 AWS 上创建了一个 EC2 实例我有一台 Windows 计算机因此我使用 PUTTY 来连接 Linux 实例连接到我的 EC2 实例后我使用以下命令编写 J
使用S3上传但不允许公共访问

我的想法是创建一个 S3 存储桶以允许用户上传二进制对象下一步是确认上传然后 API 将启动文件处理为了使其更安全客户端将首先请求上传位置然后 API 会在 S3 上为此上传分配并预先创建一个一次性使用目录并在该目录上设置访问策
AWS CodePipeline 构建缺少 Git 历史记录

Context 我设置了一个 CodePipeline 它使用 CodeCommit 和 CodeBuild 作为其源和构建阶段我的构建包括一个插件 com zoltu git versioning 使用 Git 提交历史记录来动态创建构
AWS Lambda 提前结束（没有任何显式返回或回调）

我在放入 AWS Lambda 中的一些 Node js 代码时遇到了一些问题我需要进行几个异步调用虽然第一个调用的行为符合我的预期但 lambda 函数在第二个调用完成之前终止返回值为 null 这让我认为 lambda 正在执行
在 Azure 上运行 .NET 应用程序

我拥有在 Amazon EC2 上运行应用程序的丰富经验它需要一台低端服务器我目前为该服务器支付大约 90 美元月是的我知道我并不真正需要可扩展性但我仍然使用 EC2 我想知道将这个纯粹的 NET 应用程序迁移到 Microso
通过 boto3 承担 IAM 用户角色时访问被拒绝

Issue 我有一个 IAM 用户和一个 IAM 角色我正在尝试将 IAM 用户配置为有权使用 STS 承担 IAM 角色我不确定为什么收到访问被拒绝错误 Details IAM 角色 arn aws iam 123456789 r
无法使用 aws 无服务器离线从另一个 lambda 调用 lambda

我想从 serverless offline 内的另一个 lambda 调用 lambda 我想创建一个无服务器离线 Web 应用程序但我收到此错误 UnknownError 不支持的媒体类型在 Object extractError
Spring JMS监听器即使在异常时也会确认

我正在使用 JMS 向 SQS 队列发送接收消息但是即使在使用 client acknowledge 时出现异常我也无法重新传递消息如何实现这一目标我尝试了一个简单的测试 JmsListener destination test
AWS S3 公共对象与私有对象？

回到 S3 我的存储桶中有图像的 URL 我将在我的应用程序中呈现这些图像但它们被设置为私有当我尝试单击该链接时它显示访问被拒绝当我将链接的设置更改为公共时它会通过但是我读到公共访问并不是最安全的事情所以这本质上是一个由两部
如何从此 AWS SecretsManager JSON 对象中提取字段？

我正在使用 AWS Secrets Manager 来保护 REST API 的数据库信用我正在使用 AWS Lambda API 网关和 RDS MySQL 以下是我如何获得它们 Load the AWS SDK var AWS req
适用于 Hadoop 的 DynamoDB 输入格式

我必须使用 Hadoop mapreduce 处理保留在 Amazon Dynamodb 中的一些数据我在互联网上搜索 Dynamo DB 的 Hadoop InputFormat 但找不到它我对 Dynamo DB 不熟悉所以我猜测
张量流服务错误：参数无效：JSON 对象：没有命名输入

我正在尝试使用 Amazon Sagemaker 训练模型并且希望使用 Tensorflow 服务来为其提供服务为了实现这一目标我将模型下载到 Tensorflow 服务 docker 并尝试从那里提供服务 Sagemaker 的训练
AWS DynamoDB 写后读一致性 - 理论上它是如何工作的？

大多数nosql解决方案仅使用最终一致性并且考虑到DynamoDB将数据复制到三个数据中心如何保持写后读一致性解决此类问题的通用方法是什么我认为这很有趣因为即使在 MySQL 复制中数据也是异步复制的我将详细告诉您 Dynam
如何使用 jq 从多个嵌套数组中提取键

SETUP 我试图弄清楚 jq 过滤器是如何工作的但在找出嵌套数组时遇到了困难使用下面的数据我无法做出平的 5 键输出我可以得到 1 个键和 4 个空值或者 4 个键和 1 个空值但不能得到所有 5 个键 1 个键 4 个空值 R
为什么我会收到 ElasticBeanstalk::ExternalInitationError？

我的应用程序基于 RubyOnRails 构建并使用乘客部署为弹性 beanstalk 应用程序我尝试向 nginx 服务器添加标头并重新启动它这是我的配置文件是 aws elastic beanstalk 中 ebextensio
cloudfront 响应状态为 413（请求实体太大）

我们需要发送大量数据作为 URL 的一部分 Angular 将读取该数据以呈现页面网址超过 10000 个字符但 cloudfront 返回以下错误错误的请求由 cloudfront CloudFront 生成请求 ID I2fOA
Nginx url 限制 502 网关

我有一个问题但我接受绕过此功能的其他建议基本上我在 get 请求中向我的服务器发送大约 3000 个字符的大行文本然后服务器将其作为 url 中的参数发送到谷歌翻译问题当 url gt 1900 个字符时 Nginx 会抛出 5

随机推荐

想要延迟 1 秒显示数字

我想在 TextView 中显示数字如下所示 Wait 5 sec then a delay of 1 sec Wait 4 sec display this in the same text view along with delay
哪里可以获取以前版本的 iOS 磁盘映像？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我刚刚成为 iOS 开发者计划的成员我正在阅读 iOS 开发者计划用户指南文档它说从 iOS 开
GPL 对 javascript 库的限制 [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案如果我在我的网站上使用 GPL 许可的 JavaScript 组件是否会被视为向公众发布因为组件的客户端代码通过 http 加载到用户的浏览器并
Python：如何使用Python生成随机稀疏对称矩阵？

如何使用python生成随机稀疏对称矩阵在 MATLAB 中我们有一个函数 sprandsym 大小密度 http www mathworks fr help matlab ref sprandsym html 但如何在 Python
jQuery 上传插件可与 JSP/Java 配合使用

我正在努力完成以下任务通过将表单 enctype multipart form data 提交给 JSP 操作来将文件上传到应用程序 JSP 操作会处理其余部分包括将文件写入磁盘处理和返回有关上传的一些 xml 数据直到最近我还在
“import pandas.io.data as web ”给我一个错误，说没有 pandas.io.data 的模块名称

我刚刚学习 python 并尝试用它进行股票分析使用库存统计我安装了stockstats pip 安装 stockstats 进口大熊猫进口熊猫尝试导入数据导入 pandas io data 收到错误消息说模块 pandas io
应用内购买响应。产品为空

我知道以前有人问过 iPhone 应用程序内购买响应产品仍然是空的 https stackoverflow com questions 2138972 iphone in app purchase response products a
发布到编辑控制器操作不传递模型 ID

我的控制器上有一个如下所示的操作 HttpPost public ActionResult Edit EditMyObjectViewModel editMyObjectViewModel EditMyActionViewModel包含一个
SpringMVC：和必须在同一上下文中吗？

ApplicationContext 是 WebApplicationContext 的父级但为什么和必须放在相同的上下文中才能起作用这是我的解释我像这样配置我的 applicationConext xml
Angular Universal 不会接管客户端上的渲染

我目前正在尝试按照官方角度将服务器端渲染 SSR 添加到我的角度应用程序中角度通用指南 https angular io guide universal 我能够设置快速服务器并且从服务器获得的响应包含我的应用程序尽管看起来有点奇怪好像
任何人都可以使用 json_encode 和 json_decode 解释这段 PHP 代码吗？

a tag b b echo json encode json decode a 这输出 tag b lt b gt 当您认为它会准确输出输入时由于某种原因 json encode 添加了一个额外的斜杠因为它是 JSON 标准的一部分
当我不知道异步任务何时完成工作时，如何让主线程等待？

我正在使用异步任务解析包含一些名称的 xml 文件并通过主线程再次将这些名称填充到列表视图中但在我的例子中发生的情况是当异步任务仍在运行时主线程已经将名称填充到列表视图中这导致列表视图上没有任何项目我应该让主线程等待直到异步任
如何禁用“不允许使用内部包”

我有一个 go 程序它检查一个大型存储库选择一些感兴趣的包然后生成一个新的 main go 文件其中包含 import package of interest here another package of interest her
更改 RMD 摘要的行距？

是否可以将 YAML 标头中指定的摘要的行距更改为单倍行距同时将文档的其余部分保留为双倍行距我的 YAML 如下 output pdf document number sections true title My Title autho
如何在 const 中定义数组？

我在定义字符串数组时遇到一些问题const在 Inno Setup 的代码部分下我有以下内容 Code const listvar array 0 4 of string one two three four five 它说我需要一个哪
如何使用 Android 导航抽屉更改片段

我知道这些类型的问题已经在这里但我仍然没有找到这个问题的答案我创建了一个应用程序并使用了由应用程序 AndroidStudio 自动创建的导航抽屉这是我所拥有的 Override protected void onCreate Bun
如何从 iPhone 的表格视图中获取所选单元格的单元格值

我在表视图控制器中显示图像其中图像从 URL 呈现为 XML 文件它适用于将图像作为滚动视图列出现在我想选择一个特定的图像窗口应该单独显示所选的单元格图像为此我需要获取单元格值吗如果是这样我如何获取特定的单元格值并在下一个窗
Blob createObjectURL 下载在 Firefox 中不起作用（但在调试时有效）

我有一个奇怪的问题下面的函数是我根据我在网上找到的有关在客户端中动态创建 Blob 并使用一些二进制数据作为数组传递并能够下载该数据创建的函数这在 Chrome 中工作得很好但在 Firefox 中没有任何作用除非我调试并单步执
如何使用 Rust 在用户空间处理 SIGSEGV 信号？

我试图了解 Rust 中的堆栈溢出处理程序我已经写了函数recursive stack 它一次又一次地声明一些局部变量以耗尽堆栈空间 extern crate nix use nix sys signal extern C fn hand
使用 CustomAttributes 调用 sagemaker 端点

我正在尝试调用我的 SageMaker 端点并传递指定的 CustomAttributes 参数here https boto3 amazonaws com v1 documentation api latest reference ser

使用 CustomAttributes 调用 sagemaker 端点

使用 CustomAttributes 调用 sagemaker 端点 的相关文章

随机推荐

热门标签

使用 CustomAttributes 调用 sagemaker 端点的相关文章