在 sagemaker 中进行预测之前如何预处理输入数据？

2023-11-27

我正在使用 java Sagemaker SDK 调用 Sagemaker 端点。我发送的数据在模型可以使用它进行预测之前几乎不需要清理。我怎样才能在 Sagemaker 中做到这一点。

我在 Jupyter 笔记本实例中有一个预处理功能，它在传递数据来训练模型之前清理训练数据。现在我想知道我是否可以在调用端点时使用该函数或者该函数是否已被使用？如果有人愿意，我可以展示我的代码吗？

EDIT 1基本上，在预处理中，我正在进行标签编码。这是我的预处理函数

def preprocess_data(data):
 print("entering preprocess fn")
 # convert document id & type to labels
 le1 = preprocessing.LabelEncoder()
 le1.fit(data["documentId"])
 data["documentId"]=le1.transform(data["documentId"])
 le2 = preprocessing.LabelEncoder()
 le2.fit(data["documentType"])
 data["documentType"]=le2.transform(data["documentType"])
 print("exiting preprocess fn")
 return data,le1,le2

这里的“数据”是一个 pandas 数据框。

现在我想在调用端点时使用这些le1，le2。我想在 sagemaker 本身而不是我的 java 代码中进行此预处理。

SageMaker 现在有一个新功能，称为推理管道。这使您可以构建一个由两到五个容器组成的线性序列，用于预处理/后处理请求。然后将整个管道部署在单个端点上。

https://docs.aws.amazon.com/sagemaker/latest/dg/inference-pipelines.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

awsjavasdk

amazonsagemaker

在 sagemaker 中进行预测之前如何预处理输入数据？的相关文章

如何使用邮递员将请求传递给 sagemaker

我已经在 sagemaker 上训练了一个模型并创建了端点我正在尝试使用邮递员调用端点但是在训练模型时甚至之后我没有为训练数据指定任何标题我不知道如何在向 sagemaker 发送发布请求时创建有效负载以下是调用快速入门指南中创建
在 sagemaker 中进行预测之前如何预处理输入数据？

我正在使用 java Sagemaker SDK 调用 Sagemaker 端点我发送的数据在模型可以使用它进行预测之前几乎不需要清理我怎样才能在 Sagemaker 中做到这一点我在 Jupyter 笔记本实例中有一个预处理功能它
在 AWS Sagemaker 上安装 graphviz

我在使用 Python3 的 Jupyter 笔记本上尝试使用如下代码绘制一棵树 import xgboost as xgb from xgboost import plot tree plot tree model num trees 4
如何使用 Java SDK 获取 AWS Quicksight 仪表板的嵌入 URL

我想我了解获取 AWS Quicksight 仪表板的嵌入 URL 所需的所有步骤并且我已经能够通过 AWS CLI 获取有效的 URL 如AWS docs 但是我似乎无法通过 AWS Java SDK 特别是 v2 让它工作似乎任何
用于创建 Lambda 的 AWS Java SDK 版本

我正在尝试按照所述指南开发 AWS Java lambda 函数here其中描述了RequestHandler接口还引用 AWS lambda java core 库不过我正在尝试按照推荐使用最新的 SDKhere但这是完全不同的Re
当我从 sagemaker 端点获得预测时，端点会做什么？

在 sagemaker 中文档讨论了需要具有 4 个特定函数的推理脚本当我们得到预测时 Python SDK 会向端点发送请求然后推理脚本运行但我找不到 SDK 中运行推理脚本的位置当我浏览 sdk 代码时Predictor pr
Sagemaker 的 IAM 角色？

我正在尝试让 AWS SageMaker 调用 AWS Comprehend 我在 SageMaker 中收到此消息 ClientError 调用时发生错误 AccessDeniedException StartTopicsDetectio
如何在 Docker 容器中启动具有 GPU 访问权限的 AWS Sagemaker 训练作业？

我有一些使用张量流训练神经网络的 python 代码我已经基于运行 python 脚本的 tensorflow tensorflow latest gpu py3 图像创建了一个 docker 图像当我启动 EC2 p2 xlarge
AWS：FileNotFoundError：[Errno 2]没有这样的文件或目录

我正在尝试从我的 S3 存储桶将文件下载到 sagemaker 文件的路径是s3 vemyone input dicom images train 1 2 276 0 7230010 3 1 2 8323329 1000 151787516
是否可以在不使用 s3 的情况下在 sagemaker 中进行预测

我有一个 pkl 我想将其投入生产我想对我的 SQL 服务器进行日常查询并对大约 1000 行进行预测这文档 https docs aws amazon com sagemaker latest dg how it works batc
AWS SageMaker - 在本地训练但部署到 AWS？

我在使用 SageMaker 时面临以下挑战我已经下载了一本教程笔记本 https github com awslabs amazon sagemaker examples blob master sagemaker python sdk
aws sagemaker模型训练中是否有某种持久的本地存储？

我用aws sagemaker做了一些实验从S3下载大数据集的时间是非常有问题的特别是当模型仍处于开发阶段并且你想要某种相对较快的初始反馈时是否有某种本地存储或其他方式来加快速度 EDIT我指的是批量训练服务它允许您以 Docke
AWS Sagemaker 自定义用户算法：如何利用额外实例

这是一个基本的 AWS Sagemaker 问题当我使用 Sagemaker 的内置算法之一进行训练时通过增加训练算法的 instance count 参数我能够利用将作业分配到许多实例所带来的巨大加速然而当我打包自己的自定义算法
将 SageMaker 管道模式与 tfrecords 的 s3 目录结合使用

我打电话给sagemaker tensorflow TensorFlow fit 当我使用时无限期挂起没有错误消息Pipe代替File as the input mode 我相应地替换了TensorFlowDataset with Pip
如何使用提供的 url 从 s3 下载文件？

在我的应用程序中我将获取 s3 文件的 url 例如 https s3 amazonaws com account update input csv https s3 amazonaws com account update input
AWS SageMaker - 如何加载经过训练的 sklearn 模型以用于推理？

我正在尝试将使用 sklearn 训练的模型部署到端点并将其作为预测的 API 我只想使用 sagemaker 来部署和使用我序列化的服务器模型joblib 仅此而已我读过的每篇博客和 sagemaker python 文档都表明 sk
java.lang.IllegalArgumentException：尝试获取 AWS ECR 身份验证令牌时主机名不能为 null

我正在尝试使用 aws java sdk 版本 1 11 339 从 AWS 获取 ECR 授权令牌我创建了一个类来执行此操作如下所示 public class ECRTokenGetter private static final L
AWS Sagemaker 使用镶木地板文件进行批量转换作业？

我正在尝试使用镶木地板数据文件运行批量转换推理作业但找不到任何内容到处都说批量转换仅接受文本 csv 或 json 格式类型出于测试目的我确实尝试在 AWS 帐户内使用 lambda 函数来调用 parque 数据但批量转换作业从
如何通过 Java SDK 使用 AWS 端口转发会话

我正在使用开始一个会话AWSSimpleSystemsManagementAsync如下 Map
返回在 REST 控制器中包装 S3Object.getObjectContent() 的 ResponseEntity 是否安全？

我正在开发一个 Spring Boot 应用程序它应该允许用户通过指定的应用程序 REST 接口间接从 Amazon S3 下载文件为此我有一个 REST Controller 它向用户返回一个 InputStreamResource

随机推荐

将任意字符串映射到 RGB 值

我有一大堆任意自然语言字符串对于我的工具来分析它们我需要将每个字符串转换为唯一的颜色值 RGB 或其他我需要颜色对比来取决于字符串相似性字符串与其他字符串越不同它们各自的颜色应该越不同如果我总是为同一字符串获得相同的颜色值那就
LoadString 仅在我没有英文字符串表时才有效

我希望能够以编程方式修改应用程序的语言或者至少使用控制面板 gt 区域和语言选项 gt 格式中指定的语言如果我添加一个英语字符串表为其制作一个法语和德语副本然后删除英语字符串表我可以以编程方式在加载法语和德语字符串之间切换如
JavaScript 中的大数字字符串

当我执行以下操作时 alert 2053716830872415770228778006271971120334843128349550587141047275840274143041 toString 我得到 2 053716830872
Google App脚本从网站提取数据

所以我正在写一个脚本来查看在 Google 信息页上完成审核并更新谷歌电子表格我发现html中保存这个值的行是 span class A7a 103 span 我只需要知道 URL 和 html 代码就可以从页面中提取内容 Use var
如何包含 MVC 部分控件中的 css 文件？

我正在使用 ASP NET MVC 并且有一个需要包含特定 CSS 和 JS 文件的部分控件有没有办法让父页面渲染script and link页面 head 部分中的标签而不是仅仅在部分控件中内联渲染它们为了澄清我想要包含文件的控件
类型暗示返回 self 的类方法的返回值？

正如问题所描述的我想输入提示aself返回类似 class A def foo self gt what goes here do something return self 我已经尝试过的事情将其注释为A 添加from future
如何更改内核 I/O 缓冲区大小

我正在对 I O 密集型应用程序进行一些实验并试图了解改变内核 I O 缓冲区大小不同电梯算法等的影响如何知道内核中 i o 缓冲区的当前大小内核是否根据需要使用多个缓冲区我怎样才能改变这个缓冲区的大小是否有一个配置文件存储此信
Oracle 10g 中通过数据库链接的传输是否经过压缩？是否可以？

我正在通过数据库链接将数据从一个基地传输到另一个基地使用INSERT INTO SELECT 我想知道通过链接传输的数据是否经过压缩或者可以压缩以避免过多的网络使用我的带宽非常少我认为如果还没有完成的话会有所帮助有一些重复数据删除但
每行带有 ^M 的文本文件

我刚刚从朋友那里得到了一个源代码文件该文件是在 UNIX 中创建的当我使用 NotePad 在 Windows 中打开它时每一行都有一个额外的空行带着疑惑我下载了 Vim 并用它打开了该文件然后我在每行末尾看到一堆 M 这是什么
TFS 2010：如何将工作项链接到变更集

我想以编程方式将工作项链接到变更集目前我已经从我的 C 代码创建工作项并将它们保存到 TFS 代码如下 WorkItem item new WorkItem project WorkItemTypes CustomItem item F
使用system()执行命令时如何设置环境变量？

我正在 Linux 上编写 C 程序需要执行命令system 并且在执行该命令时需要设置环境变量但我不知道在使用时如何设置环境变量system 如果要将与父进程不同的环境变量传递给子进程可以使用以下组合getenv and seten
获取所有程序的、用户定义的函数

如何通过以下方式获取所有用户定义函数的列表SQL query 我找到这段代码here SELECT p proname p pronargs t typname FROM pg proc p pg language l pg type t
在 iPad 上使用 Swift UI 禁用分割视图

有没有办法在 iPad 上的导航视图中使用 SwiftUI 禁用 SplitView 通过设置NavigationViewStyle import SwiftUI struct NavView View var body some View
使用标记模板文字传递更多参数

我正在与样式组件并使用其标记模板文字语法生成组件例如 const Button styled button background color papayawhip border radius 3px color palevioletred
遍历 DOM 树

由于大多数全部执行 HTML 清理的 PHP 库例如 HTML Purifier 严重依赖于正则表达式因此我认为尝试编写一个使用 DOMDocument 和相关类的 HTML 清理程序将是一个值得尝试的实验虽然我还处于这个项目的早
使用 GCDAsyncSocket 通过套接字进行 Telnet

我正在尝试从目标 c 通过 telnet 连接到 Cisco C40 编解码器在我的计算机上使用终端时我得到密码然而在进行套接字连接时需要进行 telnet 协商我就是这样但由于某种原因我无法到达上面的密码提示 void
MySQL会自动优化子查询吗？

我想运行以下查询 Main Query SELECT COUNT FROM table name WHERE device id IN SELECT DISTINCT device id FROM table name WHERE NAME
覆盖默认的 Android 主题

我已经能够覆盖任何名称前面带有 android 的主题但 Android theme xml 还定义了似乎无法覆盖的属性例如
成员名称不能与分部类的封闭类型相同

我定义了一个具有如下属性的分部类 public partial class Item public string this string key get if Fields null return null if Fields Contai
在 sagemaker 中进行预测之前如何预处理输入数据？

我正在使用 java Sagemaker SDK 调用 Sagemaker 端点我发送的数据在模型可以使用它进行预测之前几乎不需要清理我怎样才能在 Sagemaker 中做到这一点我在 Jupyter 笔记本实例中有一个预处理功能它

在 sagemaker 中进行预测之前如何预处理输入数据？

在 sagemaker 中进行预测之前如何预处理输入数据？ 的相关文章

随机推荐

热门标签

在 sagemaker 中进行预测之前如何预处理输入数据？的相关文章