AWS Sagemaker 使用镶木地板文件进行批量转换作业？

2024-03-12

我正在尝试使用镶木地板数据文件运行批量转换推理作业，但找不到任何内容。到处都说批量转换仅接受文本/csv 或 json 格式类型。出于测试目的，我确实尝试在 AWS 帐户内使用 lambda 函数来调用 parque 数据，但批量转换作业从未成功。出现 ClientError: 400，解析数据时出错。

request = \
        {
            "TransformJobName": batch_job_name,
            "ModelName": model_name,
            "BatchStrategy": "MultiRecord",
            "TransformOutput": {
                "S3OutputPath": batch_output
            },
            "TransformInput": {
                "DataSource": {
                    "S3DataSource": {
                        "S3DataType": "S3Prefix",
                        "S3Uri": batch_input

                    }
                },
                "ContentType": "application/x-parquet", 
                "SplitType": "Line",
                "CompressionType": "None"
            },
            "TransformResources": {
                "InstanceType": "ml.m4.xlarge",
                "InstanceCount": 1
            }
        }
    client.create_transform_job(**request)
    return "Done"

目前，我正在尝试使用 parque 数据文件在本地运行 sagemaker 批量转换作业。我有可以在本地终端中运行以“服务”的 docker 映像，并且可以使用 REST API 服务 Postman 从“localhost:8080/incalls”使用“二进制”输入函数上传 parque 数据文件来调用数据。它工作正常，我可以看到邮递员体内填充的数据。但是，我无法使用 parque 数据进行批量转换。

有没有人成功使用 parquet 文件使用 sagemaker 批量转换进行转换和预测？

有点晚了，但希望这对其他人有帮助。只是补充一下 @Setu Shah 提到的内容，这就是我在 Sagemaker 中序列化和反序列化 parquet 文件的方法：

from io import BytesIO
from typing import BinaryIO
import pandas as pd
from botocore.response import StreamingBody

def input_fn(
  serialized_input_data: StreamingBody,
  content_type: str = "application/x-parquet",
) -> pd.DataFrame:
  """Deserialize inputs"""
  if content_type == "application/x-parquet":
    data = BytesIO(serialized_input_data)
    df = pd.read_parquet(data)
    return df
  else:
    raise ValueError(
      "Expected `application/x-parquet`."
    )

def output_fn(output: pd.DataFrame, accept: str = "application/x-parquet") -> BinaryIO:
  """Model output handler"""
  if accept == "application/x-parquet":
    buffer = BytesIO()
    output.to_parquet(buffer)
    return buffer.getvalue()
  else:
    raise Exception("Requested unsupported ContentType in Accept: " + accept)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

AWS Sagemaker 使用镶木地板文件进行批量转换作业？的相关文章

Access / Word 2010 VBA 邮件合并尝试打开 [文件夹名称].mdb 而不是 ACCDB 源

我们正在尝试从 Access 中自动执行邮件合并过程单击按钮后 VBA 将运行指定当前数据库 accdb 作为数据源并运行 SQL 具体代码如下 Set up Word Dim objWord As Object Set objWord
用于 C# XNA 的 Javascript（或类似）游戏脚本

最近我准备用 XNA C 开发另一个游戏上次我在 XNA C 中开发游戏时遇到了必须向游戏中添加地图和可自定义数据的问题每次我想添加新内容或更改游戏角色的某些值或其他内容时我都必须重建整个游戏或其他内容这可能需要相当长的时间有没
在哪里存储 Java 的 .properties 文件？

The Java教程 http download oracle com javase tutorial essential environment properties htmlon using Properties 讨论如何使用 Prop
在 GWT 中，在任何主机页标记上添加事件处理程序

我想为任何标签添加 MouseOver 事件处理程序举个例子我想为旧版 HTML 页面中的每个锚点页面添加事件处理程序继GWT指南 http code google com webtoolkit doc 1 6 DevGuideUse
没有 OAuth 的 Spring Security JWT

最近我开始学习如何使用oauth 2 0 jwt配置spring boot 我有一个问题是否可以使用spring boot security jwt避免oauth 2 0 是的可以使用JWT无需使用标准化的功能OAuth 2 0 flo
迭代 pandas 数据框的最快方法？

如何运行数据框并仅返回满足特定条件的行必须在之前的行和列上测试此条件例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1
如何为 Windows toast 注册协议？

如何注册 Windows toast 协议样本中来自https blogs msdn microsoft com tiles and toasts 2015 07 02 adaptive and interactive toast not
闪亮井板宽度

library shiny library shinydashboard ui lt dashboardPage dashboardHeader dashboardSidebar dashboardBody wellPanel tags d
Android ScrollView fillViewport 不工作

我有一个简单的布局名称位于顶部按钮位于屏幕底部或者超出该按钮以防我添加更多项目所以我使用带有 LinearLayout 的 ScrollView 如下所示
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d
在 Android 中使用 iText 将图像添加到特定位置

我想使用 Android 中的 iText 将图像添加到 PDF 文件中的特定位置这是一个可填写的表单我添加了作为图像占位符的文本框我想要做的就是像这样获取该文本框和图像 public class FormFill public st
NGinx $proxy_add_x_forwarded_for 和 real_ip_header

我在 NGinx 下有一个 web 应用程序和另一个前端负载均衡器如下所示 x x x x IP 地址客户端 a a a a gt LB b b b b gt NGX c c c c gt WEBAPP d d d d 这是我的 NGi
实例化 Microsoft.Office.Interop.Excel.Application 对象时出现错误：800700c1

实例化 Microsoft Office Interop Excel Application 以从 winforms 应用程序生成 Excel 时出现以下错误这之前是有效的但突然间它停止工作了尽管代码和 Excel 版本没有变化我
自定义 Visual Studio 2008 中的位置栏

有人成功定制了 VS 2008 的 Places Bar 吗我从 VS 2005 进行的自定义设置并没有转移到 2008 显然并且无论我如何处理注册表我都无法使我的自定义位置出现在打开对话框中我已经阅读并应用了相关的MS KB文
从 Azure 应用服务连接到 MongoDB Atlas 集群

我在 Azure 上有一个 Web 应用程序它连接到 Atlas cloud mongodb com 上托管的 MongoDB 集群我想使用 Atlas 这样我就不必关心 MongoDb 配置问题是我的集群连接超时我必须在我的 mo
错误：无效使用不完整类型“类 Move”/未定义对 Move::NONE 的引用

拜托我不知道为什么这个简单的代码被拒绝它给了我 2 个编译错误请帮帮我 I use 代码块 20 03 我的编译器是GNU GCC 移动 hpp class Move public Move Move int int public
保存符号方程以供以后使用？

From here http www mathworks com help releases R2011a toolbox symbolic brvfu8o 1 html brvfxem 1 我正在尝试求解这样的符号方程组 syms x y
当ScrollView滚动到底部时加载更多数据

我有一个带有动态加载内容的滚动视图有时可能会有很多内容所以我想在用户滚动到底部时加载更多内容我搜索了合适的方法发现了两种 onScrollChanged and getScrollY 但我不知道如何将它用于我的目的请给我一些建议
如果产品重量超过1000克，如何以公斤为单位显示

在 Storefront 主题中我使用下面的代码将格式化重量从 1000g 更改为 1kg add action woocommerce after shop loop item title show weight 10 function
android ndk 硬件调试内存

背景我对 C 很有经验对 Android 和 Java 还很陌生但这是编程的环境问题我已经用 ANSI C 开发了一个管理应用程序可以移植到任何操作系统只需在依赖于操作系统的代码中添加 UI 即可它使用相当多的内存特别是对于

随机推荐

ipython 和 ipython 笔记本之间奇怪的准确度差异，然后使用 fortran 模块和 f2py

当使用用 f2py 编译的 fortran 模块时我遇到了 ipython 和 ipython 笔记本之间奇怪的准确性差异我的 Fortran 模块是 subroutine tt string fmt n num out implici
C++ 临时值的模板类型推导

include
更改 SwiftUI PreviewProvider 中的模型视图状态

我正在努力寻找一种干净的方法来预览 SwiftUI 视图这些视图具有一个视图模型该视图模型的某些状态可以在视图的整个生命周期中发生变化这是一些稍微做作的代码来说明我使用的模式 import SwiftUI enum NetworkSt
HTML5 视频：ffmpeg 编码的 MP4 无法在任何浏览器中播放（但可以在 VLC 中播放）

我正在尝试以 MP4 和 WEBM 格式提供 HTML5 视频但我无法让所有浏览器都工作支持 WEBM 的浏览器 Chrome 桌面版 Firefox 桌面版可以正常播放视频使用 MP4 的浏览器无法运行 IE Safari And
合并多维数组的第一个元素

假设我有一个数组产品 ID and 数量像这样 records 1 10 1 30 4 10 4 100 5 45 最简单最有效的方法是什么Ruby实现组合产品和数量的哈希像这样 products needed id 1 count
Django url 中的多个 pks

我目前正在尝试使用 Django Rest Framework 构建一个 API 目前我希望能够在一个 url 中拥有多个 pks 但是当我尝试时出现错误 django core exceptions ImproperlyConfigure
Linux 和 Oracle 即时客户端

我重新设计了我的问题以更好地针对我正在讨论的问题here https stackoverflow com questions 65121862 docker oracle instant client 我已经尝试了 4 天使用 Docke
如何将 JFrame 位置设置在另一个 JFrame 旁边？

在 Java 中如何设置 JFrame 自动位于另一个 JFrame 旁边所以假设我有两个JFrame物体 frameA and frameB 当程序运行时它设置frameA使用以下命令将 s 位置设置在屏幕中间 setLocati
如何获取 Django Flatpages 模板的反向 url

如何获取 Django Flatpages 模板的反向 url 我更喜欢以下解决方案需要 Django gt 1 0 settings py INSTALLED APPS django contrib flatpages urls py
Flutter - 循环访问来自rest api的纬度和经度列表以获取两个坐标之间的距离

在我的代码中能够成功获取两个坐标 lAT 和 LNG 之间的距离但我的列表视图仅返回值列表之一的值请在下面找到我的代码 String lat String lng Double distanceInKilometers Future
如果 a 未初始化，a^a 或 a-a 是未定义行为吗？

考虑这个程序 include
将 Python 生成的哈希与 Java 中的原始密码进行比较时，盐修订无效

因此我创建了一个数据库用于存储用户信息及其哈希密码该密码使用Python脚本使用bcrypt module 现在要使用我的 Java 客户端登录我使用的是JBCrypt库作为 Maven 依赖项包含在我的 IntelliJ 项目中
Camera.setPreviewDisplay() 抛出异常[重复]

这个问题在这里已经有答案了可能的重复安卓相机将无法工作启动预览失败 https stackoverflow com questions 7942378 android camera will not work startpreview
PHP邮件、DNS请求超时、FQDN

我要实现mail 我的 PHP 工作Windows Server 2012 R2 为此我首先安装了SMTP依照指示这一页 http www vsysad com 2014 09 setup and configure smtp serve
Django form.模板中的错误

我需要你的帮助问题我有一个用于创建新用户的模板视图和表单如果我在注册中犯了同样的错误例如 password1 password2 我应该在我的模板中看到错误但事实并非如此求救 views def registration re
从 Linux 命令行发送电子邮件到 Gmail

这个问题似乎有很多答案但似乎都不起作用我想从本地主机发送电子邮件到 Gmail 帐户据我所知以下命令没有执行任何操作 mail s Hello email protected cdn cgi l email protection 按
如何让 HoloViews 显示在 Google Colabs 笔记本中？

我无法让任何 HoloViews 图形显示在任何谷歌合作实验室 https colab research google com notebooks welcome ipynb笔记本例如即使是简单的散景示例HoloViews介绍 http
页面渲染时显示 Ajax Loader

这可能是一个简单的问题但是如何在构建页面时最好地使用 ASP NET 中的 AJAX 加载器来提供加载对话框我目前有一个带有关联 UpdateProgressPanel 的 UpdatePanel 其中包含 ProgressTempla
kotlin中如何从数组列表中删除项目

data class RideDate var enddate String null var startdate String null fun main args Array
AWS Sagemaker 使用镶木地板文件进行批量转换作业？

我正在尝试使用镶木地板数据文件运行批量转换推理作业但找不到任何内容到处都说批量转换仅接受文本 csv 或 json 格式类型出于测试目的我确实尝试在 AWS 帐户内使用 lambda 函数来调用 parque 数据但批量转换作业从

AWS Sagemaker 使用镶木地板文件进行批量转换作业？

AWS Sagemaker 使用镶木地板文件进行批量转换作业？ 的相关文章

随机推荐

热门标签

AWS Sagemaker 使用镶木地板文件进行批量转换作业？的相关文章