如何使用 joblib.dump 在 s3 上保存 sklearn 模型？

2024-04-11

我有一个 sklearn 模型，我想使用 joblib.dump 将 pickle 文件保存在我的 s3 存储桶上

I used joblib.dump(model, 'model.pkl')将模型保存到本地，但我不知道如何将其保存到 s3 存储桶。

s3_resource = boto3.resource('s3')
s3_resource.Bucket('my-bucket').Object("model.pkl").put(Body=joblib.dump(model, 'model.pkl'))

我希望腌制的文件位于我的 s3 存储桶上。

这是一种对我有用的方法。非常简单明了。我在用着joblib（它更适合存储大型 sklearn 模型）但您可以使用pickle too.
另外，我使用临时文件与 S3 之间进行传输。但如果您愿意，您可以将该文件存储在更永久的位置。

import tempfile
import boto3
import joblib

s3_client = boto3.client('s3')
bucket_name = "my-bucket"
key = "model.pkl"

# WRITE
with tempfile.TemporaryFile() as fp:
    joblib.dump(model, fp)
    fp.seek(0)
    s3_client.put_object(Body=fp.read(), Bucket=bucket_name, Key=key)

# READ
with tempfile.TemporaryFile() as fp:
    s3_client.download_fileobj(Fileobj=fp, Bucket=bucket_name, Key=key)
    fp.seek(0)
    model = joblib.load(fp)

# DELETE
s3_client.delete_object(Bucket=bucket_name, Key=key)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

amazonwebservices

amazons3

scikitlearn

joblib

如何使用 joblib.dump 在 s3 上保存 sklearn 模型？的相关文章

有没有办法使用 Mayavi 填充陀螺仪表面的一侧？

我正在使用 Mayavi 绘制陀螺仪的等值面我的问题是我需要通过填充两个生成区域的一侧来获得更坚固的结构在下面的图片中您可以看到我生成的等值面的外观以及填充一侧后的外观我生成的等值面它应该是什么样子等值面可以通过以下方程生成 U
Django：如何从管理界面调用管理自定义命令执行？

参考从代码执行管理命令 https stackoverflow com questions 907506 how can i call a custom django manage py command directly from a t
无法打开“storage/logs/laravel-2019-11-22.log”：无法打开流：权限被拒绝

在生产服务器上输入我的网站时出现以下错误无法打开流或文件 var app current storage logs laravel 2019 11 22 log 无法打开流权限被拒绝我尝试运行以下命令但 git 权限在终端中被拒绝
在 Spark-submit 上的 _find_and_load 中获取文件“”，第 991 行

我目前使用的是Python 3 7 9 spark spark 2 4 6 bin hadoop2 6 在这个项目 venv 中我的设置为 kafka python 2 0 2 pip 21 2 4 py4j 0 10 9 pyspark
如何读取 10 位原始图像？其中包含 RGB-IR 数据

我想知道如何从我的 10 位原始它有 rgb ir 图像数据数据中提取 RGB 图像如何使用 Python 或 MATLAB 进行阅读拍摄时的相机分辨率为 1280x720 室内照片图片下载 https drive google c
登录 python + mod_wsgi 应用程序

我在 apache 服务器上部署了一个 python Flask 应用程序这是我的abc conf file WSGIDaemonProcess voting app threads 5 WSGIScriptAlias election
读取 JSON 文件并将其漂亮打印到另一个文件

我有一个复杂嵌套的 json 文本文件它是文本文件中的一长行有什么方法可以读取文件在 python 中并将 json 缩进漂亮地打印到新的文本文件中吗使用读取文件json load 并使用json dump 在指定缩进值时将
不需要 VPC 运行的 AWS 服务列表

谷歌再次让我失败或者可能是我的问题不太清楚有没有一种简单的方法或者更确切地说我们如何确定哪些服务是 VPC 绑定的哪些服务是非 VPC 的例如 EC2 RDS 需要 VPC 设置 Lambda S3 是公开可用的服务不需要 V
Flask 无法识别两个 URL 参数

我正在尝试将两个参数发送到使用 Flask 路由的 URL If I do curl i http 127 0 0 1 5000 api journeys count startStationName Hansard 20Mews 20Sh
将 csv 写入谷歌云存储

我试图了解如何将多行 csv 文件写入谷歌云存储我只是没有遵循文档 https googlecloudplatform github io google cloud python stable storage blobs html hig
Amazon S3 无法通过 Cloudfront 上传文件

我想通过 Cloudfront 使用签名 URL 将文件上传到 S3 Cloudfront 行为中允许 HTTP PUT 桶策略 Sid 2 Effect Allow Principal AWS arn aws iam cloudfront
返回 OSError 异常类的子类实例的逻辑在哪里？

我一直在寻找一些对某些人来说可能相对愚蠢的东西但对我来说非常有趣输入和输出错误已合并为OSError在 Python 3 3 中异常类层次结构发生了变化关于内置类的一个有趣的特性OSError是这样它在传递时返回它的子类errno
第 100 次避免循环导入

Summary 我继续有一个ImportError在一个复杂的项目中我已经将其蒸馏到仍然会出现错误的最低限度 Example 巫师有装有绿色和棕色药水的容器这些可以添加在一起产生同样是绿色或棕色的新药水我们有一个PotionABC
随机数生成器每次仅返回一个数字

Python 是否有一个随机数生成器每次只返回一个随机整数next 函数被调用数字不应该重复并且生成器应返回区间内的随机整数 1 1 000 000 这是独一无二的我需要生成超过一百万个不同的数字这听起来好像非常消耗内存以防所有数
在 python 中将数组作为参数传递

我是Python新手现在我需要声明大小为 20 的数组并将该数组传递给函数需要数组的函数如下 function args The args是一个输入function 谁能帮我如何在 python 中传递数组当你说数组时我假设你
是否可以使用 Google BERT 来计算两个文本文档之间的相似度？

是否可以使用 Google BERT 来计算两个文本文档之间的相似度据我了解 BERT 的输入应该是有限大小的句子一些作品使用 BERT 来计算句子的相似度例如 https github com AndriyMulyar semant
如何在 Python Paramiko 中配置 ssh StrictHostKeyChecking=no 的等效项

我正在使用 Paramiko 通过 Python 脚本进行 sshing 我的ssh命令如下 ssh A o strictHostKeyChecking no
Python 中的延迟求值/惰性求值

我想延迟对类实例的成员函数的调用的评估直到该实例实际存在最小工作示例 class TestClass def init self variable 0 self variable 0 variable 0 def get variabl
mpld3图，注释问题

我正在使用 mpld3 在 Intranet 网站上显示图形我正在使用将图形保存到字典并使用 mpld3 js 在客户端渲染它的选项除非我想使用注释否则该图呈现良好这些显然是抵消的我不明白为什么因为即使我将偏移量设置为 0 0
在 python 中使用 org.mpris.mediaplayer2.player PlaybackStatus 属性

The 规格页 http specifications freedesktop org mpris spec latest Player Interface html summary对于这个特定的接口说 PlaybackStatus s P

随机推荐

删除 t-sql 中所有大表的最佳方法是什么？

我们遇到了一个有点奇怪的情况基本上我们的一个数据库中有两个表其中包含大量我们不需要或不关心的日志信息部分原因是我们的磁盘空间不足我正在尝试清理表但这需要很长时间在周末运行后仍然有 57 000 000 多条记录而这只是第一个
PageView 内的 InteractiveViewer

我正在创建一个包含图像列表的 PageView 并且我想向每个图像添加 InteractiveViewer 以便可以调整其大小以查看详细信息这是我写的 PageView builder dragStartBehavior DragStar
将 numpy 数组转换为十六进制字节数组

我想在 python 2 7 中将 numpy 数组转换为字节串比如说我的 numpy 数组a是一个简单的2x2数组看起来像这样 1 10 16 255 我的问题是如何将此数组转换为字节字符串或字节数组输出如下 x01 x0A x1
如何使用webpack导入静态url

如何使用 webpack 导入静态 url index js import http google com myscript js 确实不清楚你想做什么但总的来说你有几个选择预先下载脚本或通过 NPM 安装这可能是处理外部依赖关系的首
Ruby on Rails robots.txt 文件夹

我即将启动 Ruby on Rails 应用程序作为最后一个任务我想设置机器人 txt文件我找不到有关如何为 Rails 应用程序正确编写路径的信息起始路径是否始终是 Ruby on Rails 应用程序或应用程序文件夹的根路径那
启用 iCloud 时 iOS 应用程序在首次启动时冻结

我在 iOS 应用程序中启用了 iCloud 并且在首次启动应用程序时当我按下应用程序中的任何视图时应用程序会冻结大约 5 秒我跟着this http timroadley com 2012 04 03 core data in ic
GitHub - 当非默认分支与主分支合并时，PR 链接的问题不会被关闭

I have main作为默认分支和dev作为非默认我创建了一个问题和一个 PR 以从新的合并temp分支到dev分支在公关中我曾提到过Resolves 1 当我将 PR 合并到dev分支问题 1不会关闭因为它是非默认分支然后我
使用 STM32F0 ADC 单独读取不同的输入

STM32F072CBU 微控制器我有多个 ADC 输入并且希望单独读取它们 STMcubeMX 生成样板代码假设我希望按顺序读取所有输入但我无法弄清楚如何纠正这个问题这篇博文 http blog koepi info 2015
如何在本地执行 Capistrano 任务？

我定义了一个自定义 Capistrano 任务该任务应该在本地运行在我的开发计算机上 desc Push code to Dreamhost task push do run git push dreamhost end 但是当我尝试跑
python dask DataFrame，支持（可并行化）行应用吗？

我最近发现dask http dask pydata org en latest index html旨在成为一个易于使用的 python 并行处理模块对我来说最大的卖点是它可以与熊猫一起使用在阅读了其手册页后我找不到一种方法来完成这
如何获取Python字典中的最高键？

d 苹果 9 橙子 3 葡萄 22 如何返回最大的键值编辑如何制作一个按最大到最低值排序的列表 gt gt gt d apple 9 oranges 3 grapes 22 gt gt gt v k max v k for k v i
包 inputenc 错误：Unicode char \u8:β 未设置为与 LaTeX 一起使用

我在 Bibdesk 中的参考文献之一包含一些拉丁希腊字符例如我在 TEXMAKER 中使用参考时收到错误包 inputenc 错误 Unicode char u8 未设置为与 LaTeX 一起使用我该如何设置它才能工作尽管使用
数据按用户分组为每周、每月

我有一个高库存折线图显示给定股票的每日和每周股价问题是当数据数组足够大时每日数据点将被采样为每周数据点而每周数据点将被采样为每月数据点有什么方法可以根据需要将用户设置为每周或每月提前致谢检查一下数据分组 http www
返回时如何刷新片段 UI

我是 Android 新手正在学习片段的知识并为其制作了一个演示因为我有一个片段我们可以从中转到另一个活动那里正在执行一些计算然后我们当时回到片段我想将该计算值显示到我的片段的文本视图中那么我应该使用哪种生命周期方法来执行此
TypeError：无法解压不可迭代的 NoneType 对象

我知道这个问题之前已经被问过但我似乎无法让我的问题工作 import numpy as np def load dataset def download filename source http yaan lecun com exdb m
如何从store方法获取上传的图片名称

当我在 Laravel 中存储图像时 path request gt file myImage gt store public src 它返回完整路径但如何仅获取给定的文件名这是返回路径的示例 public src ltX4COwEmv
JPackages JavaFX + Spring boot 无法启动

我正在尝试使用 Spring Boot 构建 JavaFX 应用程序并使用 jpackage 进行部署当使用javafx maven plugin javafx run命令我可以看到项目启动但在将其构建为 msi安装程序安装并启动
使用 rvmrc 或 ruby-version 文件通过 RVM 设置项目 gemset？

我使用RVM Ruby 版本管理器 https rvm io 为我的每个 Rails 项目指定 Ruby 版本和一组 gem 我有一个 rvmrc文件来自动选择 Ruby 版本和 gemset 每当我cd进入项目目录安装 RVM 1 19
git-p4 正在吃掉我的图像文件

所以我可以使用 git p4 从 p4 导入没有任何问题一切似乎都正常但我的 PNG 文件也许还有其他文件正在损坏我读过有关 gitattributes 和行结束问题的内容但我所做的一切似乎都无法改变最终结果破碎的图像我
如何使用 joblib.dump 在 s3 上保存 sklearn 模型？

我有一个 sklearn 模型我想使用 joblib dump 将 pickle 文件保存在我的 s3 存储桶上 I used joblib dump model model pkl 将模型保存到本地但我不知道如何将其保存到 s3 存储

如何使用 joblib.dump 在 s3 上保存 sklearn 模型？

如何使用 joblib.dump 在 s3 上保存 sklearn 模型？ 的相关文章

随机推荐

热门标签

如何使用 joblib.dump 在 s3 上保存 sklearn 模型？的相关文章