有什么方法可以使用 boto3 直接将文件写入 S3 吗？

2024-03-18

我编写了一个 python 脚本来处理非常大的文件（总共几 TB），我将在 EC2 实例上运行该脚本。之后，我想将处理后的文件存储在 S3 存储桶中。目前，我的脚本首先将数据保存到磁盘，然后将其上传到S3。不幸的是，考虑到等待实例首先写入磁盘然后上传需要花费额外的时间，这将是相当昂贵的。

有没有办法使用boto3将文件直接写入S3存储桶？

编辑：为了澄清我的问题，我问内存中是否有一个对象，将该对象直接写入 S3，而不先将该对象保存到磁盘上。

您可以使用放置对象 https://boto3.readthedocs.io/en/latest/reference/services/s3.html#S3.Client.put_object为了这。只需将文件对象作为正文传递即可。

例如：

import boto3

client = boto3.client('s3')
response = client.put_object( 
    Bucket='your-s3-bucket-name',
    Body='bytes or seekable file-like object',
    Key='Object key for which the PUT operation was initiated'
)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

有什么方法可以使用 boto3 直接将文件写入 S3 吗？的相关文章

Python Numpy Reshape错误[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我在尝试重塑 3D numpy 数组时遇到一个奇怪的错误数组 x 的形状为 6 10 300 我想将其重塑为 6 3000 我正
高效地将大型 Pandas 数据帧写入磁盘

我正在尝试找到使用 Python Pandas 高效地将大型数据帧 250MB 写入磁盘或从磁盘写入的最佳方法我已经尝试了所有方法Python 数据分析但表现却非常令人失望这是一个更大项目的一部分该项目探索将我们当前的分析数据管理
sy.sympify(str(表达式)) 不等于表达式

据我了解 str将 SymPy 表达式转换为字符串并sympify将字符串转换为 SymPy 表达式因此我希望以下内容成立对于合理的表达 gt gt gt sy sympify str expr expr True 我尝试过这个确实
当我从本地计算机更改为虚拟主机时，从 python 脚本调用 pdftotext 不起作用

我编写了一个小的 python 脚本来解析提取 PDF 中的信息我在本地机器上测试了它我有 python 2 6 2 和 pdftotext 版本 0 12 4 我正在尝试在我的虚拟主机服务器 dreamhost 上运行它它有 py
烧瓶 - 404 未找到

我是烧瓶开发的新手这是我在烧瓶中的第一个程序但它向我显示了这个错误在服务器上找不到请求的 URL 如果您输入了网址请手动检查拼写并重试这是我的代码 from flask import Flask app Flask name ap
样本（）和r样本（）有什么区别？

当我从 PyTorch 中的发行版中采样时两者sample and rsample似乎给出了类似的结果 import torch seaborn as sns x torch distributions Normal torch tens
我们能否知道回形针下载何时完成？

我有一个应用程序我需要知道用户的 Rails Paperclip 文件下载时间complete 我的应用程序设置为与 Amazon S3 交互当用户收到完整的文件时我需要运行 JavaScript 函数我怎样才能做到这一点跟踪天气
从字典中绘制直方图

我创建了一个dictionary计算 a 中出现的次数list每个键的内容我现在想绘制其内容的直方图这是我想要绘制的字典的内容 1 27 34 1 3 72 4 62 5 33 6 36 7 20 8 12 9 9 10 6 11 5
Python sys.modules 包含尚未导入的模块

我试图了解加载的模块与导入的模块之间的区别如果有的话我正在使用 Python 2 7 3 并且只是从命令行运行 Python 如果我执行 import sys sys modules 我得到一个列表其中包括os 例如文档说sys m
dask apply：AttributeError：“DataFrame”对象没有属性“name”

我有一个参数数据框并对每一行应用一个函数该函数本质上是几个 sql queries 和对结果的简单计算我正在尝试利用 Dask 的多处理同时保持结构和界面下面的例子有效并且确实有显着的提升 def get metrics row
Pandas如何按时间段过滤DataFrame

我有一个包含下表的文件 Name AvailableDate totalRemaining 0 X3321 2018 03 14 13 00 00 200 1 X3321 2018 03 14 14 00 00 200 2 X3321 20
将密钥对添加到现有 EC2 实例

我被给予AWS控制台访问正在运行 2 个实例的帐户但我无法关闭在生产中但是我想获得对这些实例的 SSH 访问权限是否可以创建一个新的密钥对并将其应用到实例以便我可以通过 SSH 访问获取现有的pem当前无法选择创建实例所用的密
Django 1.7 应用程序配置导入错误：没有名为 appname.apps 的模块

我正在尝试按照以下文档为我的一个名为文章的 Django 应用程序设置自定义应用程序配置https docs djangoproject com en dev ref applications https docs djangoproj
Python：“直接”调用方法是否实例化对象？

我是 Python 新手在对我的对象进行单元测试时我注意到一些奇怪的东西 class Ape object def init self print ooook def say self s print s def main Ape
django 中的身份验证方法返回 None

你好我在 django 中做了一个简单的注册和登录页面当想要登录时登录视图中的身份验证方法不返回任何内容我的身份验证应用程序模型 py from django db import models from django contri
AWS CodePipeline 构建缺少 Git 历史记录

Context 我设置了一个 CodePipeline 它使用 CodeCommit 和 CodeBuild 作为其源和构建阶段我的构建包括一个插件 com zoltu git versioning 使用 Git 提交历史记录来动态创建构
预测测试图像时出现错误 - 无法重塑大小数组

我正在尝试使用 TensorFlow 和 Keras 在 Python 中进行图像识别并且我已经关注了下面的博客 https stackabuse com image recognition in python with tensorfl
如何在 Python 中跟踪日志文件？

我想在 Python 中提供 tail F 或类似内容的输出而无需阻塞或锁定我找到了一些非常旧的代码来做到这一点here http code activestate com recipes 436477 filetailpy 但我认为现
在 for 循环中访问 itertools 产品的元素

我有一个列表列表是附加 itertools 产品的一些其他结果的结果我想要的是能够使用 for 循环访问列表列表中列表的每个元素但我无法访问所有元素我只能访问最后一个列表的元素结果是一个非常巨大的列表列表例如 1 2 4 3 6
为什么我的 PyGame 应用程序根本不运行？

我有一个简单的 Pygame 程序 usr bin env python import pygame from pygame locals import pygame init win pygame display set mode 400

随机推荐

OpenId + 记住我/保持登录状态

我有一个问题关于如何什么是使用 OpenId 并提供保持登录状态的最佳方法例如如果我查看 Stackoverflow 我已经使用 Google 登录如果我关闭浏览器并返回它仍然显示我已登录 However 我没有登录谷歌而且我
Rails 引擎存在外键问题

我正在开发一个 Rails 引擎这是我的gem gemspec s required ruby version gt 2 0 0 s add dependency rails gt 4 2 0 s add dependency enume
angularjs - 在范围或 ng-model 上使用“字符串”名称

在普通的 JavaScript 中你可以像这样声明变量 var obj obj item text obj item text 这里给出的例子 http jsbin com petafu 1 edit http jsbin com pet
Google Play 排行榜 UI 颜色更改

在我刚刚开发的游戏中直到一周前排行榜 UI 颜色还是深半透明的绿色这看起来感觉很好至少对眼睛不刺激突然之间它变成了明亮的半透明红色并且从那时起就一直保持这种颜色这种颜色与我游戏的任何阶段的任何屏幕都不匹配这是我的排行榜屏幕
如何在 Dart 中创建 HTML 链接？

我想用 Dart 创建一个 HTML 链接在 HTML 中我会写 You can click a href url 1 here a and a href url 2 there a 我不知道如何在 Dart 中做到这一点我尝试过类似的
Python xlwt 创建错误的 Excel 书

我正在尝试使用xlwt创建具有多个选项卡的输出文件 xlsx 格式我的Python版本号是2 7 我使用Aptana Studio 3作为IDE 我用过xlwt包之前具有相同的环境执行相同的任务效果很好但这一次一开始运行良好然
将 gcc libs .data 放在特定部分？

我正在尝试为我们的嵌入式系统切换到 GNU GCC 编译器但由于我们芯片的内存布局被分割我在链接该项目时遇到了问题 RAM section 1 0x10000 0x12FFF RAM section 2 0x18000 0x1BFFF
Express js中通过id删除mongodb文档

我正在为此抓狂尝试通过 id 删除文档 router delete api menu delete id function req res var id req params id db get collection menu funct
如何在自定义验证属性中获取/注入服务

我们使用 NET Core 3 1 5 这是一个 Blazor 服务器应用程序我们有一个 ValidationAttribute 并需要访问外部服务来验证对象 ValidationAttribute 有 IsValid 方法 protec
有没有办法在 C# 中修改进程 DACL

我有更改进程 DACL 的遗留 C 代码并尝试使用 NET 3 5 中的托管代码类我在网上找到了代码其中有人创建了一个 SetAclOnServices 类该类扩展了服务的 NativeObjectSecurity 类我认为我可以
jQuery 数据表中的列排序

我已经了解了 jQuery 数据表插件中的列排序以及控制它的各种方法我有一个查询是否可以通过单击上箭头图标将按升序和下箭头图标进行排序的方式控制排序会按降序排序吗有两种方法可以做到这一点具体取决于datatables版本编辑数据表版
如何在Python中将一个对象的所有属性复制到另一个对象？

在Python中是否有一个库方法可以复制同一类的两个已经存在的实例之间的所有属性我的意思是类似 Apache Commons 的东西PropertyUtilsBean copyProperties Try destination
ActiveRecord 查询比直接 SQL 慢得多？

我一直致力于优化项目的数据库调用我注意到下面两个相同的调用之间的性能存在显着差异 connection ActiveRecord Base connection pgresult connection execute SELECT S
当我“推”到 Bitbucket 时，可以从 VPS 中“拉”一个钩子

我正在 Bitbucket 中管理我的 WordPress 模板每次我push主题我必须登录我的 VPS 服务器并且pull回购协议我想自动完成如果我自己运行 git daemon 我找到了一个解决方案推送到服务器后执行自动拉取请
基于现有模板生成Word文档的最佳方法是什么

TL DR 我可以使用 NET 生成 Word 文档如 XAML ItemTemplates 吗我发现很难找到一个满足我所有要求的解决方案所以我想我会把它扔到 stackoverflow 希望有人能指导我非常感谢简单来说我需要根
如何根据条目的长度过滤 pandas 数据框

在 pandas 数据框中我有一个字段 amp 应由长度为 495 的列表填充是否有一种 pandas ic 方法可以快速过滤此长度使得具有字段 amp 的所有行不等于 495被丢弃 I tried df len df amp 495
如何将 SQL 查询与不同的表达式结合起来？

我的三个查询已经达到了我的 SQL 知识的顶峰 Microsoft SQL 2005 如果这很重要现在我需要将它们组合成一个查询并将所有值放在一行上我的实际查询如下但我认为如果我在这里提供一个简单的版本会更容易查询一 Provid
尝试覆盖 Hive 分区时写入 __HIVE_DEFAULT_PARTITION__ 的行已损坏

当尝试使用 Spark 2 3 覆盖 Hive 表中的分区时我看到一些非常奇怪的行为首先我在构建 SparkSession 时设置以下设置 config spark sql sources partitionOverwriteMode
XmlPullParser：获取包含 XML 标签的内部文本

假设您有一个如下所示的 XML 文档
有什么方法可以使用 boto3 直接将文件写入 S3 吗？

我编写了一个 python 脚本来处理非常大的文件总共几 TB 我将在 EC2 实例上运行该脚本之后我想将处理后的文件存储在 S3 存储桶中目前我的脚本首先将数据保存到磁盘然后将其上传到S3 不幸的是考虑到等待实例首先写入磁盘

有什么方法可以使用 boto3 直接将文件写入 S3 吗？

有什么方法可以使用 boto3 直接将文件写入 S3 吗？ 的相关文章

随机推荐

热门标签

有什么方法可以使用 boto3 直接将文件写入 S3 吗？的相关文章