如何在S3中保存数据流？ aws-sdk-go 示例不起作用？

2023-12-24

我正在尝试将给定的数据流持久保存到 S3 兼容存储中。在流结束之前，大小是未知的，大小可能从 5MB 到 ~500GB 不等。

我尝试了不同的可能性，但没有找到比自己实现分片更好的解决方案。我最好的猜测是使用我的流填充固定大小的缓冲区并将其写入 S3。有更好的解决方案吗？也许这是一种对我来说透明的方式，无需将整个流写入内存？

aws-sdk-go 自述文件有一个示例程序，它从 stdin 获取数据并将其写入 S3：https://github.com/aws/aws-sdk-go#using-the-go-sdk https://github.com/aws/aws-sdk-go#using-the-go-sdk

当我尝试用管道输入数据时|我收到以下错误：failed to upload object, SerializationError: failed to compute request body size caused by: seek /dev/stdin: illegal seek我做错了什么或者这个例子没有像我预期的那样工作吗？

我虽然尝试过 minio-go，但PutObject() https://github.com/xxorde/minio-steam-to-s3/blob/018b08b15b35ce528abc9af621bef28490fff67e/main.go or client.PutObject Streaming() https://github.com/xxorde/minio-steam-to-s3/blob/e74829acddc8f8693efc54da2d8d086d1a5e8a3f/main.go。这是可行的，但消耗的内存与要存储的数据一样多。

有更好的解决方案吗？
是否有一个小示例程序可以将任意数据传输到 S3 中？

你可以使用sdkUploader http://docs.aws.amazon.com/sdk-for-go/api/service/s3/s3manager/#Uploader处理未知大小的上传，但您需要os.Stdin通过将其包装成“不可查找”io.Reader。这是因为Uploader，虽然它只需要一个io.Reader作为输入主体，它在底层会检查输入主体是否也是一个Seeker如果是的话，它确实会调用Seek在上面。自从os.Stdin只是一个*os.File它实现了Seeker接口，默认情况下，你会得到与你得到的相同的错误PutObjectWithContext.

The Uploader还允许您以可配置大小的块的形式上传数据，并且还可以配置应同时上传的块的数量。

这是链接示例的修改版本，删除了可以保持不变的代码。

package main

import (
    // ...
    "io"
    "github.com/aws/aws-sdk-go/service/s3/s3manager"
)

type reader struct {
    r io.Reader
}

func (r *reader) Read(p []byte) (int, error) {
    return r.r.Read(p)
}

func main() {
    // ... parse flags

    sess := session.Must(session.NewSession())
    uploader := s3manager.NewUploader(sess, func(u *s3manager.Uploader) {
        u.PartSize = 20 << 20 // 20MB
        // ... more configuration
    })

    // ... context stuff

    _, err := uploader.UploadWithContext(ctx, &s3manager.UploadInput{
        Bucket: aws.String(bucket),
        Key:    aws.String(key),
        Body:   &reader{os.Stdin},
    })

    // ... handle error
}

至于这是否是一个比minio-go我不知道，你必须自己测试一下。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在S3中保存数据流？ aws-sdk-go 示例不起作用？的相关文章

当使用 k8s.io/client-go 库的 kubernetes 部署发生更改时获得通知的最佳方式是什么？

Context 我正在编写一个使用k8s io client go https github com kubernetes client go 图书馆这里是 godocs https godoc org k8s io client go
有没有办法间歇性地执行重复性任务？

有没有办法在 Go 中执行重复的后台任务我在想类似的事情Timer schedule task delay period 在爪哇我知道我可以用 goroutine 来做到这一点Time sleep 但我想要一些容易停止的东西这是我得到
Facebook服务器端登录、CORS

我正在实现一个带有 FB 服务器端登录的网站简化步骤如下一个简单的按钮触发 JS 脚本该脚本调用我的后端 APIhttps localhost fblogin function sendFbLoginData get https lo
指针上定义的方法仍然可以用值调用

Effective Go 文档说明如下关于接收者的指针与值的规则是可以在指针和值上调用值方法但只能在指针上调用指针方法 http tip golang org doc effective go html pointers vs val
如何拥有在标准输出上更新的就地字符串

我想输出到标准输出并让输出覆盖以前的输出例如如果我输出On 1 10 我想要下一个输出On 2 10覆盖On 1 10 我怎样才能做到这一点 stdout是一个流 io Writer 您无法修改已写入其中的内容什么can更改的是该
使用 boto3 和 ftplib 将文件从 FTP 复制到 S3 存储桶失败，并显示“500 语法错误，命令无法识别”

我需要将数据从 FTP 服务器发送到 S3 存储桶而不将文件保存到本地驱动器在互联网上我发现我们可以使用io BytesIO 作为缓冲区但我的代码失败了 error perm 500 语法错误命令无法识别剧本 ftp ftpli
云存储 API 的错误导入“系统调用”

我正在按照以下说明进行操作https cloud google com appengine docs go googlecloudstorageclient download开始将一些代码从现已弃用的文件 API 迁移到新的 Cloud S
如何将长 Go 模板函数拆分为多行？

我有一个很长的printf调用 Go 模板例子 printf mongodb s s s s authSource admin replicaSet s readPreference nearest w majority Values r
AWS 获取带有自定义域的预签名 URL

以下是我正在做的事情我正在使用自定义域为我的非公开 s3 存储桶资源生成预签名 URL 另外为了添加证书我为具有以下原始设置的存储桶创建了一个 Cloudfront 发行版源域名 bucket name s3 amazonaws c
从 Golang 调用 C 函数

我想在 Golang 中编写控制器逻辑并处理 json 和数据库同时在 C 中使用我的数学处理模型在我看来调用 C 函数的开销必须尽可能低就像设置寄存器 rcx rdx rsi rdi 一样执行一些操作fastcall 并获取 r
所有可能的 GOOS 价值？

如果我做对了 GOOS在编译源代码时确定为了更好地支持多个操作系统我感兴趣的是GOOS可能当然 Go 是开源的所以它可能有无限的可能性所以我真正想要的是一个通用列表已知值为 windows linux darwin or fr
图像未在 Twitter 上显示 - 错误：由于请求超时，获取页面失败

这是我网站的网址https www healthdrop in https www healthdrop in我得到了错误由于请求超时获取页面失败试穿时https cards dev twitter com validator ht
在AWS S3中部署react-redux应用程序

我在堆栈溢出中遇到了很多类似的问题one https stackoverflow com questions 16267339 s3 static website hosting route all paths to index html
重新设计循环依赖缺陷

我有一堆小服务它们共享一些常见的包例如Logger Configuration and Net 我在单独的项目中编写了每个包问题是我的Logger需求包Configuration用于设置和我的Configuration not仅由L
pq：函数unnest（未知）不是唯一的

以下代码工作正常但我想将 array a b c d e 定义为变量 rows err db Query select colname from SELECT date unnest array a b c d e AS colname
如何使用自定义源正确设置 Amazon Route 53、CloudFront

我目前正在使用亚马逊 53 号公路用于我的 DNS 设置和自定义源亚马逊外部的 Web 服务器我想补充一下云锋混合但我不太确定如何设置它我已经看过 Amazon 关于使用 Route 53 和 CloudFront 设置 S3 的指南
ioutil.ReadFile - 没有这样的文件或目录[重复]

这个问题在这里已经有答案了对于以下代码 package main import fmt io ioutil strings func main b err ioutil ReadFile shakespeare txt if err ni
可执行文件不在路径中 - GO

我正在尝试调用命令提示符的内置命令但出现了我不明白的错误 func main cmd exec Command del C trial now txt Reboot if needed cmd Stdout os Stdout if er
golang 中 *(*int)(nil) = 0 是什么意思？

我注意到有一行 int nil 0在功能上throw https github com golang go blob master src runtime panic go L1113 go nosplit func throw s str
内存高效的大型数据集流式传输到 S3

我正在尝试使用 SQL alchemy 复制 S3 大型数据集大于 RAM 我的限制是我需要使用 sqlalchemy 我需要将内存压力保持在最低水平我不想使用本地 filsystem 作为中间步骤将数据发送到 s3 我只想通过管道将

随机推荐

Play 2.0 RESTful请求后处理

关于这个问题 https stackoverflow com questions 11060761 how can my play 2 app respond to different accept headers from the cli
没有模块命名常量

我想用 Tastypie 框架做示例应用程序我将 Tastypie 添加到已安装的应用程序并进行了修改urls py根据需要添加from tastypie api import Api 但当我打开http localhost 8000
iPhone 应用程序中出现奇怪的不需要的动画

我不想发布这个但我在我正在开发的 iPhone 应用程序中看到了不需要的动画我以前从未在我的应用程序或任何其他应用程序中见过这种情况此应用程序仅适用于 iOS 4 2 和 iPhone 即使在 iPhone4 上也会发生这种奇怪的情况
元组函数的 N 元版本

是否有一个库具有 n 元版本的元组函数例如first 等通过 Template Haskell 或使用其他方法理想情况下我想说 select 3 0 1 我们用它来表示 lambda x y z gt x y 对于一个通用的对于功能
如何在 Internet Explorer 中的全高表格中制作全高单元格

我有下一个html代码 table style width 100 height 100 tr td td tr table
我如何教 ProGuard 删除它保留但我不使用的东西？

我有一个 Android 项目proguard rules pro文件为app模块仅包含以下内容 ProGuard rules dontobfuscate dontwarn android arch util paging CountedD
获取特定格式日期的唯一 ID？

我有可以生成随机唯一 ID 的代码但是有没有办法可以编辑此代码以便它以特定方式如 yyyy mm dd 0001 获取日期我希望每次单击generateid按钮时最后4位数字加1 所以它将更改为 0002 这是我当前的代码有没有可
如何在 Java 中识别/处理文本文件换行符？

我从不同的系统获取不同格式的文件我需要将它们导入到我们的数据库中导入过程的一部分是检查行长度以确保格式正确我们似乎在处理来自添加了一个字符的 UNIX 系统的文件时遇到了问题我怀疑这是由于 UNIX 和 Windows 平台上的回车
Airflow：如何删除 DAG？

我已经启动了 Airflow 网络服务器并安排了一些 dags 我可以在 Web GUI 上看到这些 dags 如何删除正在运行并在 Web GUI 中显示的特定 DAG 有 Airflow CLI 命令可以做到这一点吗我环顾四周但找不
在 AMP 中运行 JavaScript

我对 JavaScript 应该如何在 AMP 页面中运行感到有点困惑据我了解我的 JavaScript 必须在 iframe 中执行此类 iframe 必须放置在页面下方至少从顶部起 75 并且必须通过 https 提供服务这确
std::runtime_error::runtime_error(const std::string&) 如何满足 std::Exception 对 throw() 的要求？

std exception要求它的构造函数是throw Yet std runtime error接受一个std string作为它的参数这表明它正在存储一个std string某处因此作业或复制构造必须在某个地方进行而对于std
http.sslVerify=false 不会在 git config 中禁用 ssl 验证

Issue 我一直在尝试通过来自企业 GitHub 服务器的 http 代理在 git 全局配置中设置从 Ubuntu AWS 实例克隆 git 存储库从代理克隆可以工作但是从实例克隆通过代理我收到以下错误致命无法访问 ht
在 Visual Studio 中调试 JavaScript 时出现“没有为当前文档加载符号”

我正在开发一个 NET 3 5 网站一个解决方案下有三个项目我在这个项目中使用 jQuery 我想使用 Visual Studio JavaScript 调试器来单步执行我的 JavaScript 代码如果我在任何 js 文件中设置断
QLabel Qt/c++ 文本的渐变颜色

我尝试为 QLabel 文本设置渐变颜色我正在尝试使用 setStyleSheet 函数但它不起作用我阅读这篇文章 https www qtcentre org threads 32781 don t work qlineargrad
data.table join + update with mult='first' 给出了意想不到的结果

在下面的示例中我有一个用户表和一个事务表其中一个用户可以有 0 个 1 个或多个事务我执行连接更新mult first 在 users 表上尝试插入一列指示每个用户第一次发生事务的日期 library data table v1
如何从 XLL UDF 返回数组

我正在尝试使用 C API 为 Excel 编写一个数组构造函数作为工作表函数 Goal array cons 1 2 3 gt 1 2 3 但是我没有正确初始化 XLOPER12 在 Excel 中我的函数当前返回 NUM 我正在将参
模块已经成功安装，但是导入时却找不到？ - Python

我正在尝试使用 graphviz Python 模块但遇到了这个问题我在命令提示符下安装了它但它没有显示在 IPython 中我还有一个 Python 3 5 32 位解释器它显示在其中但我正在尝试弄清楚如何安装它以便它在
如何找出 Instruments 中保留对象的内容？

我最近将我的 iOS 项目转换为 ARC 视图控制器之一没有调用其 dealloc 方法并且没有根据 Instruments 进行释放我已经仔细检查了我的所有属性并将适当的属性设置为弱我还确保任何将视图控制器作为委托的东西都在 vie
ZLIB 解压 - 客户端

我正在以 ZLIB 压缩输入流使用 Javascript Ajax JQuery 我需要在客户端解压缩它有办法这样做吗我已经在 J AVA 中工作了如下所示但需要在客户端执行此操作 url new URL getCodeBase
如何在S3中保存数据流？ aws-sdk-go 示例不起作用？

我正在尝试将给定的数据流持久保存到 S3 兼容存储中在流结束之前大小是未知的大小可能从 5MB 到 500GB 不等我尝试了不同的可能性但没有找到比自己实现分片更好的解决方案我最好的猜测是使用我的流填充固定大小的缓冲区并将其写入

如何在S3中保存数据流？ aws-sdk-go 示例不起作用？

如何在S3中保存数据流？ aws-sdk-go 示例不起作用？ 的相关文章

随机推荐

热门标签

如何在S3中保存数据流？ aws-sdk-go 示例不起作用？的相关文章