Rails:如何将文件从 S3 发送到远程服务器

2023-12-09

我一直在四处寻找,似乎找不到一个好的解决方案。我的 Rails 应用程序将其文件存储在 Amazon S3 中。我现在需要将它们发送到远程(第三方)服务。

我正在使用 RestClient 发布到第三方服务器,如下所示:

send_file = RestClient::Request.execute(
    :method => :post,
    :url => "http://remote-server-url.com",
    :payload => File.new("some_local_file.avi", 'rb'),
    :multipart => true,
    etc.... )

它适用于本地文件,但如何将远程文件从 S3 直接发送到此第 3 方服务?

我在这里找到了一个答案,有人使用 open-uri:ruby 使用 open-URI 从 S3 读取文件

我自己测试了一下,效果很好。

:payload => open(URI.parse("http://amazon-s3-example.com/some_file.avi"))

但是,我在这里读到一条评论,说 open-uri 只是将远程文件加载到内存中。请参阅此答案的最后评论:https://stackoverflow.com/a/264239/2785592

这并不理想,因为我正在处理可能很大的视频文件。我还读过 RestClient 甚至将本地文件加载到内存中的地方;再说一遍,这并不理想。有谁知道这是真的吗?

当然我不可能是唯一一个有这个问题的人。我知道我可以在发送之前在本地下载 S3 文件,但我希望节省时间和带宽。另外,如果 RestClient 真的does即使将本地文件加载到内存中,比在本地下载它也不会为我节省任何东西。呵呵。

任何建议将不胜感激。谢谢 :)

Update:远程服务器只是一个响应post请求的API。我没有能力改变他们的任何事情。


看一眼:https://github.com/rest-client/rest-client/blob/master/lib/restclient/payload.rb

RestClient绝对支持流式上传。条件是,在有效负载中,您传递的内容不是字符串或散列,并且您传递的内容响应读取和大小。 (所以基本上是一个流)。

在 S3 方面,您基本上需要抓取一个流,而不是在发送之前读取整个对象。你用http://docs.aws.amazon.com/sdkforruby/api/Aws/S3/Client.html#get_object-instance_method并且您说您想要在响应目标中获取 IO 对象(而不是字符串)。为此,您可以使用 IO.pipe

reader, writer = IO.pipe

fork do 
    reader.close
    s3.get_object(bucket: 'bucket-name', key: 'object-key') do |chunk|
      writer.write(chunk)
    end
end

writer.close

您将阅读器传递给 RestClient::Payload.generate 并将其用作您的有效负载。如果读取部分比写入部分慢,您可能仍然在内存中读取很多内容。您希望,在写入时只接受您愿意在内存中缓冲的数量。您可以使用 writer.stat.size (在 fork 内)读取流的大小,并在流超过特定大小后对其进行旋转。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Rails:如何将文件从 S3 发送到远程服务器 的相关文章

随机推荐