如何将 futures::Stream 写入磁盘而不先将其完全存储在内存中？

2024-04-19

这里有一个使用 Rusoto S3 下载文件的示例：如何将从 S3 使用 Rusoto 下载的文件保存到我的硬盘？ https://stackoverflow.com/questions/51287360/how-to-save-a-file-downloaded-from-s3-with-rusoto-to-my-hard-drive

问题在于，它看起来像是将整个文件下载到内存中，然后将其写入磁盘，因为它使用write_all https://doc.rust-lang.org/std/io/trait.Write.html#method.write_all方法接受字节数组，而不是流。我怎样才能使用StreamingBody https://rusoto.github.io/rusoto/rusoto_s3/struct.StreamingBody.html，它实现了futures::Stream https://docs.rs/futures/0.1/futures/stream/trait.Stream.html将文件流式传输到磁盘？

Since StreamingBody实施Stream<Item = Vec<u8>, Error = Error>，我们可以构建一个MCVE https://stackoverflow.com/help/mcve这代表着：

extern crate futures; // 0.1.25

use futures::{prelude::*, stream};

type Error = Box<std::error::Error>;

fn streaming_body() -> impl Stream<Item = Vec<u8>, Error = Error> {
    const DUMMY_DATA: &[&[u8]] = &[b"0123", b"4567", b"89AB", b"CDEF"];
    let iter_of_owned_bytes = DUMMY_DATA.iter().map(|&b| b.to_owned());
    stream::iter_ok(iter_of_owned_bytes)
}

然后我们可以以某种方式获得“流媒体主体”并使用Stream::for_each https://docs.rs/futures/0.1.25/futures/stream/trait.Stream.html#method.for_each处理中的每个元素Stream。在这里，我们只需调用write_all提供一些输出位置：

use std::{fs::File, io::Write};

fn save_to_disk(mut file: impl Write) -> impl Future<Item = (), Error = Error> {
    streaming_body().for_each(move |chunk| file.write_all(&chunk).map_err(Into::into))
}

然后我们可以编写一些测试主要内容：

fn main() {
    let mut file = Vec::new();

    {
        let fut = save_to_disk(&mut file);
        fut.wait().expect("Could not drive future");
    }

    assert_eq!(file, b"0123456789ABCDEF");
}

关于这个简单实现的质量的重要注意事项：

致电给write_all可能会阻塞，您不应该在异步程序中这样做。最好将阻塞工作交给线程池。
的用法Future::wait强制线程阻塞，直到未来完成，这对于测试来说非常有用，但对于您的实际用例可能不正确。

也可以看看：

在 future-rs 中封装阻塞 I/O 的最佳方法是什么？ https://stackoverflow.com/q/41932137/155423
如何在稳定的 Rust 中同步返回在异步 Future 中计算的值？ https://stackoverflow.com/q/52521201/155423

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何将 futures::Stream 写入磁盘而不先将其完全存储在内存中？的相关文章

允许 Rust 格式中未使用的命名参数！() 系列

Given format red reset text red RED blue BLUE reset RESET 编译器退出并出现错误 error named argument never used gt example rs 1 47
如何在 python apache beam 中展平多个 Pcollection

应该如何实现位于以下位置的以下逻辑 https beam apache org documentation pipelines design your pipeline https beam apache org documentation
FutureBuilder 使我的应用程序冻结，因为它在构建之前等待文件加载

我正在编写一个非常基本的 flutter 应用程序用于阅读公共领域的书籍我在应用程序的资产中包含了一个包含一本书的 txt 文件因为一本书很长并且需要时间来加载所以我尝试使用 FutureBuilder 它会在加载书籍时显示圆形进度
如何使用release编译一些依赖项

我想使用 dev 配置文件构建我的 Rust 应用程序但使用 release 配置文件构建一些依赖项因为否则它们真的很慢如何有选择地为我的板条箱依赖项指定配置文件 Cargo 能够覆盖特定包裹的配置文件来自参考 https doc
如何使用（不安全）别名？

Rust 有严格的别名规则但如果我知道自己在做什么我可以解决这些问题吗我试图将一个 C 函数转换为 Rust 该函数通过从输入缓冲区读取并写入目标缓冲区来执行复杂的操作但它有一个巧妙的优化允许输入和输出缓冲区相同 foo src
相同代码的货物构建：虚假的编译时错误？

我有板条箱A取决于B and B取决于rust nmea https github com Dushistov rust nmea crate 如果我建造箱子A我遇到了很多错误所有错误都错过了 use std error Error 在构
什么时候适合使用关联类型而不是泛型类型？

In 这个问题 https stackoverflow com q 32053402 155423 出现了一个问题可以通过将使用泛型类型参数的尝试更改为关联类型来解决这引发了一个问题为什么关联类型在这里更合适这让我想了解更多 The
Rust 双与号，&&

我看到一些代码如下所示 fn test lt a gt a mut a str 我知道 a 是一生而是引用但是我很难理解双重引用根据我的理解引用是一个指针那么是指向另一个指针还是其他指针的指针根据我的理解引用是一个指针是
如何替换 PathBuf 或 Path 的文件扩展名？

我当前的解决方案是 let temp format png path file stem unwrap to string lossy path pop path push temp 这相当难看需要至少 6 次函数调用并创建一个新字符串
货运公司如何决定是否重建部门？

我正在考虑跳过货物中的依赖关系构建步骤我有一个简单的项目使用 3 个板条箱作为依赖项在Cargo toml 我使用一次构建项目cargo build release 现在我有另一个项目它使用其中提到的相同依赖项Cargo toml文
对于实现相同特征的结构，如何克服类型不兼容的匹配臂？

我正在尝试写cat命令来学习 Rust 但我似乎无法将命令行参数转换为阅读器结构 use std env io use std fs File fn main for arg in env args skip 1 let reader ma
如何区分缺少的反序列化字段和空字段？

我想用Serde https serde rs 将一些 JSON 解析为 HTTP PATCH 请求的一部分由于 PATCH 请求不传递整个对象仅传递要更新的相关数据因此我需要能够区分未传递的值和显式设置为的值null 以及存在的值
为什么使用非文字模式时无法访问此匹配模式？

以下代码 let max column 7 edge match current column 0 gt Edge Left max column gt Edge Right gt Edge NotAnEdge 结果出现以下警告 warni
如何将异步函数存储在结构中并从结构实例调用它？

我正在尝试用新的方法来实现这一目标async await句法 std future Futures 和最新版本的 Tokio 我正在使用东京0 2 0 alpha 4和铁锈1 39 0 nightly 我尝试过的不同事情包括 using B
是否存在具有单个强所有者和多个弱引用的共享指针？

我正在寻找类似于的智能指针Arc Rc只不过它不允许共享所有权我想要尽可能多的rc Weak我需要的参考资料但我只想one强引用又称所有者我想通过类型系统来强制执行这一点 Arc Rc可以克隆并且可以在多个地方拥有它们滚动我自己
在 HTML5 websocket 服务器中切割媒体流，用于基于网络的聊天/视频会议应用程序

我们目前正在开发一个聊天文件共享视频会议应用程序使用 HTML5 websocket https stackoverflow com questions 4220672 implementing webbased real time v
确定 std::istream 长度的更好方法？

有没有比以下更好的方法来确定 std istream 的长度 std istream pcStream GetSomeStream pcStream gt seekg 0 ios end unsigned int uiLength pcSt
使用 serde 通过数值作为类型标识符对 json 进行反序列化

我对 Rust 很陌生并且有 OOP 背景所以也许我误解了一些 Rust 基础知识我想用 serde 解析固定的 json 结构该结构代表不同的消息类型之一每条消息都有一个数字type属性来区分它各个消息类型的确切结构大多不同
将 Rust 应用程序从 macOS 交叉编译到 Raspberry Pi 2 时，“与arm-linux-gnueabihf-gcc 链接失败”

我想将 macOS 上的 Rust 应用程序交叉编译到 Raspberry Pi 2 我进行了很多搜索但没有找到可行的解决方案我尝试的最后一个解决方案是遵循这个answer https stackoverflow com questio
我可以在 Rust 中将 const 与重载运算符一起使用吗？

在此代码中 allow dead code use std ops Add struct Foo i32 const X i32 1 const Y i32 X X const A Foo Foo 1 const B Foo A A imp

随机推荐

从日期中减去时间 - 时刻 js

例如我有这个日期时间 01 20 00 06 26 2014 我想减去这样的时间 00 03 15 之后我想将结果格式化为这样 3 hours and 15 minutes earlier 我怎样才能做到这一点使用moment js edi
useReducer Action 调度两次

Scenario 我有一个返回操作的自定义挂钩父组件 Container 利用自定义钩子并将操作作为 prop 传递给子组件 Problem 当从子组件执行操作时实际调度会发生两次现在如果子级直接使用钩子并调用操作则调度仅发生一次
当我不知道它是否是临时的时，C++ 返回类型

假设Foo是一个相当大的数据结构我应该怎样写一个const返回实例的虚函数Foo 如果我不知道继承的类是否会存储Foo内部因此允许通过引用返回如果我无法在内部存储它我的理解是我无法返回const引用它因为它将是临时的它是否正确
如何使用 Laravel + JavaScript 创建搜索过滤器？

我最近创建了一个 JavaScript 过滤器来过滤产品表中的数据我有 5 个字段可以输入搜索它们是描述型号经销商和库存我将表与另一个视图中的产品分开并将字段保留在索引中我需要该表返回我在字段中输入的值我举了一个用描述
WP7 检查互联网是否可用

我的应用程序 WP7 未被接受因为如果互联网不可用它无法加载我寻找一种方法来检查它并找到了这个命令 NetworkInterface GetIsNetworkAvailable 但它无法在模拟器上运行而且我没有任何设备来测试它有人
在 git-svn 中克隆主干后克隆分支的最佳方法是什么？

给定一个包含许多分支的大型 Subversion 存储库我想开始使用git svn通过克隆trunk首先然后添加特定分支我看到至少三种方法可以做到这一点但是其中任何一种都是官方的还是有最好的方法假设以下布局 https svn
Delphi 6：在缺少抽象类方法时强制编译器错误？

我使用的是 Delphi Pro 6 现在了解类是否缺少基类抽象方法的唯一方法是等待 IDE 发出包含抽象方法 base class 抽象方法名称警告或在尝试调用缺少的方法时等待运行时抽象错误方法前者是不够的因为它只查找当前项目中
如何在 log4j 中启用包级别日志记录

谁能告诉我 log4j 中的包级别日志记录是什么以及如何实现这一点今天我的面试问题无法回答即使我在谷歌中也没有找到好的解决方案太感谢了包级别日志记录是 log4j 的标准日志记录使用 log4j 配置您可以指定包和关联的级别
将 std::wstring 转换为 int

我认为这非常简单但我无法让它发挥作用我只是想将 std wstring 转换为 int 到目前为止我已经尝试了两种方法第一种是将 C 方法与 atoi 一起使用如下所示 int ConvertedInteger atoi OrigW
如何让传单地图画布具有 100% 的高度？

我的传单画布目前如下所示高度为 700 像素不过我希望它的高度为 100 以便占据整个空白区域高度 100 在地图画布的 CSS 属性中不起作用我找到了一些解决方案但它们只适用于谷歌地图有没有人有解决方案即使这只是一个解决方法
在 Matplotlib 3D 绘图中获取观察/相机角度？

当我用鼠标旋转 Matplotlib 3D 图时如何保存视角相机位置并在下次运行脚本时使用这些值以编程方式设置视角 TL DR 视角存储在图形的轴对象中名称为elev and azim 并且视图可以设置为plt gca view i
jQuery AJAX 参数未传递给 MVC

我有点陷入可能是常见的情况但找不到太多解决方案我将单个 int 参数传递给 MVC 控制器方法期望返回 Json 响应问题是该参数虽然在客户端填充但在服务器端无法识别并被解释为空这是代码 function getBatches
无法在react-native中获取iOS推送通知设备令牌

我提到这个问题 https stackoverflow com questions 35387227 get device token with react native获取设备令牌以便将推送通知发送到我的应用程序我使用创建了我的应用程序
如何在 Swift 中获取由整数表示的 Unicode 代码点？

所以我知道如何将字符串转换为utf8格式如下所示 for character in strings utf8 for example A will converted to 65 var utf8Value character 我已经阅读
“栅栏已经激活——来不及添加写入”

下面的错误信息是什么意思栅栏已经激活来不及添加写入以下是如何获取它的示例环境 Mac OS X http en wikipedia org wiki Mac OS X Lion 流星0 3 8 项目创建 meteor create
熊猫到D3。将数据帧序列化为 JSON

我有一个包含以下列且没有重复项的 DataFrame region type name value 可以看作是一个层次结构如下所示 grouped df groupby region type name 我想将此层次结构序列化为 JSON
任何无需 GUI/X 会话即可使用 GreaseMonkey 脚本运行 Firefox 的方法

我需要为第三方网站构建一个小型监控抓取工具这是一个外部网站其中包含有关我们访问者的统计信息不幸的是这个网站很难通过正常的 wget 机制因为它使用了大量复杂的 JS 其中一部分是由 GWT 生成的所以我的解决方法是创建一个
如何让 celery Worker 停止接收新任务 (Kubernetes)

因此我们有一个 kubernetes 集群运行一些带有 celery 工作线程的 pod 我们使用 python3 6 来运行这些工作程序 celery 版本是 3 1 2 我知道真的很旧我们正在努力升级它我们还设置了一些自动缩放
git checkout 区别 git checkout origin/ 和 git checkout ?

当我做git checkout origin bugfix NTP 183 datefnsgit 显示 Note checking out origin bugfix NTP 183 datefns You are in detached
如何将 futures::Stream 写入磁盘而不先将其完全存储在内存中？

这里有一个使用 Rusoto S3 下载文件的示例如何将从 S3 使用 Rusoto 下载的文件保存到我的硬盘 https stackoverflow com questions 51287360 how to save a file d

如何将 futures::Stream 写入磁盘而不先将其完全存储在内存中？

如何将 futures::Stream 写入磁盘而不先将其完全存储在内存中？ 的相关文章

随机推荐

热门标签

如何将 futures::Stream 写入磁盘而不先将其完全存储在内存中？的相关文章