Iterator::collect 分配的内存量是否与 String::with_capacity 相同？

2024-04-22

在 C++ 中，当连接一堆字符串时（其中每个元素的大小大致已知），通常会预先分配内存以避免多次重新分配和移动：

std::vector<std::string> words;
constexpr size_t APPROX_SIZE = 20;

std::string phrase;
phrase.reserve((words.size() + 5) * APPROX_SIZE);  // <-- avoid multiple allocations
for (const auto &w : words)
  phrase.append(w);

同样，我在 Rust 中做到了这一点（这个块需要unicode 分段 https://crates.io/crates/unicode-segmentation crate)

fn reverse(input: &str) -> String {
    let mut result = String::with_capacity(input.len());
    for gc in input.graphemes(true /*extended*/).rev() {
        result.push_str(gc)
    }
    result
}

有人告诉我，惯用的做法是使用单个表达式

fn reverse(input: &str) -> String {
  input
      .graphemes(true /*extended*/)
      .rev()
      .collect::<Vec<&str>>()
      .concat()
}

虽然我真的很喜欢它并且想使用它，但从内存分配的角度来看，前者分配的块会比后者少吗？

我用它拆解了这个cargo rustc --release -- --emit asm -C "llvm-args=-x86-asm-syntax=intel"但它没有散布源代码，所以我不知所措。

您的原始代码很好，我不建议更改它。

原始版本分配一次：内部String::with_capacity.

第二个版本分配at least两次：首先，它创建一个Vec<&str>并通过以下方式增长它pushing &str就可以了。然后，它计算所有的总大小&strs 并创建一个新的String具有正确的尺寸。（此代码位于the join_generic_copy中的方法str.rs https://github.com/rust-lang/rust/blob/1.38.0/src/liballoc/str.rs.) 这很糟糕，原因如下：

显然，它进行了不必要的分配。
字素簇可以任意大，因此中间Vec无法提前有效地调整大小——它只是从大小 1 开始并从那里开始增长。
对于典型的字符串，它分配更多空间比实际需要的只是存储最终结果，因为&str大小通常为 16 字节，而 UTF-8 字素簇通常远小于此大小。
迭代中间过程会浪费时间Vec获得最终尺寸，您可以从原始尺寸中获取它&str.

最重要的是，我什至不认为这个版本是惯用的，因为它collect进入临时状态Vec为了迭代它，而不仅仅是collect原始迭代器，就像您在答案的早期版本中所做的那样。此版本修复了问题 #3 并使问题 #4 变得无关紧要，但没有令人满意地解决问题 #2：

input.graphemes(true).rev().collect()

collect uses FromIterator for String，这将尝试使用 https://github.com/rust-lang/rust/blob/1.38.0/src/liballoc/vec.rs#L1921的下界size_hint来自Iterator实施Graphemes。然而，正如我之前提到的，扩展字素簇可以任意长，因此下限不能大于 1。更糟糕的是，&strs 可能为空，所以FromIterator<&str> for String不知道anything关于结果的大小（以字节为单位）。这段代码只是创建一个空的String并打电话push_str反复地在上面。

需要明确的是，这还不错！String有一个保证摊销 O(1) 插入的增长策略，因此，如果您的字符串大多很小，不需要经常重新分配，或者您不认为分配成本是瓶颈，请使用collect::<String>()如果您发现它更具可读性并且更容易推理，那么这里可能是合理的。

让我们回到原来的代码。

let mut result = String::with_capacity(input.len());
for gc in input.graphemes(true).rev() {
    result.push_str(gc);
}

This 是惯用的. collect也是惯用语，但所有collect基本上就是上面的，初始容量不太准确。自从collect没有做你想做的事，自己编写代码并不不符合习惯。

有一个稍微更简洁的迭代器版本，仍然只进行一次分配。使用extend方法，它是Extend<&str> for String:

fn reverse(input: &str) -> String {
    let mut result = String::with_capacity(input.len());
    result.extend(input.graphemes(true).rev());
    result
}

我有一种模糊的感觉extend更好，但是这两种都是编写相同代码的完全惯用的方式。你不应该重写它来使用collect，除非您觉得这更好地表达了意图and你不关心额外的分配。

压平和收集切片的效率 https://stackoverflow.com/questions/58571612/efficiency-of-flattening-and-collecting-slices

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Rust

dynamicmemoryallocation

Iterator::collect 分配的内存量是否与 String::with_capacity 相同？的相关文章

为什么 Rust 在生成线程时强制在 i32 情况下使用 move？

我是 Rust 新手看起来我严重缺少一些概念 use std thread fn main let mut children vec spawn threads for i in 0 10 let c thread spawn print
如何在 Rust 中删除字符串的第一个和最后一个字符？

我想知道如何删除 Rust 中字符串的第一个和最后一个字符 Example Input Hello World Output ello Worl 您可以使用 chars 迭代器并忽略第一个和最后一个字符 fn rem first and l
循环时，.iter() 与引用 (&) 有何不同？

在玩 Rust 时我发现你可以循环Vecs and HashMaps 可能还有其他通过引用而不是使用 iter let xs vec 1 2 3 4 5 for x in xs println x x The iter 函数似乎具有相
什么是构建依赖项？

构建依赖关系中解释货物簿 https doc rust lang org cargo reference specifying dependencies html build dependencies 您可以依赖其他基于 Cargo 的板
在 Rust 中，我用什么来与多个线程和一个 writer 共享一个对象？

当对象有时可能由一个所有者写入时在多个线程之间共享公共对象的正确方法是什么我尝试创建一个ConfigurationTrait 对象具有多种获取和设置配置键的方法我想将其传递给可以读取配置项的其他线程如果每个人都能写和读那就加分了
是否有替代方法或方法让 Rc> 限制 X 的可变性？

use std rc Rc use std cell RefCell Don t want to copy for performance reasons struct LibraryData Fields Creates and muta
如何根据操作系统系列拥有不同的依赖关系

我正在编写一个跨平台库它具有特定于平台的依赖关系一个用于类 UNIX 平台一个用于 Windows 这些板条箱仅在特定平台上编译因此我不能正常地将它们全部添加到依赖项下在我实际使用的 Rust 代码中cfg属性例如 cfg un
Rust Json 序列化重叠职责

我正在学习 Rust 中的 Json 序列化特别是如何将 Rust 对象序列化为 Json 目前我看到 3 种将结构体实例转换为 Json 的方法派生可编码特征手动实现 ToJson 特征手动实现可编码特征下面的代码说明了所有 3
如何使用相同的可变借用调用 serde_json::to_writer 两次？

我正在尝试编写一个调用的函数serde json to writer https docs serde rs serde json ser fn to writer html两次写两件事但我不知道如何写这是一次尝试 extern cra
如何匹配特质实现者

我有一个由某些结构实现的特征我想编写一个模式匹配可以处理每种可能的情况 trait Base struct Foo x u32 struct Bar y u32 impl Base for Foo impl Base for Bar f
从文本文件中读取所有内容 - C

我正在尝试从文本文件中读取所有内容这是我写的代码 include
如何在 Option::and_then 或 Option::map 闭包中使用 async/await 而不使用 OptionFuture？

我想运行类似以下代码的代码 async fn get user s str gt Option
你能克隆一个闭包吗？

A FnMut由于显而易见的原因闭包无法被克隆但是Fn闭包具有不可变的范围有没有办法创建一个重复 Fn关闭尝试克隆它会导致 error E0599 no method named clone found for type std
为什么 ops::Range 不实现 Copy，即使 T 是 Copy？

最近我想编写一个保存 3D 投影参数的类型 use std ops Range derive Clone Copy struct CamProj Near and far plane proj range Range
为什么在特征中返回“Self”可以工作，但返回“Option”需要“Sized”？

这个特征定义编译得很好 trait Works fn foo gt Self 然而这确实会导致错误 trait Errors fn foo gt Option
2D 中的大量旋转

我正在尝试使用 Bevy 0 3 并且我可以轻松使用内置转换Camera2dComponents default 这是自上而下的二维问题在于尝试将玩家的旋转与鼠标同步 for event in evreader iter cursor m
如何在 HashSet 或 HashMap 中使用自定义哈希函数？

由于 SipHasher 对于我的用例来说太慢因此我尝试实现自定义哈希函数我发现一个例子 https github com rust lang rust blob master src librustc util nodemap rs我
如何与超级请求处理程序共享不可变的配置数据？

我正在尝试用 Rust 开发一个基于超级的服务器应用程序有一个 INI 文件保存诸如绑定 IP 数据库等配置我不想在每个请求上解析 INI 文件并且可以保留配置数据直到服务器重新启动如何向请求处理程序提供已解析数据的结构我尝试过几
当函数中的模式匹配采用 &self 或 &mut self 时，如何避免使用 ref 关键字？

铁锈书称为ref关键词遗产 https doc rust lang org book ch18 03 pattern syntax html legacy patterns ref and ref mut 因为我想遵循隐含的建议来避免re
错误[E0554]：#！[功能]可能无法在稳定发布通道上使用无法使用货物安装赛车

我正在尝试使用 Cargo 安装 Racer 所以我执行了命令cargo install racer在终端中并导致错误 error E0554 feature may not be used on the stable release ch

随机推荐

Django 模型：设置相对于另一个字段的默认值

我正在使用 Django 1 10 作为后端构建一个应用程序是否可以设置模型字段相对于同一实例中另一个模型的默认值我特别需要设置second visit s默认为 3 周后first visit class SomeModel mode
映射列类型 Slick 3.1.1

我是 Slick 的新手很难将 java sql date time timestamp 映射到 jodatime trait ColumnTypeMappings val profile JdbcProfile import profi
如何将索引从一个索引节点移动到 couchbase 中的另一个索引节点

我在 couchbase 集群中有 6 个索引节点我想替换一次索引节点并将索引从旧索引节点移动到新索引节点将索引从一个节点移动到另一个节点的最佳实践是什么在 Couchbase 5 5 中您可以使用 ALTER INDEX 语句将索
WooCommerce 根据用户角色更改 BACS 订单状态

我收到几个订单其中客户选择直接银行转账然后他们改变主意并希望通过信用卡付款这非常烦人因为我必须手动将订单从暂停更改为待付款以便他们可以通过订单下我的帐户中的订单支付端点通过卡付款我一直在使用WooCommer
错误：命令失败，rc=65536 python 和 mod_wsgi

我遇到这个问题我正在运行 pythonbrew 来获取 python2 7 因此我重新编译了 mod wsgi 以使用 2 7 python 为此我遵循了本教程 code google com p modwsgi wiki QuickI
python 中的跨平台代码

如何在 python 中编写一些 Windows 代码仅当我在 widnows 中运行脚本时才执行如果我应该在 linux 中运行它则应该忽略这部分 windows 代码与此类似在 C 中 ifdef windows code e
C++ 如何将“this”传递给指针引用

我有一个主类我喜欢将其指针引用传递给我创建的对象但它给了我错误错误 1 错误 C2664 GameController GameController GameLayer 无法将参数 1 从 GameLayer const 转换为 Ga
ListView 的转换视图类型 BaseAdapter 错误

我有一个使用不同类型的视图行的列表视图适配器大多数时候它工作得很好但是当我从列表中删除一个元素时它会崩溃它将错误类型的convertView发送到getView public View getView int position Vie
@csrf_exempt 在 Django 1.4 中停止工作

我有以下代码在 Django 1 2 5 中运行良好 from django views decorators csrf import csrf exempt class ApiView object def call self requ
在新窗口中使用 jquery 显示从控制器返回的 PDF 流

我有一个控制器操作它读取 pdf从 azure blob 存储中读取文件并将流对象返回到 ajax method 控制器返回 var stream blobStorage OpenRead filepath await FileAsync
x86 Assembly：很难找到无限循环挑战的想法

我打算和我的朋友们进行一场类似于 corewars 的比赛我们使用与原始游戏相同的内存网格在游戏中我们每个人都应该写一个保险箱它是一个不超过 25 行的无限循环每个安全都有一个技巧或代码可以停止循环从而破坏安全例如 S
Jqgrid 模态 Colspan

我想将 colspan 属性应用于 JQgrid 模式窗口内的 td 它呈现具有以下结构的模态形式
如何从 trie 构造 DAWG？

我只是构建一个trie http en wikipedia org wiki Trie对于一个词汇表然后我发现有很多分支共享相同的结构我想将它们组合在一起结果是DAWG http en wikipedia org wiki Deter
Rails 5 和 Devise：如何在不更改默认策略的情况下禁用基于令牌的策略上的会话

我有一个 Rails 5 应用程序使用两种身份验证策略一种使用基于令牌的身份验证另一种使用基于默认会话的身份验证当我触发令牌身份验证时我试图禁用会话保存因为当我使用 JWT 对用户进行身份验证时它会保存会话并且该会话应该是无
HTML，PHP - 在回显时转义“<”和“>”符号[重复]

这个问题在这里已经有答案了我想按原样打印以下文本 echo
C 中带有通配符的目录列表

有现成的功能吗C可以使用列出目录的内容wildcards过滤掉文件名例如相当于 echo b 它显示四个字符长且不以 b 开头的目录条目的名称我知道我可以使用scandir 但是我需要提供自己的过滤功能 include
从应用程序注销后阻止浏览器中的后退选项

我正在开发 ASP NET 应用程序我想阻止用户在从应用程序注销后使用浏览器中的后退按钮查看上一页感谢您的所有回复 Code Response Cache SetCacheability HttpCacheability NoCache
使用二进制而不是源文件在 R 中安装包：如何更改默认值

我刚刚更新了R and RStudio昨晚在我的 Macbook Pro 上升级到最新版本 R 版本 3 5 1 2018 07 02 RStudio 版本 1 1 453 然后我意识到当我尝试在 RStudio 中安装包时它会通过编译
在这种情况下，为什么 std::bind 中需要占位符？

回答的同时这个问题 https stackoverflow com questions 22909459 how can i pass a class method to another function like what happen
Iterator::collect 分配的内存量是否与 String::with_capacity 相同？

在 C 中当连接一堆字符串时其中每个元素的大小大致已知通常会预先分配内存以避免多次重新分配和移动 std vector

Iterator::collect 分配的内存量是否与 String::with_capacity 相同？

Related

Iterator::collect 分配的内存量是否与 String::with_capacity 相同？ 的相关文章

随机推荐

热门标签

Iterator::collect 分配的内存量是否与 String::with_capacity 相同？的相关文章