假设我正在尝试使用 Rust 做一个奇特的零拷贝解析器&str
,但有时我需要修改文本(例如实现变量替换)。我真的想做这样的事情:
fn main() {
let mut v: Vec<&str> = "Hello there $world!".split_whitespace().collect();
for t in v.iter_mut() {
if (t.contains("$world")) {
*t = &t.replace("$world", "Earth");
}
}
println!("{:?}", &v);
}
但当然String
由返回t.replace()
活得不够长。有没有好的办法解决这个问题?也许有一种类型的意思是“理想情况下&str
但如果有必要的话String
“?或者也许有一种方法可以使用生命周期注释来告诉编译器返回的String
应该保持存活直到结束main()
(或者具有相同的生命周期v
)?
Rust 正是你想要的Cow http://doc.rust-lang.org/std/borrow/enum.Cow.html(写入时克隆)类型。
use std::borrow::Cow;
fn main() {
let mut v: Vec<_> = "Hello there $world!".split_whitespace()
.map(|s| Cow::Borrowed(s))
.collect();
for t in v.iter_mut() {
if t.contains("$world") {
*t.to_mut() = t.replace("$world", "Earth");
}
}
println!("{:?}", &v);
}
正如 @sellibitze 正确指出的那样,to_mut()
创建一个新的String
这会导致堆分配来存储以前借用的值。如果您确定只有借用的字符串,那么您可以使用
*t = Cow::Owned(t.replace("$world", "Earth"));
如果 Vec 包含Cow::Owned
元素,这仍然会丢弃分配。您可以使用以下方法来防止这种情况发生非常脆弱且不安全for 循环中的代码(它直接对 UTF-8 字符串进行基于字节的操作,并依赖于替换恰好是完全相同的字节数这一事实。)。
let mut last_pos = 0; // so we don't start at the beginning every time
while let Some(pos) = t[last_pos..].find("$world") {
let p = pos + last_pos; // find always starts at last_pos
last_pos = pos + 5;
unsafe {
let s = t.to_mut().as_mut_vec(); // operating on Vec is easier
s.remove(p); // remove $ sign
for (c, sc) in "Earth".bytes().zip(&mut s[p..]) {
*sc = c;
}
}
}
请注意,这完全是根据“$world”->“Earth”映射定制的。任何其他映射都需要在不安全代码中仔细考虑。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)