Rust 与 Python 程序性能结果问题

2024-03-20

我写了一个计算字数的程序。

这是程序

use std::collections::HashMap;
use std::io;
use std::io::prelude::*;

#[derive(Debug)]
struct Entry {
    word: String,
    count: u32,
}

static SEPARATORS: &'static [char] = &[
    ' ', ',', '.', '!', '?', '\'', '"', '\n', '(', ')', '#', '{', '}', '[', ']', '-', ';', ':',
];

fn main() {
    if let Err(err) = try_main() {
        if err.kind() == std::io::ErrorKind::BrokenPipe {
            return;
        }
        // Ignore any error that may occur while writing to stderr.
        let _ = writeln!(std::io::stderr(), "{}", err);
    }
}

fn try_main() -> Result<(), std::io::Error> {
    let mut words: HashMap<String, u32> = HashMap::new();
    let stdin = io::stdin();
    for result in stdin.lock().lines() {
        let line = result?;
        line_processor(line, &mut words)
    }
    output(&mut words)?;
    Ok(())
}

fn line_processor(line: String, words: &mut HashMap<String, u32>) {
    let mut word = String::new();

    for c in line.chars() {
        if SEPARATORS.contains(&c) {
            add_word(word, words);
            word = String::new();
        } else {
            word.push_str(&c.to_string());
        }
    }
}

fn add_word(word: String, words: &mut HashMap<String, u32>) {
    if word.len() > 0 {
        if words.contains_key::<str>(&word) {
            words.insert(word.to_string(), words.get(&word).unwrap() + 1);
        } else {
            words.insert(word.to_string(), 1);
        }
        // println!("word >{}<", word.to_string())
    }
}

fn output(words: &mut HashMap<String, u32>) -> Result<(), std::io::Error> {
    let mut stack = Vec::<Entry>::new();

    for (k, v) in words {
        stack.push(Entry {
            word: k.to_string(),
            count: *v,
        });
    }

    stack.sort_by(|a, b| b.count.cmp(&a.count));
    stack.reverse();

    let stdout = io::stdout();
    let mut stdout = stdout.lock();
    while let Some(entry) = stack.pop() {
        writeln!(stdout, "{}\t{}", entry.count, entry.word)?;
    }
    Ok(())
}

它将任意文本文件作为输入并计算单词数以产生一些输出，例如：

15  the
14  in
11  are
10  and
10  of
9   species
9   bats
8   horseshoe
8   is
6   or
6   as
5   which
5   their

我这样编译它：

cargo build --release

我这样运行：

cat wiki-sample.txt | ./target/release/wordstats  | head -n 50

我使用的 wiki-sample.txt 文件是here https://www.dropbox.com/s/3p3cwhk04va2o8g/wiki-sample.txt?dl=1

我将执行时间与 python (3.8) 版本进行了比较：

import sys
from collections import defaultdict

# import unidecode

seps = set(
    [
        " ",
        ",",
        ".",
        "!",
        "?",
        "'",
        '"',
        "\n",
        "(",
        ")",
        "#",
        "{",
        "}",
        "[",
        "]",
        "-",
        ";",
        ":",
    ]
)


def out(result):
    for i in result:
        print(f"{i[1]}\t{i[0]}")


if __name__ == "__main__":
    c = defaultdict(int)

    for line in sys.stdin:
        words = line.split(" ")
        for word in words:
            clean_word = []
            for char in word:
                if char not in seps and char:
                    clean_word.append(char)
            r = "".join(clean_word)
            # r = unidecode.unidecode(r)
            if r:
                c[r] += 1

    r = sorted(list(c.items()), key=lambda x: -x[1])
    try:
        out(r)
    except BrokenPipeError as e:
        pass

我这样运行它：

cat /tmp/t.txt | ./venv/bin/python3 src/main.py | head -n 100

平均计算时间为：rust -> 5'，python3.8 -> 19'
python 版本（我认为）优化较差（整行的分割需要额外的 O(n)）
这是单线程进程，并且是一个非常简单的程序
大部分计算时间都在字循环处理中，输出几乎是即时的。
我还删除了删除重音的库代码，以更接近两种语言的标准库。

Question： Rust 的性能“仅”提高约 3-4 倍，这正常吗？

我还想知道我是否在这里遗漏了一些东西，因为我发现“仅”100Mb 数据的计算时间相当长。我不认为（天真地）有一些处理与较低的大 O 对此，我可能是错的。

我习惯于将一些 python 代码与 go、java 或 vlang 中的等效代码进行比较，并且这些工作台的速度通常会提高 20 倍到 100 倍。

也许cpython擅长这种处理，也许我错过了rust程序中的一些东西（我对rust很陌生）以使其更加高效。

我害怕在测试中错过一些重要的东西，但是对此有什么想法吗？

编辑：根据人们的建议，我现在有以下版本：

use std::collections::HashMap;
use std::io;
use std::io::prelude::*;

#[derive(Debug)]
struct Entry<'a> {
    word: &'a str, // word: String,
    count: u32,
}

static SEPARATORS: &'static [char] = &[
    ' ', ',', '.', '!', '?', '\'', '"', '\n', '(', ')', '#', '{', '}', '[', ']', '-', ';', ':',
];

fn main() {
    if let Err(err) = try_main() {
        if err.kind() == std::io::ErrorKind::BrokenPipe {
            return;
        }
        // Ignore any error that may occur while writing to stderr.
        let _ = writeln!(std::io::stderr(), "{}", err);
    }
}

fn try_main() -> Result<(), std::io::Error> {
    let mut words: HashMap<String, u32> = HashMap::new();
    let stdin = io::stdin();
    for result in stdin.lock().lines() {
        let line = result?;
        line_processor(line, &mut words)
    }
    output(&mut words)?;
    Ok(())
}

fn line_processor(line: String, words: &mut HashMap<String, u32>) {
    let mut l = line.as_str();
    loop {
        if let Some(pos) = l.find(|c: char| SEPARATORS.contains(&c)) {
            let (head, tail) = l.split_at(pos);
            add_word(head.to_owned(), words);
            l = &tail[1..];
        } else {
            break;
        }
    }
}

fn add_word(word: String, words: &mut HashMap<String, u32>) {
    if word.len() > 0 {
        let count = words.entry(word).or_insert(0);
        *count += 1;
    }
}

fn output(words: &mut HashMap<String, u32>) -> Result<(), std::io::Error> {
    let mut stack = Vec::<Entry>::new();

    for (k, v) in words {
        stack.push(Entry {
            word: k.as_str(), // word: k.to_string(),
            count: *v,
        });
    }

    stack.sort_by(|a, b| a.count.cmp(&b.count));

    let stdout = io::stdout();
    let mut stdout = stdout.lock();
    while let Some(entry) = stack.pop() {
        writeln!(stdout, "{}\t{}", entry.count, entry.word)?;
    }
    Ok(())
}

现在在我的电脑上大约需要 2.6'。这比 python 版本要好得多，几乎快 10 倍，虽然更好，但仍然没有达到我的预期（这不是一个真正的问题）。可能还有一些我暂时没有想到的其他优化。

您可以通过避免 UTF-8 验证来加快速度，并使用bstr crate.

use std::io;
use std::io::prelude::*;

use bstr::{BStr, BString, io::BufReadExt, ByteSlice};

type HashMap<K, V> = fnv::FnvHashMap<K, V>;

#[derive(Debug)]
struct Entry<'a> {
    word: &'a BStr,
    count: u32,
}

static SEPSET: &'static [u8] = b" ,.!?'\"\n()#{}[]-;:";

fn main() {
    if let Err(err) = try_main() {
        if err.kind() == std::io::ErrorKind::BrokenPipe {
            return;
        }
        // Ignore any error that may occur while writing to stderr.
        let _ = writeln!(std::io::stderr(), "{}", err);
    }
}

fn try_main() -> Result<(), std::io::Error> {
    let mut words: HashMap<BString, u32> = HashMap::default();
    io::stdin().lock().for_byte_line(|line| {
        line_processor(line, &mut words);
        Ok(true)
    })?;
    output(&mut words)?;
    Ok(())
}

fn line_processor(mut line: &[u8], words: &mut HashMap<BString, u32>) {
    loop {
        if let Some(pos) = line.find_byteset(SEPSET) {
            let (head, tail) = line.split_at(pos);
            add_word(head, words);
            line = &tail[1..];
        } else {
            break;
        }
    }
}

fn add_word(word: &[u8], words: &mut HashMap<BString, u32>) {
    if word.len() > 0 {
        // The vast majority of the time we are looking
        // up a word that already exists, so don't bother
        // allocating in the common path. This means the
        // uncommon path does two lookups, but it's so
        // uncommon that the overall result is much faster.
        if let Some(count) = words.get_mut(word.as_bstr()) {
            *count += 1;
        } else {
            words.insert(BString::from(word), 1);
        }
    }
}

fn output(words: &mut HashMap<BString, u32>) -> Result<(), std::io::Error> {
    let mut stack = Vec::<Entry>::new();

    for (k, v) in words {
        stack.push(Entry {
            word: k.as_bstr(),
            count: *v,
        });
    }

    stack.sort_by(|a, b| a.count.cmp(&b.count));

    let stdout = io::stdout();
    let mut stdout = stdout.lock();
    while let Some(entry) = stack.pop() {
        writeln!(stdout, "{}\t{}", entry.count, entry.word)?;
    }
    Ok(())
}

此时，程序的大部分时间都花在了hashmap查找上。（这就是为什么我改用fnv上面。）因此，此时使其更快可能意味着使用不同的策略来维护单词映射。我的猜测是，大多数单词的长度只有几个字节，因此您可以在特殊情况下使用数组作为映射而不是哈希映射。它可能会带来显着的加速，但也会使您的原始程序变得更加复杂。

至于这个速度是否是人们所期望的，我会说，“对我来说似乎是正确的”。您的程序正在对 1450 万字文档中的每个字执行一项操作。上面的程序在我的机器上大约需要 1.7 秒，这意味着它每秒处理大约 830 万个单词，或者每微秒大约 8.3 个单词。考虑到每个单词都会进行哈希查找并且需要搜索才能找到下一个单词，这似乎是正确的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Rust 与 Python 程序性能结果问题的相关文章

使用应用程序脚本将 MS Word 文件（保存在云端硬盘中）转换为 Google 文档

我被某些事情困住了找不到解决办法有没有办法使用文件 url 或 id 将存储在 Google Drive 中的 MS Word 文件转换为 Google 文档我目前有一个电子表格其中包含文件的网址或者也可以使用 python 脚
以矢量化方式在另一个 DataFrame 中查找包含值子集的行

如何匹配此 DataFrame 中的值source car id lat lon 0 100 10 0 15 0 1 100 12 0 10 0 2 100 09 0 08 0 3 110 23 0 12 0 4 110 18 0 32 0
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
Python 的 mysqldb 晦涩文档

Python 模块 mysqldb 中有许多转义函数我不理解它们的文档而且我努力查找它们也没有发现任何结果 gt gt gt print mysql escape doc escape obj dict escape any speci
使用多级解决方案计算二维网格中的最近邻

我有一个问题在 x y 大小的网格中我提供了一个点并且我需要找到最近的邻居在实践中我试图在 pygame 中找到距离光标最近的点该点跨越颜色距离阈值计算如下 sqrt rgb1 0 rgb2 0 2 rgb1 1 rgb2 1
如何使用 i18n 切换器将“LANGUAGE_CODE”保存到数据库，以便在 Django 中的不同浏览器中语言不会更改？

有什么办法可以改变它的值LANGUAGE CODE单击按钮发送请求时 settings py 中的变量会动态变化吗我希望用户设置自己的默认语言他们的帐户现在用户可以使用下拉列表选择他们的首选语言并且网站会得到完美的翻译并且
对于相同的查询，MySQL Workbench 比 Python 快得多

MySQL Workbench 中的以下查询需要 0 156 秒才能完成 SELECT date time minute price id FROM minute prices WHERE contract id 673 AND TIMES
按多个键分组并对字典列表的值进行汇总/平均值

在Python中按多个键进行分组并对字典列表进行汇总平均值的最Pythonic方法是什么假设我有一个字典列表如下所示 input dept 001 sku foo transId uniqueId1 qty 100 dept 001
reStructuredText：README.rst 未在 PyPI 上解析

我有一个托管在 Github 和 PyPI 上的 Python 项目在 Github 上 https github com sloria TextBlob blob master README rst https github com s
如何将类添加到 LinkML 中的 SchemaDefinition？

中的图表https linkml io linkml model docs SchemaDefinition https linkml io linkml model docs SchemaDefinition and https link
Python 3在for循环中更改字典键的值不起作用

我的 python 3 代码没有按预期工作 def addFunc x y print x y def subABC x y z print x y z def doublePower base exp print 2 base exp d
Pandas groupby apply 执行缓慢

我正在开发一个涉及大量数据的程序我正在使用 python pandas 模块来查找数据中的错误这通常工作得非常快然而我当前编写的这段代码似乎比应有的速度慢得多我正在寻找一种方法来加快速度为了让你们正确测试它我上传了一段相当大的
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
在Python中连续解析文件

我正在编写一个脚本该脚本使用 HTTP 流量行解析文件并取出域目前仅将它们打印到屏幕上我正在使用 httpry 将流量连续写入文件这是我用来删除域名的脚本 usr bin python import re input open r
更新 SQLAlchemy 中的特定行

我将 SQLAlchemy 与 python 一起使用我想更新表中等于此查询的特定行 UPDATE User SET name user WHERE id 3 我通过 sql alchemy 编写了这段代码但它不起作用 session
Streamlabs API 405 响应代码

我正在尝试使用Streamlabs API https dev streamlabs com Streamlabs API 使用 Oauth2 来创建应用程序因此首先我将使用我的应用程序的用户发送到一个授权链接其中包含我的应用程序的客
实现 Index 特征以返回非引用的值

我有一个想要实现的简单结构Index 但作为 Rust 的新手我在借用检查器方面遇到了许多麻烦我的结构非常简单我想让它存储一个起始值和步骤值然后当由usize它应该返回start idx step pub struct MyStru
如何使用 Python 3 正确显示倒计时日期

我正在尝试获取将显示的倒计时基本上就像一个世界末日时钟哈哈有人可以帮忙吗 import os import sys import time import datetime def timer endTime datetime datet
iPhone 3GS 上的 ARM 与 Thumb 性能比较，非浮点代码

我想知道是否有人有关于 iPhone 3GS 上 ARM 与 Thumb 代码性能的硬性数据特别是对于非浮点 VFP 或 NEON 代码我知道 Thumb 模式下的浮点性能问题更大的 ARM 指令的额外代码大小是否会在某个时刻成为性能

随机推荐

连接 Wi-Fi 网络时如何使用蜂窝数据？

我期待在连接 Wi Fi 时使用蜂窝数据 Yi行车记录仪的工作原理是这样的易相机制作软AP iOS 或 Android 手机连接 Wi Fi YI和Phone之间建立内部网络一般情况下手机不能上网但是在Yi网络中手机可以使用互联
从“选择应用程序”列表中隐藏 NFC 应用程序/禁用通过外部 NFC 意图启动

我目前正在为 Android 编写几个支持 NFC 的应用程序并想知道如何阻止我的应用程序出现在选择应用程序列表中该列表在从启动器或非 NFC 应用程序扫描标签时打开我只希望我的应用程序能够在打开时读取标签我当前的意图过滤器
软件包：cx_Oracle for Python 3.5，windows64 位。甲骨文11.2.0.1.0

我正在尝试在我的 Windows PC 上安装 cx Oracle 我在命令提示符下运行了以下命令 pip install cx Oracle 这给了我以下错误 Collecting cx Oracle Could not find a v
终止程序是否以与 free() 相同的方式回收内存？

I saw 这个答案 https stackoverflow com a 6347182 8183900关于堆栈溢出问题该问题表明在 C 程序的最后释放内存实际上是有害的因为它将不会再次使用的变量移动到系统内存中我很困惑为什么 C 中
Eclipse CDT - 如何快速计算代码中没有的表达式？

我已经离开 Eclipse CDT 一段时间了已经被 JetBrains 优秀的 IDE 宠坏了而且公司不让我拥有Clion https www jetbrains com clion 诚然这些主要针对解释型语言而不是编译型语言因
不解析 RESTful 应用程序中的视图

我正在使用 Spring MVC 3 构建一个具有 RESTful Web 服务的 Web 应用程序 Web 服务将由应用程序使用因此永远不应该真正解析对视图的任何请求有什么方法可以在 servlet 上下文中指定任何请求都不应解析到任
WordPress 用户上传不带扩展名的照片

我遇到了最奇怪的问题我的网站上有一位作家使用 WordPress 4 2 2 但这种情况发生了几个月不断上传名称为 00甚至没有扩展名并且由于某些黑暗的原因这些图像绕过了 WordPress 上传过滤器并获得了疯狂的名称例如jp
如何在 vaadin 7 中创建复杂的标头？

我使用 setColumnHeader Object String 将一个简单的字符串设置为列标题我想创建一个复杂的标题我想知道是否有任何方法可以在 Vaadin 7 中构建如下图所示的类似表 https i stack imgur c
Web Audio API 从暂停状态恢复

我经常读到无法使用以下命令暂停恢复音频文件网络音频API https dvcs w3 org hg audio raw file tip webaudio specification html 但现在我看到了一个example http
加载 XSLT 文档时路径中存在非法字符

我正在创建一个方法来返回 HTML 字符串作为 XSLT 转换的结果当我运行以下代码时我在以下行中收到路径错误中的非法字符 xsltTransform Load xsltTemplate 注意我已经通过另一种方法测试了 XSLT 转换并
GCM：java.lang.NoClassDefFoundError：com/google/android/gcm/server/Sender

我一直在尝试让 Google Cloud Messaging 在 Eclipse 中工作我能够编译他们的演示网页上给出的示例并运行它没有任何错误但是当我尝试使用 jersey 创建自己的示例时当以下代码尝试创建发件人时我收到运行
Delphi 2010 如何设置IDE打开项目对话框的初始文件夹

有谁知道如何在Delphi 2010 IDE中设置打开项目或打开文件对话框的初始文件夹我第一次在 USB 硬盘上安装 D2010 打开的对话框总是恢复到 Windows 驱动器 D 而 Delphi 在驱动器 R 上在工具选项环境
LDAP：ldap.SIZELIMIT_EXCEEDED

我正在得到一个ldap SIZELIMIT EXCEEDED当我运行此代码时出错 import ldap url ldap
WebStorm：配置 Prettier 使用选项卡？

The 更漂亮的文档 https prettier io docs en options html tabs说使用 use tabs覆盖默认行为 WebStorm 自动填充 Prettier 包那是一个文件夹我尝试将其更改为npm pr
格式化 C# 字符串，使其值之间的间距相同

我有3根弦第一组字符串是 1 0536 2 1 2 第二个是这样的 Round Square Hex 最后是 6061 T6 T351 ASF 3 4 5 我需要将三个字符串组合在一起每个字符串之间的间距相同我无法使用 t 进行制表符
删除不必要的 svn:mergeinfo 属性

当我合并我的存储库中的内容时 Subversion 想要添加更改很多内容svn mergeinfo与我要合并的内容完全无关的文件的属性有关此行为的问题之前已在 Stack Overflow 上提出过工作副本根目录以外的路径上的 SVN
带有“href”的plotly树形图元素不适用于本地相对html路径

我有一个简单的表格文本内有 href href指向本地html文件的相对路径但点击它并不会打开该页面有什么办法可以做到这一点好的解决方法吗文件夹结构如下由于root会改变所以需要相对路径 root root index htm
Iphone - 当每个单元格高度是动态时，何时计算 tableview 的 heightForRowAtIndexPath？

我已经多次看到这个问题被问到但令人惊讶的是我没有看到一致的答案所以我自己尝试一下如果您有一个包含您自己的自定义 UITableViewCells 的 tableview 其中包含 UITextViews 和 UILabels 其高度
如何根据整个 github actions 工作流程的成功或失败设置 github 分支保护规则？

我正在尝试根据 github 操作工作流程的成功或失败设置 github 分支保护规则您可以在此处查看工作流程 https github com apostropecms apostrope blob main github workfl
Rust 与 Python 程序性能结果问题

我写了一个计算字数的程序这是程序 use std collections HashMap use std io use std io prelude derive Debug struct Entry word String count

Rust 与 Python 程序性能结果问题

Rust 与 Python 程序性能结果问题 的相关文章

随机推荐

热门标签

Rust 与 Python 程序性能结果问题的相关文章