list.count() 与 Counter() 性能

2024-03-19

在尝试查找字符串中一堆字符的频率时，为什么对 4 个不同的字符运行 string.count(character) 4 次会比使用 collections.Counter(string) 产生更快的执行时间（使用 time.time()））？

背景：给定由字符串表示的一系列移动。有效移动为 R（右）、L（左）、U（上）和 D（下）。如果移动顺序带我回到原点，则返回 True。否则，返回 false。


# approach - 1 : iterate 4 times (3.9*10^-6 seconds)
def foo1(moves):
    return moves.count('U') == moves.count('D') and moves.count('L') == moves.count('R')

# approach - 2 iterate once (3.9*10^-5 seconds)
def foo2(moves): 
    from collections import Counter
    d = Counter(moves)
    return d['R'] == d['L'] and d['U'] == d['D']

import time
start = time.time()
moves = "LDRRLRUULRLRLRLRLRLRLRLRLRLRL"
foo1(moves)
# foo2(moves)
end = time.time()
print("--- %s seconds ---" % (end - start))

这些结果与我的预期相反。我的理由是，第一种方法应该需要更长的时间，因为字符串迭代了 4 次以上，而在第二种方法中，我们只迭代一次。可能是由于库调用开销造成的吗？

Counter理论上更快，但固定开销更高，特别是与str.count，它可以通过直接内存比较来扫描底层 C 数组, where list.count必须对每个元素进行丰富的比较；转换moves to a list单个字符的时间几乎增加了三倍foo1在本地测试中，从 448 ns 到 1.3 μs（同时foo2实际上变得更快了一点，从 5.6 μs 下降到 5.48 μs）。

其他问题：

导入已经导入的模块使用缓存的导入，但是即使是缓存导入也会产生惊人的开销（装载机械有很多东西要检查，以确保这样做没问题）；在本地测试中，移动from collections import Counter到顶层减少了运行时间foo21.6 μs（单次全局导入为 5.6 μs，本地每次调用导入为 7.2 μs）。这将改变一个lot按环境；在另一台机器上（用户和系统站点包中安装的东西较少），开销仅为 0.75 μs。无论如何，这是一个重大的、可以避免的劣势foo2.
Counter现代Python使用C加速器来加速计数，但是仅当迭代足够长时加速器才提供好处。如果您使用list的形式moves，但将其乘以 100 以获得更长的序列，相对而言，差异会下降（对于 106 µsfoo1与 140 µs 相比foo2)
你只是没有计算很多事情;当你只关心四件事时paying O(n)四次就可以轻松击败付款O(n)如果前一种情况的常数乘数较低，则一次（不包括在大 O 表示法中）比后者。Counter遗迹O(n)对于任意数量的独特事物进行计数；呼叫.count is O(n)每次调用，但如果您需要知道输入中每个唯一事物的计数，对于大多数唯一的、单独的输入.count每个的调用将渐近O(n²).
The .count在您的具体情况下，方法是短路的，所以它甚至没有做O(n)工作四次，只工作两次; the U and D计数不匹配，所以它永远不会计数L and R根本不。Counter如果它不能短路（所有成本都在单次计数过程中支付），则不会明显变慢，但是您的foo1，在我从点 #2 使用的相同基准中（较长的输入，在list形式），如果我只添加一个，则从 106 µs 变为 185 µsD到（预乘法）的末尾moves（使U and D计数相同，并且还需要两个count来电）；foo2仅增加到 143 µs（从 140 µs），大概是因为moves实际上变得更长了（添加D乘以 100 之前意味着它从 2900 个元素计数到 3000）。

基本上，您有一些小的实施弱点，但大多数情况下，您碰巧选择了一个可以发挥所有优势的用例.count, 没有一个Counter。如果你的输入总是str，而你只是count进行少量固定次数的调用，然后当然，重复调用count一般都会赢。但对于任意输入类型（尤其是迭代器，其中count是不可能的，既因为它不存在，又因为你只能迭代它一次），尤其是较大的，有更多独特的东西要计算，其中一致的性能很重要（因此依靠短路来减少count不接受电话），Counter会赢。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

list.count() 与 Counter() 性能的相关文章

根据两个元素对元组列表进行排序[重复]

这个问题在这里已经有答案了我有一个元组列表如下所示 a 4 2 a 4 3 a 7 2 a 7 3 b 4 2 b 4 3 b 7 2 b 7 3 我知道例如要按第二个元素对它们进行排序我可以使用 sorted unsorted k
如何在Django表单中设置密码显示/隐藏眼睛按钮

首先我将尝试使用原生 HTML 和 jquery 来解决这个问题但我想以 Django 形式解决这个问题而不需要任何脚本我会尝试this https itsolutionstuff com post bootstrap show h
python 使用 shapefile 掩码 netcdf 数据

我正在使用以下软件包 import pandas as pd import numpy as np import xarray as xr import geopandas as gpd 我有以下存储数据的对象 print precip d
写入结果电子表格时，AGGREGATE 公式不会自动计算

我有一个使用 OPENPYXL v2 5 10 库开发的 python 3 7 脚本用于从多个 Excel 工作簿中获取数据处理该数据然后写入单独的 Excel 工作簿结果工作簿包含大约 100 个命名范围和大量公式所有这些都按预
使用 python 突出显示图像中的特定文本

我想突出显示网站屏幕截图中的特定单词句子截取屏幕截图后我使用提取文本pytesseract and cv2 效果很好我可以获得有关它的文本和数据 import pytesseract import cv2 if name main
是否存在应明确跟踪或忽略的事件？

在做研究解决问题的同时如何在处理程序之后自动重新引发异常 https stackoverflow com q 56084252 216356 开发了一个异常类具有在处理后自动再次抛出自身的能力受到ThreadAbortException
检查一个数据框中的单词是否出现在另一个数据框中（python 3，pandas）

问题我有两个数据框想要删除它们之间的任何重复项部分重复项 DF1 DF2 Phrases Phrases Little Red Little Red Corvette Grow Your Grow Your Beans James B
为什么 __instancecheck__ 并不总是根据参数调用？

有这样的代码 class Meta type def instancecheck self instance print instancecheck return True class A metaclass Meta pass a A i
如何让 pyautogui click 在 mac 上运行？

pyautogui点击方法问题我正在从 Spyder 运行脚本如果我单击 Spyder 窗口上的任何内容则单击效果很好如果我执行脚本打开 Outlook 然后单击任何内容则不会发生单击虽然我能够正确使用 moveTo 功能我按
Requests-html 导致 OSError: [Errno 8] 调用 html.render() 时执行格式错误

我正在使用 requests html 并尝试渲染功能但收效甚微当我使用 python3 8 运行这个脚本时 usr bin python3 from requests html import HTML file scrape temp
将字节字符串转换为 Base64 编码的字符串（输出不是字节字符串）

我想知道是否可以将从读取文件中获得的字节字符串转换为字符串所以type output str 到目前为止我在谷歌上找到的都是这样的答案如何对 PNG 图像进行 Base 64 编码以便在 CSS 文件的 data uri 中使用 http
如何用 Pandas DataFrame 中的行总和替换 NaN

我试图用 Pandas DataFrame 中的行总和替换某些列中的 NaN 请参阅下面的示例数据 Items Estimate1 Estimate2 Estimate3 Item1 NaN NaN 8 Item2 NaN NaN 5 5
在Python子目录中创建文件？

在我的 Python 脚本中我需要在子目录中创建一个新文件而不更改目录并且需要从当前目录不断编辑该文件 My code os mkdir datetime dst for ip in open list txt with open ip
随机数生成器每次仅返回一个数字

Python 是否有一个随机数生成器每次只返回一个随机整数next 函数被调用数字不应该重复并且生成器应返回区间内的随机整数 1 1 000 000 这是独一无二的我需要生成超过一百万个不同的数字这听起来好像非常消耗内存以防所有数
使用正则表达式标记化进行 NLP 词干提取和词形还原

定义一个函数名为performStemAndLemma 它需要一个参数第一个参数 textcontent 是一个字符串编辑器中给出了函数定义代码存根执行以下指定任务 1 对给出的所有单词进行分词textcontent 该单词应包含字
猴子修补@property

是否有可能对 a 的值进行猴子修补 property我无法控制的类的实例 class Foo property def bar self return here be dragons f Foo print f bar baz f bar
Python 3.8 的点子

如何安装适用于 Python 3 8 的 Pip 我将 3 8 设置为我的默认 Python 版本 sudo apt install python3 8 pip gives 无法找到包 python3 8 pip 和跑步 python3 8
AttributeError：“MainRouter”对象没有属性“_disabled_count”

我正在创建一个 kivy 应用程序其中我使用了显示此错误的路由器 AttributeError MainRouter 对象没有属性 disabled count 有什么解决办法吗我也得到了这个但使用 super 修复了它使用以下命令
如何在python中合并具有相同键的嵌套字典

我有一个这样的数据结构 SNAPSHOT SnapshotVersion 304 SNAPSHOT SnapshotCreationDate 2015 06 21 17 33 41 CafeData CafeVersion 2807 Caf
多行 x 刻度标签

我正在尝试制作类似于此 Excel 示例的图我想知道 x 刻度标签上是否有第二层例如 5 年统计摘要我知道我可以使用制作多行刻度标签 n但我希望能够独立地转换这两个级别这很接近 fig plt figure figsize 8 4

随机推荐

旋转变换后更改 uiview 大小

我的代码需要专业 xcoder 的帮助我有一个名为 headline 的可拖动 uitextview 它是 mainstage 中的子视图我还添加了捏合手势来更改 uitextview 内的字体大小一切工作正常但我真正需要的最后一个
ASP.NET Web API - 请求特定的全局变量[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案当我收到 Web API 请求时我想创建一个变量在请求的生命周期中每个类都可以访问该变量我希望它像静态属性一样被访问方式如下A
实体框架 - 获取表列表

就是这样这很简单我有一个 edmx 希望能够动态查询它的表并希望如此针对该表动态构建那可能吗 UPDATE 我在上下文中包含了所有数据库表但没有视图或 SP 我们有很多输入信息的表带有 ID 例如颜色或文件类型或协议类型
我可以映射一个具有多个参数的函数吗？

在 EE Google Earth Engine Javascript API 中我可以做 var listOfNumbers 0 1 1 2 3 5 print List of numbers listOfNumbers var add
如何测试GPS状态？

我现在创建一个应用程序来通过 GPS 检测设备的位置我对 GPS 状态有疑问我查看 GpsStatus Listener 但它很复杂因为我是 Android 新手这是我尝试对 GPS 状态执行的操作我是否走在正确的轨道上 fina
从未捕获的异常中获取堆栈跟踪？ [复制]

这个问题在这里已经有答案了我意识到这将是特定于平台的有没有办法从未捕获的 C 异常中获取堆栈跟踪但从引发异常的点开始我有一个 Windows 结构化异常处理程序来捕获访问冲突等并生成小型转储但当然如果由于未捕获的 C 异常而终止
身份验证-当项目位于 FormsAuthentifications 下时，单个文件夹（页面）无身份验证

我在 asp net 2 0 上有一个带有命名空间 Admin 的 Web 应用程序我的项目有表单身份验证模式
在 C++ 中，如何仅使用指针将每个元素向右移动一位？ [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案例如这个数组 1 2 3 4 5 将变成这个数组 5 1 2 3 4 这是我想出的但它不起作用 int ptr ar
如何在 SQL Server 2008 中重建视图

我的数据库中有一个视图有人用一个表中的定义了该视图我刚刚向该表添加了一个新列我希望视图反映新列除了重新执行视图创建脚本之外还有其他方法重建视图吗我正在寻找类似的东西sp 重新编译将重新编译存储过程或者更准确地将其标记为在下次
Android webview无法渲染通过iframe嵌入的youtube视频

这是关于在 Web 视图中使用最新的嵌入格式 iframe 加载 YouTube 视频 iframe 嵌入格式示例在 Android 2 3 3 和 3 2 设备 HTC Desire 和 Asus Transformer 上测试代码网
不确定 unordered_map 是如何工作的

我对 unordered map 的工作原理存储桶是什么以及如何管理它们有点困惑 From 这篇博文 http codeforces com blog entry 21853 unordered map 是向量的向量我的问题是假设桶是
如何获取较旧的 Xcode beta 版本？

我已删除 Xcode 10 beta 3 并升级到 Xcode 10 beta 5 然而由于this bug https stackoverflow com questions 51602785 xcode 10b5 duplicate
如何在 Office VBA 编辑器中注释和取消注释代码块

In the VBA editor of Office ALT F11 how do you comment or uncomment a block of code 在 VBA 编辑器中转到View Toolbars Customise
Android Firebase setValue() 权限被拒绝

这是在 firebase 上定义规则的方式 rules users read true user id write auth uid user id read true 我已经成功地使用 setValue 在我的注册活动中写入了新的用户信息
Windows Azure VM (Mac) 为 ios 设备构建 Ionic 应用程序

我正在使用 Ionic 框架开发 Ionic2 Angular 应用程序我对 Android 没有任何问题我的问题是我可以使用 Windows Azure VM Mac 为 ios 设备构建应用程序吗 I have Win 8 1 O
避免 Xamarin 相机的“确定重试”按钮

我正在使用来自的相机代码库https github com rasmuschristensen XamarinFormsImageGallery https github com rasmuschristensen XamarinForms
用两个向量排序

我想知道是否有可能例如 vector
计算 Pubsub 主题中未确认消息的数量

我想在来自 pubsub 主题的所有消息都得到确认后执行一项操作我尝试使用 Stackdriver 监控 API 来衡量按云区域细分的未确认消息数但不了解区域过滤器以及为什么需要它在哪里可以查看我的主题使用的区域并且由于某种未知的
如何使用 JQL 检索特定状态的问题

输入 url 或使用curl 运行例如 https
list.count() 与 Counter() 性能

在尝试查找字符串中一堆字符的频率时为什么对 4 个不同的字符运行 string count character 4 次会比使用 collections Counter string 产生更快的执行时间使用 time time 背景给定

list.count() 与 Counter() 性能

list.count() 与 Counter() 性能 的相关文章

随机推荐

热门标签

list.count() 与 Counter() 性能的相关文章