Python：为什么partition(sep)比split(sep, maxsplit=1)更快

2023-11-23

我发现了一个有趣的事情partition比split当获取分隔符后的整个子字符串时。我已经在 Python 3.5 和 3.6 (Cpython) 中进行了测试

In [1]: s = 'validate_field_name'

In [2]: s.partition('_')[-1]
Out[2]: 'field_name'

In [3]: s.split('_', maxsplit=1)[-1]
Out[3]: 'field_name'

In [4]: %timeit s.partition('_')[-1]
220 ns ± 1.12 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

In [5]: %timeit s.split('_', maxsplit=1)[-1]
745 ns ± 48.8 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

In [6]: %timeit s[s.find('_')+1:]
340 ns ± 1.44 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

我查看了Cpython源代码，发现了partition使用FASTSEARCH算法，参见here。还有split只使用FASTSEARCH当分隔符字符串的长度大于1时，请参见here。但我测试了 sep 字符串，哪个长度更大。我得到了同样的结果。

我想原因是partition返回一个三元素元组，而不是列表。

我想了解更多细节。

微基准可能会产生误导

py -m timeit "'validate_field_name'.split('_', maxsplit=1)[-1]"
1000000 loops, best of 3: 0.568 usec per loop

py -m timeit "'validate_field_name'.split('_', 1)[-1]"
1000000 loops, best of 3: 0.317 usec per loop

仅将参数作为位置或关键字传递就会显着改变时间。所以我猜分区更快的另一个原因是，因为它不需要第二个参数......

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

string

Algorithm

performance

cpython

Python：为什么partition(sep)比split(sep, maxsplit=1)更快的相关文章

Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
Python逻辑运算符优先级[重复]

这个问题在这里已经有答案了哪个运算符优先4 gt 5 or 3 lt 4 and 9 gt 8 这会被评估为真还是假我知道该声明3 gt 4 or 2 lt 3 and 9 gt 10 显然应该评估为 false 但我不太确定 pyth
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
如何使用 imaplib 获取“消息 ID”

我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好所以我认为 Message ID 是正确的但我不知道如何获取它我只知道 imap fetch uid XXXX 有人有解决方案吗来自 IMAP 文档本身 IMAP4消息号
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
从零开始的 numpy 形状意味着什么

好的我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况这对我来说是有意义的它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑为什么这么定义呢据我所知这只是表达空数组的
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
列出所有 k 元组，其条目总和为 n，忽略旋转

有没有一种有效的算法来查找所有序列k总和为的非负整数n 同时避免旋转如果可能的话完全避免顺序很重要但对于我正在解决的问题来说轮换是多余的例如与k 3 和n 3 我想要得到一个如下所示的列表 3 0 0 2 1 0 2 0 1
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
迭代 my_dict.keys() 并修改字典中的值是否会使迭代器失效？

我的例子是这样的 for my key in my dict keys my dict my key mutate 上述代码的行为是否已定义假设my dict是一本字典并且mutate是一个改变其对象的方法我担心的是改变字典中的值可能
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
运算符“==”不能应用于“int”和“string”类型的操作数

我正在编写一个程序我想到了一个数字然后计算机猜测了它我一边尝试一边测试它但我不断收到不应该出现的错误错误是主题标题我使用 Int Parse 来转换我的字符串但我不知道为什么会收到错误我知道它说不能与整数一起使用但我在网
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

Ghostscript 不会生成在 DOCINFO 中检测到 UTF16BE 文本字符串的 PDF/A - 尽管 PDFACompatibilityPolicy 另有说明

我正在尝试使用以下命令行将普通 PDF 文件转换为 PDF A gs dPDFA dBATCH dNOPAUSE sProcessColorModel DeviceCMYK sDEVICE pdfwrite sPDFACompatibili
用于用户输入的 python 库

我正在用 python 实现一个小型命令行工具需要询问用户几个问题我用 raw input Are you male or female 每时每刻现在我希望能够处理愚蠢的用户或那些懒得阅读记住文档的用户所以我需要检查答案是否有意
如何使用 jQuery.grep() 过滤多维 JSON 对象

我有一个 JSON 对象如下所示 data name Alan height 171 weight 66 name Ben height 182 weight 90 name Chris height 163 weight 71 scho
构建系统 - Sublime Text 3

我有以下名为 build bat sublime build 的脚本 cmd build bat working dir project path windows shell true 该脚本位于 C Users MyName AppDat
iOS 版 Google 地图 - 如何判断标记是否在屏幕范围内？

我试图找出一种简单的方法来确定 iOS 版 Google 地图中给定的 GMSMarker 是否在可见地图的范围内 Javascript API 中似乎有解决方案但除了基于以下内容进行一些复杂的推理之外这个帖子似乎没有办法基于 Andy
如何使用 Ansible 安装 Oracle Java 8 [重复]

这个问题在这里已经有答案了 sudo add apt repository ppa webupd8team java sudo apt get update sudo apt get install oracle java8 install
更新主键 Django MySQL

我尝试用以下命令更新 Django 中的 PK save 方法但是当我保存对象时 Django 使用相同的数据但不同的 PK 复制该对象例如 from gestion empleados Models import Empleados
禁用 Maven 中央存储库

我公司的政策不赞成自动下载工件它们必须经过批准因此为了使用 Maven 我需要禁用对 Maven 中央存储库的访问换句话说我不希望 Maven 尝试any从中央下载我知道如何配置本地存储库无论是否联网我的想法是使用有福的机
如何在 HTML 中调用 REST API [关闭]

Closed 这个问题需要多问focused 目前不接受答案 API Noob 这里我真的很难弄清楚 API 和谷歌教程让我认为它们比我认为的更先进这是我想做的创建一个简单的网页让我可以搜索位于此 pokemon API 的信息 h
如何在 shell 脚本中使用正则表达式？

我想匹配输入字符串包含在变量中 1 带有表示日期格式的正则表达式MM DD YYYY and MM DD YYYY REGEX DATE d 2 d 2 d 4 echo 1 grep q REGEX DATE echo The echo
通过反射改变final变量，为什么静态和非静态final变量有区别

请参考下面的代码当我运行代码时我能够更改最终非静态变量的值但是如果我尝试更改最终静态变量的值则会抛出异常java lang IllegalAccessException 我的问题是为什么它在非静态最终变量的情况下不抛出异常反之亦然
使用 simple_form 自定义错误消息

我正在使用 simple form gem 我想自定义用户验证失败时显示的错误消息我怎样才能做到这一点您可以声明的内容您的模型中的错误消息 validates length of name minimum gt 5 message g
uint64 对于 Matlab 中的向量来说并不精确

我发现了一个不一致之处uint64在 Matlab 中使用向量时看起来 uint64 数组并不完全适用于所有 64 位这没有给出我预期的输出 p uint64 0 0 p 1 13286492335502040542 p 1328649
如何将现有 Line2D 对象的样式复制到plot() 调用？（matplotlib）

我需要提取a的样式信息matplotlib lines Line2D对象在 a 中使用它matplotlib pyplot plot 称呼并且如果可能的话我想以一种比过滤样式相关属性更优雅的方式Line2D properties ou
git pull 失败“无法解析引用”“无法更新本地引用”

使用 git 1 6 4 2 当我尝试git pull我收到此错误 error unable to resolve reference refs remotes origin LT558 optimize sql No such file
什么是 numpy.core._multiarray_umath.implement_array_function 以及为什么它花费大量时间？

我使用 numpy 进行大规模数据分析有很多矩阵实现例如 dot count nonzero linalg svd 后 prun在 Jupyter 笔记本中我发现numpy core multiarray umath implemen
此版本在 https://itunesconnect.apple.com 上无效

我在 iTunes Connect 上遇到此错误此构建无效上传之前验证成功然后上传但是上传完成后仍然出现错误我已上传超过 10 次但每次都会收到此版本无效的信息甚至没有人从苹果收到任何有关此错误的电子邮件通知 Xcode 7
在 android 上使用 com.android.camera.action.CROP 裁剪保存的图像

我读过很多关于此的问题但我仍然无法使用此代码也许任何人都可以纠正我的代码我想从我知道使用 com android camera action CROP 位置的文件中裁剪图像像这样 mImageCaptureUri Uri fromFi
如何用字符串数组填充ListView？

我想在我的 ListView 中显示这些项目
Python：为什么partition(sep)比split(sep, maxsplit=1)更快

我发现了一个有趣的事情partition比split当获取分隔符后的整个子字符串时我已经在 Python 3 5 和 3 6 Cpython 中进行了测试 In 1 s validate field name In 2 s partiti

Python：为什么partition(sep)比split(sep, maxsplit=1)更快

Python：为什么partition(sep)比split(sep, maxsplit=1)更快 的相关文章

随机推荐

热门标签

Python：为什么partition(sep)比split(sep, maxsplit=1)更快的相关文章