为什么比较匹配的字符串比比较不匹配的字符串更快？ [复制]

2024-05-07

这里有两个测量值：

timeit.timeit('"toto"=="1234"', number=100000000)
1.8320042459999968
timeit.timeit('"toto"=="toto"', number=100000000)
1.4517491540000265

正如您所看到的，比较两个匹配的字符串比比较两个大小相同但不匹配的字符串要快。这是相当令人不安的：在字符串比较期间，我相信Python正在逐个字符地测试字符串，所以"toto"=="toto"测试时间应该比"toto"=="1234"因为它需要对一项进行四次测试才能进行不匹配的比较。也许比较是基于哈希的，但在这种情况下，两次比较的时间应该相同。

Why?

结合我的评论和@khelwood 的评论：

TL;DR:
在分析两次比较的字节码时，它揭示了'time' and 'time'字符串被分配给同一个对象。因此，预先身份检查（在 C 级）是比较速度提高的原因。

相同对象分配的原因是，作为实施细节，CPython 实习生字符串仅包含“名称字符”（即字母和下划线字符）。这可以实现对象的身份检查。

字节码：

import dis

In [24]: dis.dis("'time'=='time'")
  1           0 LOAD_CONST               0 ('time')  # <-- same object (0)
              2 LOAD_CONST               0 ('time')  # <-- same object (0)
              4 COMPARE_OP               2 (==)
              6 RETURN_VALUE

In [25]: dis.dis("'time'=='1234'")
  1           0 LOAD_CONST               0 ('time')  # <-- different object (0)
              2 LOAD_CONST               1 ('1234')  # <-- different object (1)
              4 COMPARE_OP               2 (==)
              6 RETURN_VALUE

作业时间：

在使用分配进行时间测试时也可以看到“加速”。将两个变量分配（和比较）到同一字符串比将两个变量分配（和比较）到不同字符串要快。底层逻辑正在执行对象比较，进一步支持这一假设。这将在下一节中得到证实。

In [26]: timeit.timeit("x='time'; y='time'; x==y", number=1000000)
Out[26]: 0.0745926329982467

In [27]: timeit.timeit("x='time'; y='1234'; x==y", number=1000000)
Out[27]: 0.10328884399496019

Python源代码：

正如 @mkrieger1 和 @Masklinn 在他们的评论中所提供的，源代码 https://github.com/python/cpython/blob/main/Objects/unicodeobject.c#L11134 for unicodeobject.c首先执行指针比较，如果True，立即返回。

int
_PyUnicode_Equal(PyObject *str1, PyObject *str2)
{
    assert(PyUnicode_CheckExact(str1));
    assert(PyUnicode_CheckExact(str2));
    if (str1 == str2) {                  // <-- Here
        return 1;
    }
    if (PyUnicode_READY(str1) || PyUnicode_READY(str2)) {
        return -1;
    }
    return unicode_compare_eq(str1, str2);
}

附录：

参考答案 https://stackoverflow.com/a/47529318/6340496很好地说明了如何读取反汇编的字节码输出。由@Delgan 提供
参考答案 https://stackoverflow.com/a/42685254/6340496它很好地描述了 CPython 的字符串驻留。由@ShadowRanger 提供

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么比较匹配的字符串比比较不匹配的字符串更快？ [复制] 的相关文章

Python 转换矩阵

我有一个如下所示的列表 2 1 3 1 2 3 1 2 2 2 我想要的是一个转换矩阵它向我显示如下序列 1 后跟 1 的频率是多少 1 后面跟着 2 的频率是多少 1 后跟 3 的频率是多少 2 后跟 1 的频率是多少 2 后跟 2 的
为什么在访问 Python 对象属性时使用 getattr() 而不是 __dict__ ？

在具有一定程度的 Python 对象自省的源代码示例和 SO 答案中常见的模式是 getattr some object attribute name string 是否有理由优先选择这种模式 some object dict attri
如何计算数据框中按另一列的列值分组的一列的连续字符串值？

我有以下数据框 Levels Labels Confidence 0 Hands 0 8 0 Leg 0 7 0 Eye 0 9 1 Ear 0 9 1 Eye 0 8 2 Hands 0 9 2 Eye 0 8 3 Eye 0 8 我想检
Matplotlib 图例，跨列添加项目而不是向下添加项目

对于下面的简单绘图有没有办法让 matplotlib 填充图例以便它从左到右填充行而不是第一列然后第二列 gt gt gt from pylab import gt gt gt x arange 2 pi 2 pi 0 1 gt gt
将 Python Pandas DataFrame 写入 Word 文档

我正在努力创建一个使用 Pandas DataFrames 的 Python 生成的报告目前我正在使用DataFrame to string 方法但是这会作为字符串写入文件有没有办法让我实现这一目标同时将其保留为表格以便我可以使
Flask 失败并显示“错误：导入‘X’时，引发了 ImportError”，但不显示错误。如何找到错误的根源？

当使用以下命令启动 Flask 应用程序时 flask run 我收到错误 Error While importing wsgi an ImportError was raised Usage flask OPTIONS COMMAND A
ValueError：数据必须为正（boxcox scipy）

我正在尝试将我的数据集转换为正态分布 0 8 298511e 03 1 3 055319e 01 2 6 938647e 02 3 2 904091e 02 4 7 422441e 02 5 6 074046e 02 6 9 265747e
在 Linux 上使用多处理时，TKinter 窗口不会出现

我想生成另一个进程来异步显示错误消息同时应用程序的其余部分继续我正在使用multiprocessingPython 2 6 中的模块来创建进程我试图用以下命令显示窗口TKinter 这段代码在Windows上运行良好但在Linux上
数据框中 .map(str) 和 .astype(str) 有什么区别

我有一个数据框其列名为 col1 和 col2 的整数类型条目我想将 col1 和 col2 的条目以及其间的点连接起来我搜索并发现添加两个列条目 df col df col1 map str df col2 map str 并添
类型错误：此 COM 对象无法自动执行 makepy 过程 - 请为此对象手动运行 makepy

这是什么错误回溯错误 C Users DELL PycharmProjects MyNew venv Scripts python exe C Users DELL PycharmProjects MyNew agaaaaain py T
无法使用 python rasterio、gdal 打开 jp2 （来自哨兵）

我试图在 python 中将 jp2 栅格产品作为栅格打开但当我们使用 raterio 和 gdal 包时没有成功我收到此错误 RasterioIOError b4 jp2 not recognized as a supported f
无法导入QUERY_TERMS

我正在运行一个网站Python and Django Django filters 2 1 installed Django 2 1 installed 当我运行时我收到以下错误 importError Could not import
针对约 225 万行的单表选择查询的优化技术？

我有一个在 InnoDB 引擎上运行的 MySQL 表名为squares大约有 2 250 000 行表结构如下 squares square id int 7 unsigned NOT NULL ref coord lat doubl
从 wxPython 事件处理程序中调用函数

我正在努力寻找一种在 wxPython 事件处理函数中使用函数的方法假设我有一个按钮单击该按钮时它会使用事件处理程序运行一个名为 OnRun 的函数但是用户忘记单击 OnRun 按钮之前的 RadionButton 我想弹出一个
Python 2.7 缩进错误[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这个问题是由拼写错误或无法再重现的问题引起的虽然类似的问题可能是on topic help on topic在这里这个问题的解决方式不
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
无需访问 Internet 即可部署 Django 的简单方法？

我拥有的是使用 Django 开发的 Intranet 站点的开发版本以及放置在 virtualenv 中的一些外部库它运行良好我可以在任何具有互联网连接的计算机上使用相同的参数使用 pip 轻松设置 virtualenv 但是不幸
pandas.read_fwf 忽略提供的数据类型

我正在从文本文件导入数据框我想指定列的数据类型但 pandas 似乎忽略了dtype input 一个工作示例 from io import StringIO import pandas as pd string USAF WBAN S
在Python中停止ThreadPool中的进程

我一直在尝试为控制某些硬件的库编写一个交互式包装器用于 ipython 有些调用对 IO 的影响很大因此并行执行任务是有意义的使用 ThreadPool 几乎效果很好 from multiprocessing pool import
Biopython 可以执行 Seq.find() 来解释歧义代码吗

我希望能够在 Seq 对象中搜索考虑歧义代码的子序列 Seq 对象例如以下内容应该是正确的 from Bio Seq import Seq from Bio Alphabet IUPAC import IUPACAmbiguousDNA

随机推荐

perl生成字符串来匹配正则表达式

我尝试找到一种方法来生成与正则表达式匹配的字符串例如以下正则表达式 A Z 6 6 A Z2 9 A NP Z0 9 A Z0 9 3 3 0 1 我尝试过 Cpan 上的一些 perl 模块不起作用 gt 字符串随机 gt 正则表达式
通过cas进行ajax调用

我需要编写一个谷歌小工具来读取谷歌群组的提要问题是我正在进行 ajax 调用来检索提要而我们的 google apps 域受 CAS 中央身份验证服务保护因此我在拨打电话时收到 400 错误请求我怀疑浏览器在进行 ajax 调用
将字体导入 React 应用程序

我正在尝试在我的应用程序中使用 Roboto 字体但遇到了困难 I did npm install save typeface roboto并添加了import typeface roboto 到我的 React 组件但仍然无法改变我的
使用 AlamofireImage 下载图像有进度吗？

有没有办法使用 AlamofireImage 下载图像并获得有关下载进度的某种反馈同时利用它的强大功能UIImage 扩展图像过滤器和图像缓存我知道我可以退回到平原Alamofire request responseImage但我想让
尝试通过 knex 连接到 Mssql 服务器

我正在尝试使用 knex 连接到远程数据库但收到此错误乏味已弃用默认值options encrypt将会改变自false to true 请通过false如果您想保留当前行为请明确地表示在node modules mssql lib
带有 Viper 和 Vimpulse 的 Emacs 缺少哪些 Vim 功能？

Emacs 的一些重要功能在 Vim 中是缺失的例如 comint 模式并且没有脚本插件可以替代它们与 Emacs 相比 Vim 也有一些优点例如模式编辑和通常更好的默认快捷键然而 Viper 模式让我两者兼而有之 Vimpul
如何修改s_client的代码？

我正在玩apps s client c in the openssl源代码我想进行一些更改并运行它但是在保存文件并执行操作后我的更改没有得到反映make all or a make 例如我改变了sc usage函数为此 BIO pr
请求开发者证书的分发配置文件

使用 Xcode 9 1 构建 iOS 应用程序后我尝试将其存档但我收到以下错误消息配置文件 MyAppProfile 不包括签名证书 iPhone Developer My Name X1YZ2AB3CD 仔细观察后我发现 MyA
如何使用 PHP 跳过 XML 文件中的无效字符

我正在尝试使用 PHP 解析 XML 文件但收到错误消息解析器错误字符 0x0 超出允许范围我认为这是因为 XML 的内容我认为有一个特殊符号我能做些什么来修复它我还得到解析器错误标签项行中数据过早结束可能是什么原因导致
没有找到适合 jdbc.sqlite 的驱动程序

所以首先我之前看到过这个问题我查看了以前的答案并尝试用它来解决我的问题但是我做不到我正在创建一个图书馆系统并为注册类和登录类编写了代码并为数据库创建了一个类当我尝试运行该程序时我收到一条消息指出没有找到合适的驱动程序后跟数
如何以编程方式在 Genymotion 上刷新 zip

我正在尝试将谷歌应用程序刷新到 genymotion 模拟器中我可以使用拖放功能来完成此操作但我的项目需要 google apps zip 已加载到 genymotion 机器中并且在内部闪烁以避免与桌面交互我检查过类似的问题thi
HTTP 查询字符串和 []

PHP 使用在查询参数名称中以确保多次出现的参数都出现在 GET超全局变量否则只出现最后一次出现的情况还有其他软件可以做到这一点吗但从RFC 3986 https www rfc editor org rfc rfc3986 以及
Raspberry Pi 无延迟（<10ms）视频流

我正在基于 Raspberry Pi 构建四轴飞行器我想通过蜂窝连接将网络摄像头的视频流式传输到我的计算机我尝试了 ffmpeg 和 mjpg 但它必须有很大的延迟才能仅通过观看视频来控制 Quad 我的问题是是否可以以非常小的延迟如
将 Sprockets 的“depend_on”指令指向非资产文件

我有一个app assets javascripts moufa js erb填充来自 a 的值的文件config moufa yml文件我想使用depend onsprockets 指令以便每次 yaml 文件发生更改时它都会重新编
如何画一个中间透明的圆

我试图用以下代码绘制一个白色圆圈 mPaint setColor 0xFFFFFFFF canvas drawCircle x y radius mPaint 但它显示为固态磁盘如何让它只显示为中心透明的圆形轮廓我查看了帮助这对我来说
Android Studio .2.2 和 Gradle 包不存在

Android Studio 和导入外部 Java 库的新功能我已阅读有关配置 Gradle 依赖项的帖子并修复了我的第一个包不存在错误这些是我的 MainAcitivity java 文件中的导入语句 import com goog
在 python 中读取具有恶意字节 0xc0 的文件，导致 utf-8 和 ascii 出错

尝试将制表符分隔的文件读入 pandas 数据帧 gt gt gt df pd read table fn na filter False error bad lines False 它会出错如下所示 b Skipping line 58
如何使用 rel=preload 预加载材质图标？

我正在尝试使用谷歌灯塔优化我的网页该报告指出在导入 Material Design 图标的链接上使用 rel preloads 我尝试使用语法预加载它们我也尝试过使用字体进行预加载类型为 woff woff2 和 ttf 它们似乎都
解释R中模型多重共线性的别名表测试

有人可以帮助我解释别名函数输出以测试多元回归模型中的多重共线性我知道我的模型中的一些预测变量是高度相关的我想使用别名表来识别它们 Model Score Comments Pros Cons Advice Response Value
为什么比较匹配的字符串比比较不匹配的字符串更快？ [复制]

这个问题在这里已经有答案了这里有两个测量值 timeit timeit toto 1234 number 100000000 1 8320042459999968 timeit timeit toto toto number 100000

为什么比较匹配的字符串比比较不匹配的字符串更快？ [复制]

为什么比较匹配的字符串比比较不匹配的字符串更快？ [复制] 的相关文章

随机推荐

热门标签