忽略Python字符串中的大小写[重复]

2024-05-12

在Python中比较字符串（忽略大小写）的最简单方法是什么？

当然可以这样做 (str1.lower()

我想我正在寻找与 C 的 stricmp() 等效的函数。

[需要更多上下文，所以我将用一个简单的例子来演示：]

假设您要对一长串字符串进行排序。您只需执行 theList.sort() 即可。这是 O(n * log(n)) 字符串比较，并且没有内存管理（因为所有字符串和列表元素是某种智能指针）。你很快乐。

现在，您想做同样的事情，但忽略这种情况（让我们简化并说所有字符串都是 ascii，因此可以忽略区域设置问题）。你可以做 theList.sort(key=lambda s: s.lower()) ，但是你会导致两个新的每次比较的分配，加上重复的垃圾收集器的负担（降低）琴弦。每个这样的内存管理噪声都比简单的字符串比较慢几个数量级。

现在，使用类似 stricmp() 的就地函数，您可以执行以下操作： theList.sort(cmp=stricmp) 它与 List.sort() 一样快速且内存友好。你又幸福了。

问题是任何基于 Python 的不区分大小写的比较都涉及隐式字符串重复，所以我希望找到基于 C 的比较（可能在模块字符串中）。

找不到类似的东西，因此这里有问题。（希望这能澄清这个问题）。

这是一个基准测试，显示使用str.lower http://docs.python.org/2/library/string.html?highlight=lower#string.lower比接受的答案提出的方法更快（libc.strcasecmp):

#!/usr/bin/env python2.7
import random
import timeit

from ctypes import *
libc = CDLL('libc.dylib') # change to 'libc.so.6' on linux

with open('/usr/share/dict/words', 'r') as wordlist:
    words = wordlist.read().splitlines()
random.shuffle(words)
print '%i words in list' % len(words)

setup = 'from __main__ import words, libc; gc.enable()'
stmts = [
    ('simple sort', 'sorted(words)'),
    ('sort with key=str.lower', 'sorted(words, key=str.lower)'),
    ('sort with cmp=libc.strcasecmp', 'sorted(words, cmp=libc.strcasecmp)'),
]

for (comment, stmt) in stmts:
    t = timeit.Timer(stmt=stmt, setup=setup)
    print '%s: %.2f msec/pass' % (comment, (1000*t.timeit(10)/10))

我的机器上的典型时间：

235886 words in list
simple sort: 483.59 msec/pass
sort with key=str.lower: 1064.70 msec/pass
sort with cmp=libc.strcasecmp: 5487.86 msec/pass

所以，版本str.lower它不仅是迄今为止最快的，而且也是这里提出的所有解决方案中最可移植和Pythonic的。我没有分析内存使用情况，但原始发布者仍然没有给出令人信服的理由来担心它。另外，谁说对 libc 模块的调用不会重复任何字符串？

NB: The lower()字符串方法还具有与语言环境相关的优点。在编写自己的“优化”解决方案时，您可能不会得到正确的结果。即便如此，由于 Python 中的错误和缺失功能，这种比较可能会在 unicode 上下文中给出错误的结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

忽略Python字符串中的大小写[重复] 的相关文章

学习Python中的解析器

我记得我读过有关解析器的内容您只需提供一些示例行它就知道如何解析某些文本它只是确定两条线之间的差异以了解可变部分是什么我以为它是用 python 写的但我不确定有谁知道那是什么图书馆吗可能你的意思是模板制作器 http co
virtualenvwrapper 函数在 shell 脚本中不可用

所以我再一次制作了一个很棒的 python 程序它让我的生活变得更加轻松并节省了大量时间当然这涉及到一个 virtualenv 用mkvirtualenvvirtualenvwrapper 的功能该项目有一个requiremen
在 Python 中延迟转置列表

所以我有一个延迟生成的可迭代的三元组我试图弄清楚如何将其转换为 3 个可迭代对象分别由元组的第一个第二个和第三个元素组成然而我希望这件事能懒惰地完成所以举例来说我希望 1 2 3 4 5 6 7 8 9 将变成 1 4 7
创建 xyz 海拔数据的曲面图

我正在尝试用 python 创建一座山的表面图其中我有一些 xyz 数据最终结果应该类似于that https i stack imgur com rKQV0 png 该文件的格式如下 616000 0 90500 0 3096 712
如何更改Linux服务器中的MySQL表名不区分大小写？

我正在开发一个旧网站该网站曾经托管在 Apple 服务器上当它迁移到新的 Linux 服务器时它停止工作我很确定这是因为 php 脚本中使用的所有 MySQL 查询对于表名都有不同的大小写组合我不知道为什么原始开发人员在创建表名或
我可以在 matplotlib 中的绘图左侧放置一个垂直颜色条吗？

来自颜色条方法的 matplotlib 命令摘要 http matplotlib org api pyplot api html highlight colorbar matplotlib pyplot colorbar我知道关键字参数or
Python Apache Beam 端输入断言错误

我对 Apache Beam Cloud Dataflow 还很陌生所以如果我的理解不正确我深表歉意我正在尝试通过管道读取大约 30 000 行长的数据文件我的简单管道首先从 GCS 打开 csv 从数据中提取标题通过 ParDo
对法语文本进行词形还原[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一些法语文本需要以某种方式进行处理为此我需要首先将文本标记为单词然后对这些单词进行词形还原以避免多次处理相同的词根据我
右键单击 QPushButton 上的 contextMenu

对于我的应用程序我在 Qt Designer 中创建了一个 GUI 并将其转换为 python 2 6 代码关于一些QPushButton 与设计器创建我想添加右键单击上下文菜单菜单选项取决于应用程序状态如何实现这样的上下文菜单
Python FTP下载550错误

我编写了一个 ftp 爬虫来下载特定文件它会一直工作直到找到要下载的特定文件然后抛出此错误 ftplib error perm 550 该文件存在于我的下载文件夹中但文件大小为 0 kb 我需要转换某些内容才能下载吗我可以访问 f
如何在 python 中使用交叉验证执行 GridSearchCV

我正在执行超参数调整RandomForest如下使用GridSearchCV X np array df features all features y np array df gold standard labels x train x
在python中使用编解码器utf-8打开文件错误

我在 windows xp 和 python 2 6 4 上执行以下代码但它显示 IOError 如何打开名称带有 utf 8 编解码器的文件 gt gt gt open unicode txt euc kr encode utf 8 T
Django 1.7：如何使用 html/css 文件作为模板发送电子邮件

从 Django 1 7 开始可以send email 使用新参数 html message 不幸的是没有关于如何使用它的全面指南新手友好或者至少我找不到它我需要使发送的电子邮件变得漂亮因此我试图弄清楚如何将我的消息包含到 h
增强迪基-富勒测试中的 BIC 在 Python 中到底是如何工作的？

这个问题是关于 statsmodels tsa stattools python 库 adfuller 中的增强迪基富勒测试实现原则上 AIC 和 BIC 应该计算一组可用模型的信息标准并选择最好的模型信息损失最低的模型但它们在增
Python GTK3 Treeview 向上或向下移动选择

如何在树视图中向上或向下移动所选内容我的想法是我可以使用向上和向下按钮将选择向上移动一行或向下移动一行我的 Treeview 使用 ListStore 不确定这是否重要首先我将使用我熟悉的 C 代码如果您在将其翻译为 Pytho
为什么我无法杀死 k8s pod 中的 python 进程？

我试图杀死一个 python 进程 ps aux grep python root 1 12 6 2 1 2234740 1332316 Ssl 20 04 19 36 usr bin python3 batch run py root 4
为什么我会在 Python 字符串格式中使用除 %r 之外的其他内容？

我偶尔会使用 Python 字符串格式这可以像这样完成 print int i Float f String s 54 34 434 some text 但是这也可以这样做 print int r Float r String r 54
如何创建简单的梯度下降算法

我正在研究简单的机器学习算法从简单的梯度下降开始但在尝试用 python 实现它时遇到了一些麻烦这是我试图重现的示例我获得了有关房屋的数据居住面积以英尺为单位和卧室数量以及最终的价格居住面积英尺2 2104 卧室 3 价
如何在不同的目录中执行python脚本？

Solved对于可能觉得这有帮助的人请参阅下面我的答案我有两个脚本 a py 和 b py 在我当前的目录 C Users MyName Desktop MAIN 中我运行 gt python a py 第一个脚本 a py 在我当前
如何使 Django 自定义管理命令参数不再需要？

我正在尝试在 django 中编写自定义管理命令如下所示 class Command BaseCommand def add arguments self parser parser add argument delay type int

随机推荐

Android 联系人提取

是否有可能使用标准 Android API 提取以下某些格式 vCard hCard 或 json xml 的联系人 ContentResolver cr getContentResolver Cursor cur cr query Con
包含带有 android 风味的库

我之前的应用程序 gradle 文件 compile project path zblelib 但是当我将口味添加到库中时我的导入不起作用我的口味 flavorDimensions dim productFlavors nocustom
RestKit链接器错误

我一直遵循 RestKit 安装说明但现在在尝试构建应用程序时出现错误这是针对 ios iPad 的我收到命令 Developer Platforms iPhoneSimulator platform Developer usr b
使用 ggplot 未完全填充等值线图

我正在尝试使用以下方法绘制我的第一个填充等高线图ggplot 根据我的数据我期待类似的结果但我的结果是 a lt c 1 1 1 1 1 3 1 2 2 2 2 2 2 5 2 1 3 3 3 3 1 3 2 b lt c rep c
在 PHP 中验证约 400MB 的大型 XML 文件

我有一个很大的 XML 文件大约 400MB 在开始处理之前我需要确保它的格式正确我尝试的第一件事是类似于下面的内容这很棒因为我可以找出 XML 是否格式不正确以及 XML 的哪些部分不好 doc simplexml load s
WebView 不运行 loadHTMLString 中给出的 JavaScript

我不明白为什么这不起作用我的桌面上有一个 test htm 文件如下所示 This is x 2 我有一个 WebVie
如何追踪手柄泄漏？

在我的一个应用程序中我观察到句柄数量不断增加在不使用应用程序的情况下该数字大约每秒增加一次因此后台处理代码的某些部分一定存在句柄泄漏我如何追踪此类泄漏有什么工具可以帮助解决这个问题吗跟踪句柄泄漏时要寻找哪些模式导致手柄泄漏的
获取 Postgres 数据库中每个表的行数

获取数据库中所有表的行数的最有效方法是什么我正在使用 Postgres 数据库结果示例 table name row count some table 1 234 foobar 5 678 another table 32 如果您想要特
git分支和标签如何存储在磁盘中？

我最近检查了我工作中的一个 git 存储库其中有 10 000 多个分支和 30000 多个标签新克隆后存储库的总大小为 12Gigs 我确信没有理由拥有 10000 个分支机构所以我相信它们会占用磁盘中相当大的空间所以我的问题
调用 LWRP 时的 Cookbook 名称前缀

Summary 我可以使用外部说明书中的 LWRP 而不添加说明书名称前缀吗例如如果mycookbook包含mylwrp资源我该怎么做 include recipe mycookbook Contains mylwrp mylwrp
GetX 解绑流

我正在使用bindStream 函数与GetX封装在控制器内 class FrediUserController extends GetxController override void onReady super onReady fina
SSMS 与 Sybase ASE 的连接

有没有办法使用 Sql Server Management Studio 2008 连接到 Sybase ASE 数据库实例我尝试使用其他工具进行连接但它们非常有限我想使用 SSMS 您可以使用这个工具 SqlDbx http www
如何使用 Google Sheets onEdit() 触发器运行函数来更新 Google Form

我有一个 Google 表格工作簿其中有一个工作表我想用它来保存工作簿和 Google 表单的设置我做了一个定制onEdit 触发两个函数的函数一个用于更新工作簿另一个用于更新表单 function onEdit e var ra
jqgrid editoptions：必需的不起作用

好吧不确定我在这里做错了什么 list jqGrid url URL datatype json mtype GET colModel label Index index Index key true hidden true label
如何高效地在屏幕上精确绘制N个点？

这听起来是一个简单的问题但我发现要获得良好的性能是非常棘手的我提出的第一个算法是随机绘制点从一组中检查是否已绘制否则绘制如果我们只绘制几个点那么这种方法效果很好但当我们接近填满屏幕时速度会灾难性地减慢我想出的最好的方法是构
Unity IoC 和 MVC 3 Beta - 将 IRepository 传递给控制器构造函数

MVC 3 中有什么变化吗我已经尝试了互联网上所有将 Unity 设置为我的 IoC 容器的示例但我不断收到错误消息指出 Unity 无法解析我的 UserController 这是我的 UserController 上的构造函数 p
如何在powershell中将一个大文本文件拆分为多个文件

你好我有一个像这样的大文本文件 BIGFILE TXT COLUMN1 COLUMN2 COLUMN3 COLUMN4 COLUMN5 COLUMN6 COLUMN7 COLUMN8 11 24 2013 50 67 51 22 50 6
如何根据 Pyspark 中另一列的表达式评估有条件地替换列中的值？

import numpy as np df spark createDataFrame 1 1 None 1 2 float 5 1 3 np nan 1 4 None 0 5 float 10 1 6 float nan 0 6 floa
如何在 IntelliJ IDEA 中使用新的应用程序运行配置 UI 包含提供的依赖项？

用于运行 java 应用程序的新 IntelliJ IDEA 2020 3 界面中的包含提供范围的依赖项复选框在哪里在早期版本中它存在然后突然消失修改选项使用模块的类路径单击该模块启用包含具有提供范围的依赖项复选框为相
忽略Python字符串中的大小写[重复]

这个问题在这里已经有答案了在Python中比较字符串忽略大小写的最简单方法是什么当然可以这样做 str1 lower 我想我正在寻找与 C 的 stricmp 等效的函数需要更多上下文所以我将用一个简单的例子来演示假设您要对一

忽略Python字符串中的大小写[重复]

忽略Python字符串中的大小写[重复] 的相关文章

随机推荐

热门标签