在Python中分割空字符串时，为什么split()返回空列表，而split('\n')返回['']？

2023-11-22

我在用split('\n')获取一个字符串中的行，并发现''.split()返回一个空列表，[], while ''.split('\n')回报['']。造成这种差异有什么具体原因吗？

有没有更方便的方法来计算字符串中的行数？

问题：我正在使用split('\n')获取一个字符串中的行，并发现''.split()返回一个空列表，[], while ''.split('\n')回报[''].

The str.split()方法有两种算法。如果没有给出参数，它将在重复运行空格时分割。但是，如果给出了参数，它将被视为单个分隔符，不会重复运行。

在拆分空字符串的情况下，第一个模式（无参数）将返回一个空列表，因为空格被吃掉并且没有值可放入结果列表中。

相反，第二种模式（带有诸如\n) 将产生第一个空字段。考虑一下你是否写过'\n'.split('\n')，你会得到两个字段（一个分割，给你两半）。

问：造成这种差异有什么具体原因吗？

当数据在具有可变数量空白的列中对齐时，第一种模式非常有用。例如：

>>> data = '''\
Shasta      California     14,200
McKinley    Alaska         20,300
Fuji        Japan          12,400
'''
>>> for line in data.splitlines():
        print(line.split())

['Shasta', 'California', '14,200']
['McKinley', 'Alaska', '20,300']
['Fuji', 'Japan', '12,400']

第二种模式对于分隔数据很有用，例如CSV其中重复的逗号表示空字段。例如：

>>> data = '''\
Guido,BDFL,,Amsterdam
Barry,FLUFL,,USA
Tim,,,USA
'''
>>> for line in data.splitlines():
        print(line.split(','))

['Guido', 'BDFL', '', 'Amsterdam']
['Barry', 'FLUFL', '', 'USA']
['Tim', '', '', 'USA']

请注意，结果字段的数量比分隔符的数量大 1。想象一下割断一根绳子。如果你不做任何切割，你就得到了一件。切一刀，得到两块。进行两次切割，得到三块。 Python 也是如此str.split(delimiter) method:

>>> ''.split(',')       # No cuts
['']
>>> ','.split(',')      # One cut
['', '']
>>> ',,'.split(',')     # Two cuts
['', '', '']

问题：有没有更方便的方法来计算字符串中的行数？

是的，有一些简单的方法。一用str.count()和其他用途str.splitlines()。除非最后一行遗漏，否则两种方法都会给出相同的答案\n。如果最后一个换行符丢失，str.splitlines方法将给出准确的答案。一种更快、更准确的技术使用 count 方法，然后针对最终的换行符进行更正：

>>> data = '''\
Line 1
Line 2
Line 3
Line 4'''

>>> data.count('\n')                               # Inaccurate
3
>>> len(data.splitlines())                         # Accurate, but slow
4
>>> data.count('\n') + (not data.endswith('\n'))   # Accurate and fast
4

@Kaz 的问题：为什么两种截然不同的算法被硬塞到一个函数中？

签名为str.split大约有 20 年的历史，那个时代的许多 API 都是严格实用的。虽然不完美，但方法签名也不是“糟糕”。在很大程度上，Guido 的 API 设计选择经受住了时间的考验。

当前的 API 并非没有优点。考虑如下字符串：

ps_aux_header  = 'USER               PID  %CPU %MEM      VSZ'
patient_header = 'name,age,height,weight'

当被要求将这些字符串分解为字段时，人们倾向于使用相同的英语单词“split”来描述它们。当被要求阅读诸如以下代码时fields = line.split() or fields = line.split(',')，人们倾向于将这些陈述正确地解释为“将一条线分割成多个字段”。

微软Excel的文本转列工具做出了类似的 API 选择并且将两种分割算法合并在同一个工具中。尽管涉及不止一种算法，人们似乎在心理上将场分割建模为一个概念。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在Python中分割空字符串时，为什么split()返回空列表，而split('\n')返回['']？的相关文章

使用 pandas.date_range() 生成多个日期时间，每周两个日期

我在用着pd date range start date end date freq W MON 每周一生成每周频率日期时间start date 2017 01 01 and end date 2017 12 31 这意味着每月大约生成 4
Tkinter 菜单删除项

如何删除任何菜单项例如我想删除播放 self menubar Menu self root self root config menu self menubar self filemenu2 Menu self menubar self
如何在python中附加两个字节？

说你有b x04 and b x00 你如何将它们组合起来b x0400 使用Python 3 gt gt gt a b x04 gt gt gt b b x00 gt gt gt a b b x04 x00
尝试从网页Python和BeautifulSoup获取编码

我试图从网页检索字符集这会一直改变目前我使用 beautifulSoup 来解析页面然后从标题中提取字符集这工作正常直到我遇到一个网站到目前为止我的代码以及与其他页面一起使用的代码是 def get encoding soup
如何使用 Python boto3 获取 redshift 中的列名称

我想使用 python boto3 获取 redshift 中的列名称创建Redshift集群将数据插入其中配置的机密管理器配置 SageMaker 笔记本打开Jupyter Notebook写入以下代码 import boto3
检查 python 中命令行参数的数量

我是蟒蛇新手还是把脚弄湿了我正在尝试做这样的事情 import sys if len sys argv lt 3 or lt len sys argv gt 3 print This script will compare two fi
为什么第二个 request.session cookies 返回空？

我想使用 requests Session post 登录网站但是当我已经登录主页然后进入帐户页面时看来cookies还没有保存因为cookies是空的而且我无法进入正确的帐户页面 import requests from bs4
将 pandas 剪切操作转换为常规字符串

我明白了 pandas cut 操作的输出 0 0 20 1 0 20 2 0 20 3 0 20 4 0 20 5 0 20 6 0 20 7 0 20 8 0 20 9 0 20 如何将 0 20 转换为 0 20 我正在这样做 str
用于（联合国）结构化文本文档的词法分析器/解析器[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有很多脚本解析器和词法分析器即结构化计算机语言但我正在寻找一个可以将几乎非结构化文本文档分成更
在 Mac OSX 上从 Python 3.6 运行 wine 命令

我正在尝试用 Python 编写一个打开的脚本wine然后发送代码到wine终端打开一个 exe程序这 exe程序也是命令驱动的我可以打开wine 但我无法进一步 import shlex subprocess line usr bin
更改QLineEdit的ClearButton图标

我想在Windows 10 1909 64位上的Python 3 8和PyQt5 5 15 0 上更改我的QLineEdit的ClearButton图标稍后我想在Linux上运行代码我尝试应用此处找到的代码如何在 QLineEdit
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video
App Engine 实体到字典

将 google app engine 实体在 python 中复制到字典对象的好方法是什么我正在使用 db Expando 对象所有属性均为扩展属性 Thanks 有一个名为foo尝试 foo dict
使用seaborn绘制简单线图

我正在尝试使用seaborn python 绘制ROC曲线对于 matplotlib 我只需使用该函数plot plt plot one minus specificity sensitivity bs where one minus s
Discord.py 嵌入中禁用按钮/冻结按钮

I m trying to make a replica of this bot in which when I press any of the buttons below it shows a dropdown menu and you
基于值而不是类型的单次调度

我在 Django 上构建 SPA 并且有一个庞大的功能其中包含许多功能if用于检查我的对象字段的状态名称的语句像这样 if self state new do some logic if self state archive do s
如何通过函数注释指示函数需要函数作为参数，或返回函数？

您可以使用函数注释 http www python org dev peps pep 3107 在python 3中指示参数和返回值的类型如下所示 def myfunction name str age int gt str return
根据多个阈值将 SciPy 分层树状图切割成簇

我想将 SciPy 的树状图切割成多个具有多个阈值的簇我尝试过使用 fcluster 但它只能削减一个阈值例如这是我从另一个问题中摘取的一段代码 import pandas data pandas DataFrame total ru
Jupyter Notebook：带有小部件的交互式绘图

我正在尝试生成一个依赖于小部件的交互式绘图我遇到的问题是当我使用滑块更改参数时会在前一个绘图之后完成一个新绘图而我预计只有一个绘图会根据参数发生变化 Example from ipywidgets import interact i
Python 中的 Unix cat 函数 (cat * > merged.txt)？ [复制]

这个问题在这里已经有答案了一旦建立了目录有没有办法在Python中使用Unix中的cat函数或类似的函数我想将 files 1 3 合并到 merged txt 我通常会在 Unix 中找到该目录然后运行 cat gt merged

随机推荐

如何在 JUnit 4 中运行属于某个类别的所有测试

JUnit 4 8 包含一个名为类别的不错的新功能它允许您将某些类型的测试分组在一起这非常有用例如对慢速和快速测试进行单独的测试运行我知道其中提到的内容JUnit 4 8 发行说明但想知道如何实际运行用特定类别注释的所有测试
使用 Ansible 安装软件包时如何自动接受条款？

安装 pkgs Ansible 时失败因为需要接受许可条款如何通过以下方式自动接受条款ansible playbook hosts client1 remote user ansible become True tasks name t
根据内容调整 UILabel 的大小

我有一个 UILabel 他的文字大小有属性 title adjustsFontSizeToFitWidth YES 这阻止我使用标准方法来调整 UILabel 的大小我在另一篇文章中读到我应该使用这个函数 sizeWithFont mi
设置 HTTP 请求“内容类型”

如何设置 HTTP 请求的内容类型我试过这个 headers Accept application xml headers Content Type application xml curl setopt ch CURLOPT HTTPH
升级到 RC 6 和 RxJS Beta 11 后，flatMap 丢失

升级到 RC6 后电子邮件受保护我似乎缺少 Observable 对象的一些扩展 flatMap 操作符消失了 mergeMap 也不在这里我现在只看到几个操作员知道我缺少什么吗我想现在你需要单独导入运算符如果你往里面看 nod
我应该在 C++ 程序中包含或吗？

我应该在 C 程序中包含什么 stdio h or cstdio 为什么为什么两个头文件提供相同的功能标准对此有何规定我应该如何包含其他此类标头是否有我应该遵循的基本规则考虑以下程序样本1 include
核心数据布尔属性 NSNumber 不记得它是布尔值

我有一个模型其属性如下所示当我设置它的值时例如 model isResolved YES 保存在模型中的 NSNumber 忘记它是一个布尔值 NSLog strcmp self isResolved objCType encode
Vue3-使用 Vitest toHaveBeenCalled() 方法

我正在使用 Composition API 运行 vue3 应用程序setup hook 我使用 Vitest 作为单元测试框架 v 0 6 1 我有以下示例组件 src components MyComponent vue
OpenCV 3.2 CUDA 支持 python

我刚刚安装了 OpenCV 3 2 按照 CUDA 支持的说明进行编译http www pyimagesearch com 2016 07 11 compiling opencv with cuda support 我只是想知道如何检查我的
xsl 删除所有非数字字符和前导 1

我需要将传入的电话号码字符串转换为不包含任何非数字字符的标准化格式并删除前导数字如果为 1 例如 1 222 333 4444 x 5555 变为 22233344445555 在此先感谢您的帮助一 XSLT 1 0解决方案这种转变
Java 安装在 Mac OS X 上的什么位置？

我在 Mac OS 10 7 5 上下载了 Java 7u17here并成功安装它为了进行一些 JNI 编程我需要知道 Java 安装在我的 Mac 上的位置我以为里面 Library Java JavaVirtualMachines
测试自动化 html 元素选择器。元素 ID 或 DataAttribute [关闭]

Closed 这个问题是基于意见的目前不接受答案我目前正在将一些 ID 放置在 UI 测试自动化的元素上这些 ID 仅用于测试我应该添加数据属性而不是可能使其对未来的开发人员更具可读性 data testHandle mybutto
我想用 Javascript API V3 创建一个甜甜圈（内部空白，像一个洞）

我想在我的 Javascript Google API V3 中创建一个洞所以我按照 Beginning Google Map API V3 进行操作但代码正在渲染整个区域这是我的 JavaScript 代码 function win
从表达式中获取字符串属性名称

我正在尝试编写一个强类型助手这将是这样的 Html Lookup x gt x FooId 现在我有这个 public static MvcHtmlString Lookup
Python 2.7：立即写入文件

我意识到当我使用 python 写入文件时它会等到 Python 文件末尾才执行它 outputFile open outputFile txt a outputFile write First print Now you have 1
如何从 python mysql 查询中转义 %

如何在 python 中从 mysql 查询中转义例如 query SELECT DATE FORMAT date time Y m AS dd FROM some table WHERE some col s AND other col
_googWcmGet 回调无法通过具有动态电话号码的 GTM 工作

我正在尝试使用 GTM 在我的网站上运行 AdWords 来电转化跟踪一切都已在 AdWords 端设置完毕附加电话信息来自网站转换的来电但替换功能仍然无法正常工作
Android SearchView X 标记图标

我想更改搜索视图组件中显示的白色可绘制的 X 标记如何更改它请帮我谢谢 SearchManager searchManager SearchManager getSystemService Context SEARCH SERVICE
Kubernetes 日志在 pod 中的位置

我只是想在 Pod 中找到日志位置我刚刚登录到 Pod 如下所示 kubectl exec it POD NAME bash 但是日志在以下情况下不可用 var logs 不确定实际的日志位置是什么以及如何更改它如果您的应用程序将日志
在Python中分割空字符串时，为什么split()返回空列表，而split('\n')返回['']？

我在用split n 获取一个字符串中的行并发现 split 返回一个空列表 while split n 回报造成这种差异有什么具体原因吗有没有更方便的方法来计算字符串中的行数问题我正在使用split n 获取一个字符串中的行并

在Python中分割空字符串时，为什么split()返回空列表，而split('\n')返回['']？

在Python中分割空字符串时，为什么split()返回空列表，而split('\n')返回['']？ 的相关文章

随机推荐

热门标签

在Python中分割空字符串时，为什么split()返回空列表，而split('\n')返回['']？的相关文章