Pandas str.split() 函数无法正常工作

2024-02-14

在尝试使用 Pandas 系列 str.split() 函数分割数据帧的“Actors”列中的值时，我得到的值比我指定的分割更多：

df['Actors'] = df['Actors'].str.split(",",n=3)

1      [timrobbins, morganfreeman, bobgunton, william...
2      [marlonbrando, alpacino, jamescaan, richardsca...
3      [alpacino, robertduvall, dianekeaton, robertde...
4      [christianbale, heathledger, aaroneckhart, mic...
5      [martinbalsam, johnfiedler, leejcobb, egmarshall]

如果我尝试使用下面的代码片段对上述结果进行切片，则 NaN 开始出现在结果中：

df['Actors'] = df['Actors'].str.split(",",n=3)[:3]
df['Actors'].head()

1    [timrobbins, morganfreeman, bobgunton, william...
2    [marlonbrando, alpacino, jamescaan, richardsca...
3    [alpacino, robertduvall, dianekeaton, robertde...
4                                                  NaN
5                                                  NaN
Name: Actors, dtype: object

或者，如果我尝试使用 apply 函数的代码片段（如下所示），则会获得正确的结果：

df['Actors'] = df['Actors'].apply(lambda x: x.split(",")[:3])
df['Actors'].head()

1        [timrobbins, morganfreeman, bobgunton]
2           [marlonbrando, alpacino, jamescaan]
3         [alpacino, robertduvall, dianekeaton]
4    [christianbale, heathledger, aaroneckhart]
5         [martinbalsam, johnfiedler, leejcobb]
Name: Actors, dtype: object

我想知道为什么会发生这种异常以及在这种情况下如何正确使用 str.split() 函数？

要进一步检查数据，您可以使用以下代码片段自行下载数据：

df = pd.read_csv('https://query.data.world/s/uikepcpffyo2nhig52xxeevdialfl7',index_col=0)

IIUC，您现在想知道两者之间有什么不同str.split(",",n=3)[:3] and str.split(",").str[:3]

str.split(",",n=3)[:3]被分割于','从左到右，分成3次。分割的输出是每行都是一个列表的系列。接下来，你打电话[:3]在输出上。它对输出的前 3 行进行切片，并仅返回新的 3 行系列。

df['Actors'] = df['Actors'].str.split(",",n=3)[:3]是系列作业。系列分配与索引对齐。任何df['Actors'].index输出 3 行系列中不存在的将被分配为NaN在价值上。这就是最终的原因df['Actors']只有 3 行有值，其余的是NaN

On df['Actors'].str.split(",").str[:3]，这是熊猫Indexing with .str。即，它是 pandas str 访问器的内置功能。它按照传递给的数字对每一行的整个系列进行切片[]。您可以在这里阅读更多内容：https://pandas.pydata.org/pandas-docs/stable/user_guide/text.html#indexing-with-str https://pandas.pydata.org/pandas-docs/stable/user_guide/text.html#indexing-with-str。它返回与原始数据相同长度（相同行数）的序列，其中每行值均按内部数字进行切片[].

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas str.split() 函数无法正常工作的相关文章

Jupyter Notebooks 不显示进度条

我正在尝试在 Jupyter 笔记本中显示进度条这是一台新电脑我通常做的事情似乎不起作用 from tqdm import tqdm notebook example iter 1 2 3 4 5 for rec in tqdm not
如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器？

如何在 PyCharm 4 5 2 中使用 PyPy 作为标准默认解释器一切都在 Ubunutu 14 10 下运行并且 pypy 已经安装您可以在项目的设置下进行配置这个官方文档直接涵盖了 https www jetbrains
可以用 Django 制作移动应用程序吗？

我想知道我是否可以在我的网站上使用 Django 代码并以某种方式在移动应用程序 Flutter 等框架中使用它那么是否可以使用我现在拥有的 Django 后端并在移动应用程序中使用它所以就像models views etc 是的有
Python Pandas 根据另一列的总计从另一个数据帧中选择值

我下面有一个 DataFrame 但我需要根据取消和订单列从每个代码中选择行假设代码 xxx 的阶数为 6 1 5 1 阶数为 11 我需要一种算法可以选择满足总共 11 行的行阶数为 6 5 如果没有行匹配则选择最接近的 id 并
PySide6.1 与 matplotlib 3.4 不兼容

当我只安装PySide6时 GUI程序运行良好但是一旦我安装了matplotlib及其依赖包包括pyqt5 则GUI程序将无法运行并输出以下错误消息 This application failed to start because no
动态 __init_subclass__ 方法的参数绑定

我正在尝试让类装饰器工作装饰器会添加一个 init subclass 方法到它所应用的类但是当该方法动态添加到类中时第一个参数不会绑定到子类对象为什么会发生这种情况举个例子这是可行的下面的静态代码是我试图最终得到的示例 cl
如何使用 Django 项目设置 SQLite？

我已阅读 Django 文档仅供参考 https docs djangoproject com en 1 3 intro tutorial01 https docs djangoproject com en 1 3 intro tutor
在Python中计算内存碎片

我有一个长时间运行的进程不断分配和释放对象尽管正在释放对象但 RSS 内存使用量会随着时间的推移而增加如何计算发生了多少碎片一种可能性是计算 RSS sum of allocations 并将其作为指标即便如此我该如何计算分母
乘以行并按单元格值附加到数据框

考虑以下数据框 df pd DataFrame X a b c d Y a b d e Z a b c d 1 2 1 3 df 我想在列中附加数字大于 1 的行并在该行中的数字减 1 df 最好应该然后看起来像这样或者它可能看起来
Python 惰性迭代器

我试图了解迭代器表达式如何以及何时被求值以下似乎是一个懒惰的表达 g i for i in range 1000 if i 3 i 2 然而这个在构造上失败了 g line strip for line in open xxx r if
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
使用 numpy 在 python 中执行最大方差旋转

我正在研究矩阵的主成分分析我已经找到了如下所示的组件矩阵 A np array 0 73465832 0 24819766 0 32045055 0 3728976 0 58628043 0 63433607 0 72617152 0 5
由于 json 字符串化 dict 键导致数据丢失

考虑下面的例子 gt gt gt import json gt gt gt d 0 potato 0 spud gt gt gt json dumps d 0 potato 0 spud gt gt gt json loads json d
如何将回溯/sys.exc_info() 值保存在变量中？

我想将错误名称和回溯详细信息保存到变量中这是我的尝试 import sys try try print x except Exception ex raise NameError except Exception er print 0 s
当在另一行中找到元素逗号分隔时合并行

您好我有一个数据框例如 species family Events groups 1 SP1 A 10 22 G1 2 SP1 B 7 G2 3 SP1 C D 4 5 6 1 3 G3 G4 G5 G6 4 SP2 A 22 10 G
在 virtualenvwrapper 中激活环境

我安装了virtualenv and virtualenvwrapper用这个命令我创建了一个环境 mkvirtualenv cv 它有效创建后我就处于新环境中现在我重新启动了我的电脑我想activate又是那个环境但是怎么样我使
为什么 smtplib.SMTP().sendmail 不发送 DKIM 签名邮件

我已经在服务器上设置了 postfix 以及 openDKIM 当我跑步时 echo Testing setup mail s Postfix test my email address 我收到电子邮件邮件标题中有一个DKIM Signa
如何在 robobrowser-python 中发出 POST 请求

http robobrowser readthedocs org en latest api html http robobrowser readthedocs org en latest api html 我正在尝试使用 APIbrows
Python 通过从现有 csv 文件中过滤选定的行来写入新的 csv 文件

只是一个问题我试图将 csv 文件中的选定行写入新的 csv 文件但出现错误我试图读取的 test csv 文件是这样的两列 2013 9 1 2013 10 2 2013 11 3 2013 12 4 2014 1 5 2014
如何在单元测试中使用 JSON 发送请求

我的 Flask 应用程序中有在请求中使用 JSON 的代码我可以像这样获取 JSON 对象 Request request get json 这一直工作得很好但是我正在尝试使用 Python 的 unittest 模块创建单元测试但

随机推荐

使用 Raven DB 的数据访问架构

我可以将哪些数据访问架构与 Raven DB 结合使用基本上我想通过接口分离持久性因此我不会将底层存储暴露给上层 IE 我不想让别人看到我的域名文档存储库 or 文档会话它们来自 Raven DB 我已经实现了通用存储库模式这似乎有
如何使用 file_get_contents() 检索 Windows NT Auth 背后的文件

我有一个设置其中 LAMP 服务器需要从位于 Windows NT 身份验证后面的另一台服务器 IIS 的 javascript 文件检索输出如果没有适当的身份验证我可以使用file get contents 检索我需要的 javas
通过 Apache Knox 网关访问 Apache NIFI REST API (jwt)

我正在寻找配置 Apache 的资源KNOXTOKEN访问 Apache NIFI REST API 的服务我已经有了KNOXSSO已配置并且能够通过它访问 NIFI UI 但是我找不到资源来通过 Curl 和 JWT 安全地访问 N
Apache Cordova - 不构建 i386 架构

我在构建中遇到错误使用 cordova 3 4 Undefined symbols for architecture i386 iconv referenced from zxing qrcode DecodedBitStreamPars
tox.ini 是否需要对 URL 中的锚点（哈希#）进行转义？

我有一个像这样的tox ini tox skipsdist True envlist begin py35 py36 end testenv commands pip install e git ssh email protected cd
向不同标头中定义的类中的函数授予友谊

首先这不是家庭作业它是 Thinking in C Vol 1 Chapter 5 ex 5 中的一个问题我需要创建 3 个类第一个类将其内部的友谊授予整个第二类而仅授予第三类的一个函数友谊我对向整个第二类授予友谊没有问题但
使用扩展 ArrayList 的 T 类中的方法

不知道标题是否有意义我会尝试解释一下我有一个扩展 ArrayList 的 CustomList T 是 A1 类和 A2 类两者都扩展了 A 类这是一个自定义类我需要这样做 public class CustomList
T-SQL 中的 TRY 和 RAISERROR

有一个小问题想知道我是否正确使用了这些在我的 SQL 脚本中有 BEGIN TRY check some information and if there are certains errors RAISERROR Errors fou
Centos 7 中 mysqld.service 作业失败

OS Centos 7 Linux 3 10 0 229 el7 x86 64 MySQL mysql57 community release el7 7 noarch rpm 我通过安装MySQL服务器yum 当我跑步时systemctl
如何在 Backbone Marionette 中显示具有多个子视图的 CompositeView

起始问题我有一个 CompositeView 一个表集合中的每个模型都表示为两个表行模板如下 tr class row parent td parent info here td tr tr class row child td ch
没有操作系统直接运行的程序叫什么名字？

当我试图提出有关该主题的其他问题时我很难正确表达我的问题那么直接在相关计算机上运行的程序的正确名称是什么一个可以描述内核和引导加载程序的术语因为它们是在没有操作系统的情况下直接执行的 C 标准称之为独立环境我觉得这个术语和我见过
onclick="location.href='link.html'" 无法在 Safari 中加载页面

我不明白onclick location href link html 在 Safari 5 0 4 中加载新页面我正在使用以下方法构建下拉导航菜单
如何将jhipster应用程序生成到不同的目录中？

当我在 jhipster generator 的 cli 目录中运行以下命令时 cd cli node jhipster js 我正在同一目录 cli 中生成应用程序我如何将此目录更改到其他位置例如将所有生成的文件导出到特定目录中我
使用 zip.js 在phonegap中解压缩文件

我正在使用 PhoneGap Cordova 3 3 0 和最新版本zip js http gildas lormeau github io zip js core api html 该脚本能够获取存档内的文件列表但无法获取任何二进制数据
检查会话是否已设置，如果没有则创建一个？

我想检查当前是否设置了会话如果是则允许页面正常运行不执行任何操作如果不创建会话我看了另一个SO问题其中发布了以下代码 if empty SESSION login else 最简单的方法是设置类似 SESSION a 对于每个会
Jasper Reports 中的 isPDFEmbedded 标签

Jasper Reports 中 isPDFEmbedded 标签的用途是什么您可以指定是否需要在报告的 pdf 导出中嵌入字体将字体嵌入到 pdf 中会增加 pdf 的大小但即使客户端计算机上未安装该字体 pdf 查看器也会显示正确
使用 pscp 或其他工具将文件从 Linux 传输到 Windows

问题陈述我想将一些文件从远程计算机 Linux 复制到我的Windows计算机我知道我可以使用 pscp 来做到这一点我尝试在互联网上查找找到了几篇文章但在这些文章中我无法理解并且在将文件从 Linx box 复制到 Windo
如何在mathematica中应用涉及一百个变量的规则

我有一个涉及 x1 x2 x100 的表达式我还有一个列表lst有 100 个元素如何将规则应用于此表达式以实现如下所示的效果 exp x1 gt lst 1 x2 gt lst 2 x100 gt lst 100 Thanks exp
使用 MediaProjection 截取屏幕截图

随着MediaProjectionAndroid L 中提供的 API 可以将主屏幕默认显示的内容捕获到 Surface 对象中然后您的应用程序可以通过网络发送该对象我已经设法得到VirtualDisplay工作以及我的Surf
Pandas str.split() 函数无法正常工作

在尝试使用 Pandas 系列 str split 函数分割数据帧的 Actors 列中的值时我得到的值比我指定的分割更多 df Actors df Actors str split n 3 1 timrobbins morganfree

Pandas str.split() 函数无法正常工作

Pandas str.split() 函数无法正常工作 的相关文章

随机推荐

热门标签

Pandas str.split() 函数无法正常工作的相关文章