为什么测试“NaN == NaN”对于从 pandas 数据帧中删除不起作用？

2024-01-28

请解释如何在 pandas 中处理 NaN，因为以下逻辑对我来说似乎“损坏”，我尝试了各种方法（如下所示）来删除空值。

我的数据框，我使用它从 CSV 文件加载read.csv, 有一个列comments，大部分时间都是空的。

专栏marked_results.comments看起来像这样；该列的其余部分都是 NaN，因此 pandas 将空条目加载为 NaN，到目前为止一切顺利：

0       VP
1       VP
2       VP
3     TEST
4      NaN
5      NaN
....

现在我尝试删除这些条目，只有这个有效：

marked_results.comments.isnull()

所有这些都不起作用：

marked_results.comments.dropna()只给出相同的列，没有任何内容被丢弃，令人困惑。
marked_results.comments == NaN只给出一系列的所有Falses。没有什么是 NaN...令人困惑。
同样地marked_results.comments == nan

我也尝试过：

comments_values = marked_results.comments.unique()

array(['VP', 'TEST', nan], dtype=object)

# Ah, gotya! so now ive tried:
marked_results.comments == comments_values[2]
# but still all the results are Falses!!!

你应该使用isnull and notnull测试 NaN （使用 pandas dtypes 比 numpy 更强大），请参阅文档中的“被视为缺失的值” http://pandas.pydata.org/pandas-docs/stable/missing_data.html#values-considered-missing.

使用系列方法dropna http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.dropna.html在列上不会影响原始数据框，但会执行您想要的操作：

In [11]: df
Out[11]:
  comments
0       VP
1       VP
2       VP
3     TEST
4      NaN
5      NaN

In [12]: df.comments.dropna()
Out[12]:
0      VP
1      VP
2      VP
3    TEST
Name: comments, dtype: object

The dropna http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.dropna.html 数据框方法有一个子集参数（用于删除特定列中具有 NaN 的行）：

In [13]: df.dropna(subset=['comments'])
Out[13]:
  comments
0       VP
1       VP
2       VP
3     TEST

In [14]: df = df.dropna(subset=['comments'])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么测试“NaN == NaN”对于从 pandas 数据帧中删除不起作用？的相关文章

一次将Python dict的内容分配给多个变量？

我想做这样的事情 def f return a 1 b 2 c 3 a b f or a b f IE 这样 a 被分配为 1 b 被分配为 2 并且 c 是未定义的这与此类似 def f return 1 2 a b f 依赖于变量名称
on_delete=models.PROTECT 和 on_delete=models.CASCADE 在 Django 模型上有什么作用？

我对 Django 很熟悉但最近注意到有一个on delete models CASCADE and on delete models PROTECT模型的选项 on delete models CASCADE and on delete
如何确定非阻塞套接字是否真正连接？

这个问题不仅限于Python 这是一个一般的套接字问题我有一个非阻塞套接字想要连接到一台可访问的机器在另一端该端口不存在为什么 select 仍然成功我预计会超时 sock send 因管道损坏而失败 select 之后如何确定
python - 是否可以扩展 xml-rpc 可以序列化的事物集？

我看到几个问题询问如何发送numpy ndarray通过 xml rpc 调用这不能开箱即用因为正如 xml rpc 中所述docs https docs python org 2 library xmlrpclib html 有一组固
python 中分割字符串以获得一个值？

需要帮助假设我在名为 input 的变量中有一个字符串 Sam Person name kind input split 通过执行上述操作我得到两个具有不同字符串 Sam 和 Person 的变量有没有办法只获取第一个值 name S
优化 Keras 以使用所有可用的 CPU 资源

好吧我真的不知道我在说什么所以请耐心听我说我正在使用 Theano 后端运行 Keras 以在 MNIST 图像上运行基本的神经网络目前只是一个教程过去我一直使用我的旧 HP 笔记本电脑因为我有 Windows 和 Ubunt
Paramiko - 使用私钥连接 - 不是有效的 OPENSSH 私钥/公钥文件

我正在尝试找到解决方案但无法理解我做错了什么在我的 Linux 服务器上我运行了以下命令 ssh keygen t rsa 这产生了一个id rsa and id rsa pub file 然后我将它们复制到本地并尝试运行以下代码 s
Pandas重置索引未生效[重复]

这个问题在这里已经有答案了我不确定我在哪里误入歧途但我似乎无法重置数据帧上的索引当我跑步时test head 我得到以下输出正如您所看到的数据帧是一个切片因此索引超出范围我想做的是重置该数据帧的索引所以我跑test rese
错误：permission_manager_qt.cpp(82) 不支持的权限类型：13

我正在开发具有内置浏览器功能的 python 代码 PyQt 5 13 import sys from PyQt5 QtCore import from PyQt5 QtGui import from PyQt5 QtWidgets imp
Python igraph：从图中删除顶点

我正在使用安然电子邮件数据集并尝试删除没有 enron com 的电子邮件地址即我只想拥有安然电子邮件当我尝试删除那些没有 enron com 的地址时一些电子邮件由于某些原因被跳过下面显示了一个小图其中顶点是电子邮件地址这是
Python Kivy - 在本机网络浏览器中打开 url 的应用程序

我尝试制作一个简单的应用程序在单击 Screen One 上的按钮后在 Kivy 中打开一个网页我使用了这个主题 Python 在应用程序中直接显示网络浏览器 iframe https stackoverflow com questi
如何通过双击在浏览器中打开 ipynb 文件

以前我安装了 Canopy 当时我只需双击 ipynb 文件并在浏览器中打开它们即可但是后来我需要Anaconda 一旦我安装了它这个功能就没有了现在我只希望能够简单地双击 ipynb 文件然后该文件就会在 Firefox 中
matplotlib matshow 标签

我一个月前开始使用 matplotlib 所以我仍在学习我正在尝试用 matshow 制作热图我的代码如下 data numpy array a reshape 4 4 cax ax matshow data interpolation
如何使用Python的super()来更新父值？

我对继承很陌生之前所有关于继承和 Python 的 super 函数的讨论都有点超出我的理解我当前使用以下代码来更新父对象的值 usr bin env python test py class Master object mydata
如何在Python和Selenium中通过标签名称或id获取元素[重复]

这个问题在这里已经有答案了我正在尝试使用 Python 和 Selenium 获取输入但它向我显示错误我该如何解决这个错误 inputElement send keys getStock getStocklFunc 0 Error i
为什么我用 beautifulSoup 刮的时候有桌子，但没有 pandas

尝试抓取条目页面转换为制表符分隔格式主要拉出序列和 UniProt 登录号当我跑步时 url www signalpeptide de index php sess m listspdb bacteria s details id 10
select() 可以在 Windows 下使用 Python 中的文件吗？

我正在尝试在 Windows 下运行以下 python 服务器 An echo server that uses select to handle multiple clients at a time Entering any line o
如何禁止 celery 中的 pickle 序列化

Celery 默认使用 pickle 作为任务的序列化方法如中所述FAQ http ask github com celery faq html isn t using pickle a security concern 这代表一个安全漏
来自 django 教程 was_published_recently.admin_order_field = 'pub_date'

From Django 教程 https www jetbrains com help pycharm 2017 1 creating and running your first django project html d28041e21
解压 R 数据框中的列表

我有一个dataframe其中一个字段包含不同长度的列表我想将该字段中列表的每个元素提取到其自己的字段中以便我可以将结果收集到一个很长的字段中dataframe每个列表元素都有一个 id 这是一个例子dataframe dat lt s

随机推荐

Delphi 如何获取控件上的光标位置？

我想知道 TCustomControl 上光标的位置如何找到坐标获取光标位置 http msdn microsoft com en us library ms648390 28v vs 85 29 aspx如果您无法处理鼠标事件这会很
动画 UIButton 的标题更改

在这里我找到了如何制作动画UIButton的标题更改使用现已弃用beginAnimations context method iPhone 的 UIBUtton 标题动画 https stackoverflow com questions
在 ASP.NET WebApi 2 中实现移动应用程序的外部身份验证

我正在尝试构建一个 API 使用 ASP NET WebApi 该 API 将由学校项目的本机移动应用程序使用我不关心开发移动应用程序这个责任由不同的成员承担我现在需要实现基于令牌的 Facebook 登录有很多教程可用于介绍如何
如何以编程方式获取 Admob 的设备 ID？

我有多个设备而且可能还会有更多并且不想一一添加有人知道 Admob 使用什么 ID 吗 String aid Settings Secure getString getContext getContentResolver androi
Gem 安装错误可写和 PATH

这是我遇到的两个错误我使用的是 OS X 老实说不知道我是否通过 gem 安装如果这很重要的话 WARNING Installing to gem since Library Ruby Gems 1 8 and usr bin are
将列表拆分为单独但重叠的块

假设我有一个清单A A 1 2 3 4 5 6 7 8 9 10 我想创建一个新列表比如说B 按以下顺序使用上面的列表 B 1 2 3 3 4 5 5 6 7 7 8 9 9 10 即前 3 个数字为A 0 1 2 后 3 个数字为A 2
GAE 云数据存储：获取最常编写的模型

我正在尝试按最常编写的模型的降序排列模型列表这是我到目前为止所尝试过的 client查询集提供模型及其属性属性的详细信息以及这些模型相关的详细信息实体计数内置索引计数内置索引大小数据大小复合索引大小复合索引计数总大小但
为什么结构体的 sizeof 不安全

The MSDN http msdn microsoft com en us library eahchzkf 28v vs 80 29 aspx明确指出对于所有其他类型包括结构体 sizeof 运算符只能在不安全的代码块中使用 Th
在 URLSearchParams 中使用 json 对象

是否可以以某种方式将 json 对象附加到 URLSearchParams 对象上所以而不是 urlSearchParams append search person it s urlSearchParams append search
没有为 MySQLi 准备好的语句中的参数提供数据

我一直在重新设计我的网站从不受保护的 MySQL 查询到 mysqli 准备好的语句一切都很顺利直到我得到这个没有为准备好的语句中的参数提供数据 if empty err pSETQuery NULL if empty POST p
命名空间中的枚举

做这样的事情有没有意义 namespace status enum status ok error 并像这样使用它status ok 或者我应该这样做 enum status status ok status error 并像这样使用它st
添加到 ArrayList Java

我是java初学者需要一些帮助我正在尝试将抽象数据类型 Foo 它是一个关联列表转换为字符串 B 的 Arraylist 如何循环遍历该列表并将每个字符串添加到数组中我可能想多了但我现在迷失了我在这里先向您的帮助表示感谢实例化
deepcopy() 非常慢

我在 Python 中有一个包含大约 1000 个对象行星系统恒星行星的游戏状态我需要复制它并在需要时对其应用一堆转换然而在大约 1 个请求秒的情况下这是占用了我24 63 的运行时间 https i stack imgu
如何列出属于某个VPC的所有资源？

在我的 AWS 账户中我的 VPC 很少我正在尝试找到一种方法来列出位于某个 VPC 下的所有资源谢谢您可以通过三种方式完成此操作 AWS CLI AWS 控制台或代码 AWS CLI 您可以使用 AWS CLI 列出与 VPC 关
Slim 基本身份验证

今天是个好日子我这里有一个有效的精简代码slim basic auth https packagist org packages tuupola slim basic auth当我进入受限目录时会显示以下内容一切正常但我想做的是将其
使用 SqlDataReader 和字符串数组

我想使用数据读取器读取记录并将结果发送到数组字符串我使用存储过程从 2 个表中选择数据 string ReqID string ConnectionString ConfigurationManager ConnectionStrings
Extjs如何让滚动条出现？

我需要在表单比包含容器更宽时立即显示滚动条我在容器上设置了属性 autoScroll true 但它不起作用有办法得到我需要的结果吗这是工作示例 http jsfiddle net mQC3B 2 http jsfiddle net
提高 SQL Server 中的 Xquery 性能

我有一个 Azure SQL 数据库其中有 1 个表和大量记录超过 75 000 条该表包含 XML 数据类型的列此列如下所示
如何使用maven使用PrimeFaces-5.2.X的jar？

这个问题看起来很简单但是根据我的研究 maven 存储库http repo maven apache org maven2 org primefaces primefaces http repo maven apache org mave
为什么测试“NaN == NaN”对于从 pandas 数据帧中删除不起作用？

请解释如何在 pandas 中处理 NaN 因为以下逻辑对我来说似乎损坏我尝试了各种方法如下所示来删除空值我的数据框我使用它从 CSV 文件加载read csv 有一个列comments 大部分时间都是空的专栏marked r

为什么测试“NaN == NaN”对于从 pandas 数据帧中删除不起作用？

为什么测试“NaN == NaN”对于从 pandas 数据帧中删除不起作用？ 的相关文章

随机推荐

热门标签

为什么测试“NaN == NaN”对于从 pandas 数据帧中删除不起作用？的相关文章