获取 pandas 数据框中包含和不包含 NaN 的所有行

2024-01-08

在 pandas 数据框中分割包含 NaN 和不包含 NaN 的行的最有效方法。

input :- ID    Gender    Dependants   Income   Education  Married
         1     Male      2            500      Graduate   Yes
         2     NaN       4            2500     Graduate   No
         3     Female    3            NaN      NaN        Yes
         4     Male      NaN          7000     Graduate   Yes
         5     Female    4            500      Graduate   NaN
         6     Female    2            4500     Graduate   Yes

没有 NaN 的预期输出是，

ID    Gender    Dependants    Income    Education    Married
1     Male      2             500       Graduate     Yes
6     Female    2             4500      Graduate     Yes

NaN 的预期输出是，

ID    Gender    Dependants    Income    Education    Married
2     NaN       4             2500      Graduate     No
3     Female    3             NaN       NaN          Yes
4     Male      NaN           7000      Graduate     Yes
5     Female    4             500       Graduate     NaN

Use boolean indexing http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-indexing检查缺失值和any http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.any.html检查至少一项True每行：

mask = df.isnull().any(axis=1)

df1 = df[~mask]
df2 = df[mask]
print (df1)
   ID  Gender  Dependants  Income Education Married
0   1    Male         2.0   500.0  Graduate     Yes
5   6  Female         2.0  4500.0  Graduate     Yes

print (df2)
   ID  Gender  Dependants  Income Education Married
1   2     NaN         4.0  2500.0  Graduate      No
2   3  Female         3.0     NaN       NaN     Yes
3   4    Male         NaN  7000.0  Graduate     Yes
4   5  Female         4.0   500.0  Graduate     NaN

Details:

print (df.isnull())
     ID  Gender  Dependants  Income  Education  Married
0  False   False       False   False      False    False
1  False    True       False   False      False    False
2  False   False       False    True       True    False
3  False   False        True   False      False    False
4  False   False       False   False      False     True
5  False   False       False   False      False    False

print (mask)
0    False
1     True
2     True
3     True
4     True
5    False
dtype: bool

并且您始终可以使用先前代码的更易读的方式，而无需反转掩码：

mask = df.notna().any(axis=1)
df1 = df[mask]

完全相同的结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

pandas

split

NaN

获取 pandas 数据框中包含和不包含 NaN 的所有行的相关文章

Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
Pandas 中的 Groupby、转置和追加？

我有一个数据框如下所示每个用户有10条记录现在我想创建一个如下所示的数据框 userid name1 name2 name10 这意味着我需要反转该列的每 10 条记录name并附加到新的数据框那么它是如何做到的呢有什么办法可
FTP 下载冻结整个应用程序

我正在尝试从 FTP 服务器下载一个大约 100 MB 的文件这是一个测试 bin 文件因为我正在测试该应用程序我猜我将来想要下载的文件会更重当我想下载文件时整个应用程序就会冻结几秒钟后它就会下载文件该文件已完成并且已成功下
在 python 中使用 pandas 计算行的出现次数

我有一个包含数千行和 4 列的 pandas 数据框 IE A B C D 1 1 2 0 3 3 2 1 3 1 1 0 有没有办法统计某一行出现了多少次例如可以找到多少次 3 1 1 0 并返回这些行的索引如果你只寻找一行那么我
PyCharm 表示 readline 导入未被使用

我有这个代码 while True cmd input gt if cmd exit break 但我想实现高级文本输入功能例如命令历史记录因此我导入了 readline 模块导入 readline 模块甚至不使用它将解锁这些功能
更新到 Django 1.8 - AttributeError: django.test.TestCase 没有属性 'cls_atomics'

我将 Django 1 7 项目更新为 Django 1 8 现在运行测试时出现错误它们是 Django 的子类 django test TestCase Traceback most recent call last File env
使用 dtypes read_csv 但列中没有值[重复]

这个问题在这里已经有答案了我使用以下代码来读取 csv 通过指定每个列的类型 clean pdf type pd read csv table updated csv usecols col names dtype col types 但
使用 Python 绘制 USGS 水文数据甘特图？

我编译了一个数据帧其中包含几个不同流计的 USGS 流数据现在我想创建一个类似的甘特图this https stackoverflow com questions 31820578 how to plot stacked event d
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
无法让gunicorn使用Python 3

我有 Ubuntu NGINX Gunicorn 以及可与 Python 3 设置配合使用的虚拟环境但我的 Flask 应用程序仍然以 2 7 6 运行我已系统地按照说明进行操作但找不到解决方案 Gunicorn 配置文件 progr
没有名为“turtle”的模块

我正在学习并尝试用Python3制作贪吃蛇游戏我正在进口海龟我正在使用 Linux mint 19 PyCharm python37 python3 tk Traceback most recent call last File hom
需要在R中跳过不同数量的行

我正在使用以下代码来处理我的数据但最近我意识到使用skip 27 在数据开始之前跳过存储在我的文件中的信息不是一个好的选择因为每个文件中要跳过的行数不同我的目标是读取存储在多个文件夹中的各种txt文件并非所有文件都有相同的列数列的
如何在两个 pandas 数据框之间应用函数

如何将自定义函数应用于两个数据框这 apply方法 https pandas pydata org pandas docs version 0 24 2 reference api pandas DataFrame apply html似
Pandas 多索引数据框中组之间的计算

假设我生成一个多索引数据框如下 arrays np array bar bar baz baz foo foo qux qux np array one two one two one two one two df pd DataFrame
如何将字符串转换为浮点数？ [复制]

这个问题在这里已经有答案了我需要转换变量 pi string 3 1415926 变成一个浮子这是我正在处理的事情你的线路应该是pi float float pi string float pi string 是一个浮点值你不能给它
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
对图像块进行多重处理

我有一个函数必须循环遍历图像的各个像素并计算一些几何形状此函数需要很长时间才能运行在 24 兆像素图像上大约需要 5 小时但似乎应该很容易在多个内核上并行运行然而我一生都找不到一个有据可查解释充分的例子来使用 Multiproc
如何从Python中的字符串中提取变量名称和值

我有一根绳子 data var1 id 12345 name John White python中有没有办法将var1提取为python变量更具体地说我对字典变量感兴趣这样我就可以获得变量的值 id和name python 这是由提供
tkinter - 检查文本小部件是否为空

操作系统 Windows 8 1 Python 3 5 在 Tkinter 中我发现了很多代码来验证输入框是否为空但是当我尝试对文本小部件应用相同的方法时它不起作用看起来文本小部件有一个 n 字符这可能就是问题所在知道如何进行此
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel

随机推荐

使用 IF 条件和存储在变量中的比较运算符

我有一套涉及比较运算符的规则我想根据规则中存储的比较运算符的值执行一些任务我正在按照以下方式进行操作但它不起作用检查以下代码 if benRules i amountCriteria Greater than comparison
XDocument.Save() 时出现内存异常

我正在尝试将 XDcoument 保存到没有足够可用内存空间的拇指驱动器这是应用程序的特殊测试条件虽然应用程序给出了如下所示的异常但我无法在 XDocument Save filePath 周围的 try catch 块中得到该异常
如何在 AngularJS 中从我的应用程序配置中设置 $httpProvider 默认标头？

我正在尝试设置我的 httpProvider defaults headers common X CSRF Token cookie auth token 在我的应用程序的 config 部分中但我似乎还无法访问文档 cookie 有没有
相当于Windows窗体中的canvas

我正在创建一个简单的应用程序来显示多个图像一个在另一个下面在 WPF 中我使用相当于图像数量的画布数量并将这些画布添加到主画布中并使用Image在每个画布上进行控制我上传了图像看起来不错现在我正在尝试在 Windows 窗
PHP连接Hotmail发送邮件？

目前我正在尝试使用 PHPmailer 发送电子邮件这是下面的代码
如何在达到一定长度后分割字符串？ [复制]

这个问题在这里已经有答案了我想在一定长度后分割字符串假设我们有一串消息 Who Framed Roger Rabbit 像这样分割 Who Framed Roger Rab bit 我想在 message 变量超过 10 时进行拆分
如何将嵌套字典的所有值转换为字符串？

我正在编写一个 python 应用程序其中有一个可以嵌套到任何级别的变量字典任何级别中的键可以是 int 或 string 但我想将所有级别的所有键和值转换为字符串字典的嵌套方式是可变的这使得它有点复杂 col1 0 0 1 8 2
“body {background-color}”适用于 HTML，但不适用于 CSS

能够在内联中设置 HTML 正文的背景颜色属性
如何使这个 C# 循环更快？

执行摘要如果您想继续使用 C Reed 下面的答案是最快的如果您愿意编组到 C 我就是那么这是一个更快的解决方案我在 C 中有两个 55mb ushort 数组我使用以下循环将它们组合起来 float b float number
在mysql中存储金额

我想将 3 50 存储到 mysql 表中我有一个浮点数将其存储在其中但它存储为 3 5 而不是 3 50 我怎样才能让它有尾随零不要将货币值存储为浮点数请使用 DECIMAL 或 NUMERIC 类型 MySQL 数字类型文档
在推送视图中修改列表绑定属性时，SwiftUI 导航会弹出

当我从向下推 2 层的视图中的数组更新绑定属性时导航会在属性更改后立即弹出 Xcode 13 3 测试版 iOS 15 我创建了一个简单的演示代码如下 Shopping Lists List Edit List section Edit
从父类获取子类名

我的所有活动都有一个基类 ActivityBase 本身源自android app Activity 在 onCreate 中我想根据当前正在执行的子类执行一些条件逻辑如果SomeCustomActivity and AnotherCu
如何从常见缩写（PST、EST 等）获取 pytz 时区？

这是一个类似的问题如何获取 pytz 时区的通用名称例如美国纽约 EST EDT https stackoverflow com questions 5946499 how to get the common name for a p
在 asp:repeater 中，我使用 asp:checkbox，但 OnCheckedChanged 不会触发

这是代码
WinForms 文本框的自定义插入符号

我正在 WinForms Net 2 0 应用程序中开发一个类似自定义超级终端的应用程序我在面板中有一个多行文本框您可以在其中与硬件设备交互我的客户想要一个自定义插入符一个大小为一个字符空间的填充矩形而不是默认的垂直线我知道 N
Haskell - 对列表的前 n 个元素求和

我是哈斯克尔的新手假设我想总结第一个n带有我自己生成的函数的列表元素我不知道如何用 Haskell 做到这一点我只知道如何总结整个给定的列表例如 sumList Int gt Int sumList 0 sumList x xs x
对 MFC 项目中的内存泄漏感到困惑，如果从未调用 _CrtDumpMemoryLeaks()，这些内存泄漏就会消失

我有一个使用 Visual Studio 2017 编译的基于 MFC C 对话框的项目我添加了以下代码来在构建它时跟踪可能的内存泄漏从内部ProjectName cpp在我之前CWinApp 派生类已初始化 define CRTDBG
创建没有笔尖的视图控制器

在 AppDelegate 中我想创建一个 UIViewController 子类并添加其视图视图本身将在代码中指定没有笔尖根据苹果文档我应该使用 initWithNibName nil bundle nil 然后在控制器的 lo
在 Python 中创建快速 RGB 查找表

我有一个称为 rgb2something 的函数它将 RGB 数据 1x1x3 转换为单个值概率循环输入 RGB 数据中的每个像素结果相当慢我尝试了以下方法来加快转换速度生成 LUT 查找表 import numpy as np
获取 pandas 数据框中包含和不包含 NaN 的所有行

在 pandas 数据框中分割包含 NaN 和不包含 NaN 的行的最有效方法 input ID Gender Dependants Income Education Married 1 Male 2 500 Graduate Yes 2

获取 pandas 数据框中包含和不包含 NaN 的所有行

获取 pandas 数据框中包含和不包含 NaN 的所有行 的相关文章

随机推荐

热门标签

获取 pandas 数据框中包含和不包含 NaN 的所有行的相关文章