Python - isnull().sum() 与 isnull().count()

2023-12-07

所以我目前正在完成泰坦尼克号数据集的教程(https://www.kaggle.com/c/titanic/data)。 现在我正在尝试一些可能相关的新事物。

The info for it is : enter image description here There are 891 entries(red asterisk), and columns with NaN values (blue dashes).


当我去寻找缺失值的一些总结时,我感到困惑.sum() & .count():

enter image description here

在上面的代码中,.sum()对于空值的每个实例加一。因此,输出似乎是数据框中每列有多少个缺失条目的值。 (这就是我想要的)


However如果我们这样做.count()无论我们是否使用,每列都会得到 891.isnull().count() or .notnull().count().

enter image description here

所以我的问题是:

什么是.count()在这种情况下意味着什么?

我认为它会计算所需方法的每个实例(在本例中为空或非空条目的每个实例;基本上是什么.sum() did).

还;我对如何的“定义”.sum()正在使用,这是正确的吗?


只要打印出train_df.isnull()的数据,你就会看到。

# data analysis and wrangling
import pandas as pd
import numpy as np

# visualization
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline

train_df = pd.read_csv('train.csv')
print(train_df.isnull())

result:

    PassengerId  Survived  Pclass   Name    Sex    Age  SibSp  Parch  Ticket  \
    0          False     False   False  False  False  False  False  False   False   
    1          False     False   False  False  False  False  False  False   False   
    2          False     False   False  False  False  False  False  False   False   
    3          False     False   False  False  False  False  False  False   False   
    4          False     False   False  False  False  False  False  False   False   
    ..           ...       ...     ...    ...    ...    ...    ...    ...     ...   
    886        False     False   False  False  False  False  False  False   False   
    887        False     False   False  False  False  False  False  False   False   
    888        False     False   False  False  False   True  False  False   False   
    889        False     False   False  False  False  False  False  False   False   
    890        False     False   False  False  False  False  False  False   False 

它有 891 行,充满了 True 和 False。

  1. 当你使用sum(),它将返回每列的总和,将 true(=1) 和 false(= 0) 加在一起。就像这样
print(False+False+True+True)
    2
  1. 当你使用count(),它只是返回行数.

当然,无论您使用 .isnull().count() 还是 .notnull().count(),每列都会得到 891。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python - isnull().sum() 与 isnull().count() 的相关文章

随机推荐

  • cassandra 2.2 CQl Shell 支持 python 2.7

    尝试启动 cql Shell 时出现错误 gt cqlsh CQL Shell supports only Python 2 7 gt 我已经安装了python2 7但它仍然给出相同的错误 我必须设置一些路径吗 我已经使用此命令从 data
  • Python - 使用 pandas 多重处理多个大尺寸文件

    我有一个y csv文件 文件大小为 10 MB 包含来自Jan 2020 to May 2020 我每个月还有一个单独的文件 例如data 2020 01 csv 它包含详细的数据 每个月文件的文件大小约为1 GB 我正在分割y csv按月
  • GUI 在循环时变得无响应

    单击按钮后 表单将变得无响应 直到解析函数完成其工作 我想将 searchAll 函数移至线程 我确实阅读了类似问题的几个答案 但我不明白如何 class MyForm QDialog def init self super init se
  • 连接到 SFTP 服务器时出现 SocketException:名称有效,但未找到请求类型的数据

    我正在尝试使用 SharpSsh 库连接我的 sftp 服务器 但出现以下错误 System Net Sockets SocketException 0x80004005 The requested name is valid but no
  • Flutter 在本机应用程序中打开本地资源(PDF)

    我正在尝试将我的应用程序与 PDF 捆绑在一起 并让用户在本机查看器中打开它 我努力了 将 PDF 的数据复制到 临时目录 或 文档目录 来自 path provider 并从那里打开 要打开 我使用 url launcher 打开文件 我
  • 使用 angular2 限制输入字段的长度

    我已经实现了使用 angular2 限制输入字段的指令 它在桌面浏览器中工作正常 但在 Android 移动设备中无法工作 成分 import LimitToDirective from directives limitedvalidati
  • 按两个变量组进行汇总

    考虑一个简化的数据集 真实的数据集有更多的列和行 df tp tf weight 1 FWD RF 78 86166 2 MF LF 81 04566 3 DEF LF 80 70527 4 DEF LF 82 96071 5 DEF RF
  • 如何将position_dodge()和geom_line()与重叠分组结合起来?

    当 x 轴上的分组变量 颜色和线条重叠但总是不同时 是否可以使用 geom line 在躲避点之间绘制一条线 下图中的灰线应该始终连接两个具有相同名称的数据点 它们位于相同的分组 2 x 轴 内 但位于不同的分组 2 颜色 中 可重现的例子
  • 如何在silverstripe数据扩展中自动发布图像

    我试图将上传字段添加到自定义数据扩展并让图像字段正常工作 但是 我上传的图像仍处于概念模式 我必须转到 文件 选项卡才能发布它 我尝试使用 Silverstripe 文档中提供的代码 但这似乎只适用于常规页面 我发现了一个和我类似的问题 如
  • 在 .htaccess 中使用自定义环境变量

    我需要这样的东西 SetEnv foo bar baz RewriteEngine On RewriteCond HTTP HOST foo RewriteRule http www foo 1 L UPD 我做了如下 SetEnv HOS
  • Struts 2 文件上传 - 空指针异常

    我正在尝试结合使用 Struts2 和 Spring 来上传文件 但是 不知怎的 在到达我的动作课 我的文件之后 filename和文件内容类型都出来了null 我尝试寻找问题所在 但没有结果 下面是我的文件上传的代码 index jsp
  • 如何使用 Mockito 和 JUnit 检查方法中的 if 语句?

    我有我应该测试的方法 代码 当然有些部分被删掉了 public class FilterDataController public static final String DATE FORMAT yyyy MM dd Autowired p
  • 在docker下安装时可以回答对话框问题吗?

    是否可以以某种方式回答使用 apt get 安装某些软件包时以对话框形式出现的问题 例如 我正在尝试设置一个包含以下内容的容器mail stack delivery包装内含 FROM ubuntu RUN apt get install y
  • 如何在android中使用sax解析器从xml读取imageUrl在网格视图中显示图像

    我是安卓新手 我想创建一个应用程序来从 URL 读取 XML 文件并使用图像的 ImageUrl 在网格视图中显示图像 感谢您的回答 但我可以从 url 读取 xml 文件 但我需要 xml imageUrl 是否存在 以便在网格视图中显示
  • 计算原始输入中的元音数

    我有一个家庭作业问题 要求通过原始输入读取字符串并计算字符串中有多少个元音 这是我到目前为止所拥有的 但我遇到了一个问题 def vowels vowels a e i o u count 0 string raw input Enter
  • 运行“sudo pip”有哪些风险?

    偶尔我会遇到评论或回应该状态强调运行pip under sudo是 错误 或 坏 但在某些情况下 包括我设置一堆工具的方式 它要么更简单 要么甚至有必要以这种方式运行 跑步有哪些风险pip under sudo 请注意 这与以下问题不同th
  • 在定义整个映射之前,如何引用映射中的变量?

    我将从我的代码开始 因为它应该更容易理解我想要做什么 function get color color lightness return map get map get colors color lightness colors green
  • Thread.MemoryBarrier 和简单属性的锁区别

    对于以下场景 有什么区别吗关于使用之间的线程安全性 结果和性能MemoryBarrier private SomeType field public SomeType Property get Thread MemoryBarrier So
  • 在 Python 中使用 pynput 检查特定键

    dpressed 0 def on press key if key d global dpressed dpressed 1 logging info D s dpressed 当我运行此代码并按 d 时 没有任何反应 我怀疑这是因为在检
  • Python - isnull().sum() 与 isnull().count()

    所以我目前正在完成泰坦尼克号数据集的教程 https www kaggle com c titanic data 现在我正在尝试一些可能相关的新事物 The info for it is There are 891 entries red