Python / Pyspark - 计数 NULL、空和 NaN

2024-06-23

我想计算列中的 NULL、空和 NaN 值。我尝试过这样的：

df.filter( (df["ID"] == "") | (df["ID"].isNull()) | ( df["ID"].isnan()) ).count()

但我总是收到此错误消息：

TypeError: 'Column' object is not callable

有谁知道可能是什么问题？

提前谢谢了！

isnan不是属于的方法Column类，你需要导入它：

from pyspark.sql.functions import isnan

并像这样使用它：

df.filter((df["ID"] == "") | df["ID"].isNull() | isnan(df["ID"])).count()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

PySpark

Python / Pyspark - 计数 NULL、空和 NaN 的相关文章

当遵循文档代码时，Python 多处理返回 AttributeError [重复]

这个问题在这里已经有答案了我决定尝试使用多处理器模块来帮助加速我的程序为了弄清楚这一点我尝试使用有关多处理的官方 python 文档中的一些代码示例第一次尝试介绍 https docs python org 3 library m
从 java 代码运行 Python 脚本

这是我第一次在java中尝试python 我正在尝试从我的代码执行 python 脚本如下所示 Process process Runtime getRuntime exec python C Users username Desktop
python 函数 *args 和 **kwargs 以及其他指定的关键字参数

我有一个 Python 类它的方法应该以这种方式接受参数和关键字参数 class plot def init self x y self x x self y y def set axis self args xlabel x ylabe
为什么 scikit-learn SVM.SVC() 非常慢？

我尝试使用SVM分类器来训练大约10万个样本的数据但我发现它非常慢甚至两个小时后也没有任何反应当数据集有大约 1k 个样本时我可以立即得到结果我还尝试了 SGDClassifier 和朴素贝叶斯速度相当快几分钟内就得到了结果
os.walk 无需深入研究下面的目录

我该如何限制os walk只返回我提供的目录中的文件 def dir list self dir name whitelist outputList for root dirs files in os walk dir name for f
如何为 PyYAML 编写代表程序？

我想要一个自定义函数来序列化任意 python 对象就像 json dump 函数有一个名为 default 的可选参数如果对象不是 json 可序列化的它应该是 json 转储器将调用的函数我只是想从 json 包中执行相当于此操
[Python]比较两个 zip 文件的函数，一个位于 FTP 目录中，另一个位于我的本地计算机上

我在创建比较两个 zip 文件的函数时遇到问题如果它们相同而不仅仅是名称相同这是我的代码示例 def validate zip files self host 192 168 0 1 port 2323 username 123 pa
dask分布式内存错误

在分布式作业上运行 Dask 时我在调度程序上遇到以下错误 distributed core ERROR Traceback most recent call last File usr local lib python3 4 dist
识别文本中的多个类别和相关情感

如果您有一个文本语料库如何识别所有类别来自预定义类别列表以及与之相关的情绪正面负面写作我将在 Python 中执行此操作但现阶段我不一定要寻找特定于语言的解决方案让我们用一个例子来看看这个问题试图澄清我的问题如果我有一整
如何忽略 Sentry 捕获中的某些 Python 错误

我已将 Sentry 配置为捕获 Django Celery 应用程序中的所有错误它工作正常但我发现一个令人讨厌的用例是当我必须重新启动我的 Celery 工作人员 PostgreSQL 数据库或消息服务器时这会导致数千种各种无法访
pip 升级到 pip 10.x.x 后解析需求文件的正确方法？

所以今天我确实发现随着发布pip 10 x x the req软件包更改了其目录现在可以在下面找到pip internal req 由于通常的做法是使用parse requirements功能在你的setup py从需求文件中安装所有依赖
Python httplib 和 POST

我目前正在使用别人编写的一段代码它用httplib向服务器发出请求它以正确的格式提供所有数据例如消息正文标头值等问题是每次尝试发送 POST 请求时数据都在那里我可以在客户端看到它但没有任何内容到达服务器我已经阅读了库规
抓取 Shopee API v4

我有一个最终项目其中我想要检索的数据是通过在shopee上抓取数据来获取的但是当我在隐藏的API上抓取shopee时遇到问题当我在Insomnia脚本上尝试时脚本会运行但是当我尝试时在本地或 google colab 脚本上这是
从Python列表中挑选出具有特定索引的项目

我确信在 Python 中有一种很好的方法可以做到这一点但我对这门语言还很陌生所以如果这是一个简单的方法请原谅我我有一个列表我想从该列表中挑选某些值我想要挑选的值是列表中索引在另一个列表中指定的值例如 indexes 2 4
matplotlib 后端 - 我关心吗？

gt gt gt import matplotlib gt gt gt print matplotlib rcsetup all backends u GTK u GTKAgg u GTKCairo u MacOSX u Qt4Agg u
ValueError：序列太大；不能大于 32

我写了这段代码 from Crypto Cipher import AES import numpy as np import cv2 base64 BLOCK SIZE 16 PADDING pad lambda s s BLOCK SI
Maya python 连接选择的属性

我一直在尝试制作一个简单的脚本它将采用两个视口选择然后基本上将第二个视口的旋转连接到第一个我不确定如何正确地从视口选择中为对象创建变量这是我的尝试但不起作用 import maya cmds as cmds sel cmds ls
Mac 无法安装 Tensorflow

我检查了我的 pip3 和 python3 版本 tensorflow MacBook Pro de Hector 2 tensorflow hectoresteban pip3 V pip 10 0 1 from Users hector
合并共享属性的节点

EDITED 我真的需要 Networkx graph 专家的帮助假设我有以下数据框我想将这些数据框转换为图表然后我想根据描述和优先级属性将两个图映射到相应的节点 df1 From description To priority 10
定义Python类时，如何在其中设置随机变量？

假设我有一个名为Person 其中只有该人的姓名和性别性别应从男性和女性中随机选择为此我导入random randint 功能根据随机int确定随机性别 import random class Person alias random

随机推荐

android：Flurry 广告横幅全屏显示

我正在我的应用程序中实施混乱的横幅广告但需要全屏我的主要 Activity xml 是
如何将 CSS 类名添加到 ASP.NET MVC 3 Url.Action 链接？

在 ASP MVC 3 或 4 使用 Razor 中如何将 CSS 类应用到 Url Action 辅助方法是否可以期望的结果 a href class FOO BAR a 我已经走到这一步了 Url Action Index Hom
Maven `pre` 和 `post` 阶段

Are the pre and post当我执行关联的阶段时总是执行阶段例如如果我这样做mvn clean 这会执行mvn post clean也有相吗我在看https maven apache org guides introduc
如何从 LocalNotification 中删除取消的 ApplicationIconBadgeNumber？

我在我的应用程序中使用 LocalNotification 它工作正常但一旦设置了 ApplicationIconBadgeNumber 就无法将其从应用程序中删除如何去除它您需要设置应用程序applicationIconBadgeN
显式使用扩展方法

我有一个List
Jenkins 通过选择 Nexus 工件的版本（所有 GAV）进行参数化构建

是否有 Jenkins 插件可以对我的 Nexus 存储库进行组工件版本 GAV 搜索并列出结果我希望结果可以在参数化构建中作为选择下拉列表提供我添加了一个常规脚本动态选择参数 https wiki jenkins ci org d
如何将双精度数转换为保留 2 位小数的字符串？

我正在将这个双精度数转换为字符串以便可以将其显示在 TextView 上我希望使用 String format 使字符串具有 2 个小数位但我不知道将其放在这行文本中的何处 Example setText Double toStrin
如何在 PowerShell 中创建数组的数组？

我想在 PowerShell 中创建一个数组的数组 x 1 2 3 4 5 6 效果很好然而有时我的数组列表中只有一个数组在这种情况下 PowerShell 会忽略以下列表之一 x 1 2 3 x 0 0 Should return
更改 adb 服务器运行的默认端口（即 5037）

我是一位崭露头角的 Android 开发人员如果没有简单的方法来配置 adb 服务器以在另一个端口上运行那么工具不灵活将迫使我退出 Android 应用程序开发网络搜索没有返回任何解决方案我还在 android sdk 目录中的所有
Azure NodeJS 控制台日志

我有 Visual Studio Enterprise MSDN 订阅因此我决定从 Heroku 迁移到 Microsoft Azure 因为我曾经付费现在不用了我的服务计划是 D1 我希望能够跟踪部署在 Azure 平台上的 Nod
双“for”在列表理解中如何工作？

因此有关此问题出现的问题背景请参阅此link https stackoverflow com questions 48049006 matching states and cities with possibly multiple wo
通过 apache 服务器内的服务器端过滤动态包含 piwik 代码

经过几个小时的无果尝试后我想请求大家通过简单的设置提供一点帮助对于我使用的 apache2 http 服务器运行的一堆 Web 应用程序和站点Piwik http piwik org 进行简单的统计概述效果很好让我烦恼的是对于每个
SwiftUI Switch 语句转换行为不符合预期

我越来越出乎意料 transition使用时的行为switch更新视图的语句与使用两个语句时的比较if声明他们俩if语句正在按预期将视图滑入和滑出但是相同的转换switch语句导致视图从一侧滑入并从另一侧退出我正在寻找使用switc
使用 CMake 设置 SystemC 项目：对 `sc_core 的未定义引用

我正在尝试使用 CMake 在 SystemC 中构建一个简单的 hello world 这是SystemC文件main cpp include
如何以编程方式隐藏桌面图标？

如何使用 C 以编程方式显示隐藏桌面图标我正在尝试创建一个使用小部件的替代桌面并且我需要隐藏旧图标您可以使用 Windows API 来执行此操作以下是 C 示例代码用于切换桌面图标 DllImport user32 dll S
在 Rails 中生成 slugs（人类可读的 ID）的最佳方法

你知道比如 myblog com posts donald e knuth 我是不是该使用内置的parameterize method https stackoverflow com questions 1252506 rails slu
Math.random() 与 Random.nextInt(int)

有什么区别Math random n and Random nextInt n where n是一个整数 Here is 详细解释 https community oracle com message 6596485 thread mess
如何通过 iMessage ios 8 发送音频文件

正如我们所知随着 ios 8 的推出苹果允许自定义键盘扩展在键盘扩展中我们可以使用将图像复制到剪贴板在短信中发送图像 gif 等代码 UIPasteboard pasteboard UIPasteboard generalPa
设置代理隐藏我的IP地址以使用scrapy抓取网页

我正在使用 scrapy 抓取网站现在我需要设置代理处理已发送的请求谁能帮我解决scrapy应用程序中设置的代理问题如果有的话也请提供任何示例链接我需要解决这个请求来自哪个 IP 的问题您可以通过下面找到的代码来做到这一点her
Python / Pyspark - 计数 NULL、空和 NaN

我想计算列中的 NULL 空和 NaN 值我尝试过这样的 df filter df ID df ID isNull df ID isnan count 但我总是收到此错误消息 TypeError Column object is not

Python / Pyspark - 计数 NULL、空和 NaN

Python / Pyspark - 计数 NULL、空和 NaN 的相关文章

随机推荐

热门标签