pandas数据判断是否为NaN值的方式

2023-11-16

实际项目中有这样的需求,将某一列的值,映射成类别型的数据,这个时候,需要我们将范围等频切分,或者等距切分。

具体的做法可以先看某一些特征的具体分布情况,然后我们选择合适的阈值进行分割。

def age_map(x):
    if x < 26:
        return 0
    elif x >=26 and x <= 35:
        return 1
    elif x > 35 and x <= 45:
        return 2
    elif pd.isnull(x):  #判断是否为NaN值,== 和in 都无法判断
        return 3
    else:
        return 4

也就是用pandas自带的函数来表示:

pd.isnull(x)   

最后我们可以应用map函数:

data['age'] = data['birth_year'].map(age_map)

统计df文件中有多少空值

df = pd.read_csv('test.csv')

df.isna().sum()

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

pandas数据判断是否为NaN值的方式 的相关文章

  • 2021-09-23 opencv学习笔记(图像变换,二值化,滤波器介绍及python实现)

    opencv学习笔记 颜色空间 改变颜色空间 cv2 cvtColor 目标追踪 如何查找某个颜色的HSV值 图形变换 缩放 cv2 resize 平移 旋转 仿射变换 透视变换 二值化 简单阈值法 自适应阈值 Otsu二值化 俗称大津法
  • Python·Jupyter Notebook各种使用方法

    1 更改Jupyter notebook的工作空间 Jupyter的工作空间在哪里指定 在cmd中输入jupyter notebook generate config 如果该配置文件已经存在 那么 会出现如下信息 从中可以见到配置文件存在的
  • adam算法介绍和总结

    19 adam算法 Adam 是一种可以替代传统随机梯度下降 SGD 过程的一阶优化算法 它能基于训练数据迭代地更新神经网络权重 Adam 最开始是由 OpenAI 的 Diederik Kingma 和多伦多大学的 Jimmy Ba 在提
  • python后端学习(十三)路由支持正则、Url编码、增删改操作、增加log日志

    路由支持正则 编码 增删改操作 增加log日志 mini frame py import re url编码相关 import urllib parse import logging from pymysql import connect U
  • Transformer详解

    Transformer 什么是transformer 为什么需要用transformer encoder sub encoder block multi head self attention FFN input decoder input
  • pip安装yaml出错问题及解决方案

    pip安装yaml出错问题及解决方案 在使用Python开发过程中 可能会遇到需要安装第三方库的情况 而有时候我们在使用pip install安装某些库时 会遇到一些错误提示 其中就有可能会出现 ERROR Could not find a
  • Python设置excel单元格格式

    文章目录 xlwt 模块简介 设置数字的格式 设置字体 设置对齐方式 设置边框 设置 填充 设置保护 xlwt 模块简介 xlwt 是 python中一个用来操作 excel 文件的库 其中 封装了很多常用操作 本文主要讲解使用该库在生成e
  • Python —— 第四部分 面向对象程序设计

    第四部分 面向对象程序设计 4 1 基本概念 4 2 类的定义与使用 4 3 self 参数 4 4 类成员与实例成员 4 4 1 修改属性的值 4 5 成员 4 6 方法 4 7 继承机制 4 7 1 子类的方法 init 4 7 2 给
  • Python的学习过程中not enough values to unpack (expected 2, got 1)解决方案

    这是一篇在自学过程中debug的笔记 愿我们一同进步 问题描述 跟着小甲鱼一起学习Python 在学习到 文件 的时候有一个代码任务 内容是根据两个人物之间的三段对话对话进行分割提取操作 运行时报错 主要报错为not enough valu
  • python 二叉树,先序回溯,层序队列,队列基础用法,二叉树深度

    文章目录 1 创建二叉树 先 中 后遍历 2 n个节点有多少种二叉树 递归 3 层序遍历 4 队列基础用法 五 二叉树深度 1 创建二叉树 先 中 后遍历 创建二叉树 class TreeNode def init self data le
  • 递推和递归、迭代的关系简介

    递推和递归 迭代的关系简介 在编程里 递推关系可以通过递归或者迭代来实现 但是递归和迭代又不仅仅只能用来实现递推关 有更广泛的用途 递推 递归和迭代都是解决问题的方法 它们之间有一定的联系 递归和迭代可以用于实现递推关系 但它们也有各自独立
  • python自动化课程笔记(六)函数

    函数 类 模块 包 项目 包与文件夹的区别在于 包中有很多模块 和init文件 函数 提高编码的效率及代码的重用 把独立功能的代码块组成一个小模块 def printInfo 定义一个函数 print 10 print 人生苦短 我用pyt
  • python3读取excel文件只提取某些行某些列的值

    今天有一位同学给了我一个excel文件 要求读取某些行 某些列 然后我试着做了一个demo 这里分享出来 希望能帮到大家 首先安装xlrd pip3 install xlrd 然后上代码 import numpy as np import
  • GIS栅格平均值计算

    GIS中批量计算tif栅格文件平均值 coding UTF 8 import arcpy import os inws r C Users DELL Desktop 新建文件夹 arcpy env workspace inws raster
  • python实现常用数据结构

    本文基于Python实现以下几种常用的数据结构 栈 队列 优先队列 二叉树 单链表 双向链表 栈 基于List实现 class Stack 栈 def init self self arr self size 0 def push self
  • 残差神经网络(ResNet)

    残差神经网络的主要贡献是发现了退化现象 并针对退化现象发明了快捷连接 shortcut connection 极大的消除了深度过大的神经网络训练困难问题 1 神经网络越深准确率越高 假设一个层数较少的神经网络已经达到了较高准确率 可以在这个
  • Python学习-----起步4(列表元素的添加,删除,修改,查询,获取长度)

    目录 前言 列表元素的添加 或者叫写入 1 append 函数 2 extend 函数 3 insert 函数 列表元素的删除 1 remove 函数 2 pop 函数 3 clear 函数 4 del 方法 这个不是函数哦 列表元素的修改
  • 机器学习2-线性回归

    一 矩阵求导公式 1 总体情况 2 分子布局 Numerator layout 和分母布局 Denominator layout 首先我们常说 y 对 x 求导 这里的 y 和 x 均默认为列向量 y为 mx1 x为 nx1 1 分子布局
  • 用KNN(K近邻算法)和ANN(人工神经网络)建立预测模型

    数据 输入 32 维的向量 输出一个值 有151组这样的数据 目的 用这样一组数据建立一个预测模型 输入32维的向量就能预测一个值 代码部分 1 导入工具包 在import pandas as pd import seaborn as sn
  • Python入门到实战(十一)无监督学习、KMeans、KNN、实现图像分割、监督学习VS无监督学习

    Python入门到实战 十一 无监督学习 KMeans KNN 实现图像分割 监督学习VS无监督学习 无监督学习unsupervised learning 特点 应用 K均值聚类 核心流程 核心公式 KMeans VS KNN 实战 KMe

随机推荐

  • QT学习——QTreeView获取选中单行数据和多行数据

    个人感觉QTreeView有些地方的使用没有MFC的CListCtrl方便 比如在不响应单击信号的情况下 获取选中行的数据 单行和多行 也许因为我是新手吧 一 获取单行选中的数据 QModelIndex selected ui treeVi
  • 自学c++笔记(二)

    笔记记录本人学习C 路上的一些摘要与总结 供本人阅读同时也分享与他人 变量的定义 int carrots carrot 25 cout lt lt carrots 会输出25 int 表示整数 carrot 来标识存储在该内存单元的值 co
  • manjaro主目录设置英文

    终端 vim config user dirs dirs 把对应的换成英文 然后命令 mv 下载 Downloads mv 桌面 Desktop mv 模板 Templates 全部 mv
  • 2点云--数据结构

    根据激光测量原理得到的点云 包含三维坐标信息 xyz 和激光反射强度信息 intensity 激光反射强度与仪器的激光发射能量 波长 目标的表面材质 粗糙程度 入射角相关 基本类型PointCloud PCL的基本数据类型是PointClo
  • 海康PS转H264的编码思想(带图码流解释)

    海康PS转H264的编码思想 带图码流解释 本人PS流解析成H264的其余文章 01PS流格式 02封装时遇到的重点问题 03海康PS转H264的编码思想 带图码流解释 1 海康的PS流发包的顺序到底是如何发送的 根据01PS流格式我们知道
  • 关于敷铜全连接和十字连接

    敷铜时 地层要采用十字连接 因为一般在TOP或者BOTTOM层会全敷铜 采用十字连接会降低散热速度 而电源层要采用全连接
  • html gif无限循环播放,【GIF】无限循环GIF太神奇,有人知道这是怎么做的吗?

    今天橘子君给大家介绍一位土耳其摄影艺术家Erdal Inci的GIF作品 有没有感觉是无限循环的 没错 无限循环的动态影像作品 现在使用GIF也能办到 土耳其摄影艺术家 Erdal Inci 把运动人物连续的动作合成到同一个画面 并做成循环
  • PROFIBUS DP从站开发 VPC3源程序分析---vpc3_cfg_data_not_ok(void)

    以下程序注释由成都地质学院霸王猫添加 引用时请尊重作者劳动成果 标明引用者来自成都地质学院霸王猫 UBYTE vpc3 cfg data not ok void 入口参数 无 出口参数 无 返回值 VPC3 CFG FINISHED VPC
  • Python最常用的7个框架讲解!

    众所周知 Python语言中内置了很多框架 拿来即用 为我们的工作带来了很多便利 也提高了效率 本文为大家介绍7种常见且实用的Python框架 主要包括 Django flask scrapy Diesel Cubes Pulsar和Tor
  • Apipost,更懂中国程序员的接口调试神器

    Hello 大家好 我是灰小猿 一个超会写bug的程序猿 作为一名Java后端程序猿 对接口调试简直是家常便饭 尤其是在进行接口联调的时候 往往因为和前端对接口的理解程度不同 于是乎就出现了 而且 程序员的蹩脚英语往往是不能区分Java和j
  • 修改Tomcat的默认端口号

    1 找到Tomcat的安装路径 2 打开conf文件夹 3 用记事本打开server xml文件 4 找到
  • 从Vue-cli脚手架的基本使用到vue路由的基本使用

    第一部分 Vue cli脚手架 vue2是对新手很友好的MVVM框架 有完善的官方中文文档 阅读起来也非常容易理解 由浅入 深 示例完整 同时官方也提供了一个开箱即用的 vue cli 帮我们生成一个完整的项目框架 vue js 著名的全家
  • linux运行python代码进行训练时断开服务器中断训练解决办法

    无论是远程连接服务器还是将服务资源拉取的pycharm中使用 都会存在一个问题 就是远程客户端关闭后 服务端的训练就会终止 这样对于远程客户端的限制就非常大 为了解决这个问题 只需要在训练时按照下面命令操作即可完成 第一步 nohup py
  • Pytest的乐趣

    Pytest的乐趣 前言 安装 关键词test 关键词assert 进阶一 参数 进阶二 软断言 进阶三 配置文件pytest ini 进阶四 前后设置 进阶五 并行测试 进阶六 命令行参数扩展 前言 Pytest就是为了测试已经完成的Py
  • centos7下使用yum安装mysql数据库

    分享下装mysql数据库的过程以及远程连接的方法 整合了部分网上的资源以及自己遇到的一些问题 常用的一些命令就不一 一介绍了 话不多说 马上开始 1 下载mysql的repo源 wget http repo mysql com mysql
  • Python3 如何优雅地使用正则表达式(详解四)

    更多强大的功能 到目前为止 我们只是介绍了正则表达式的一部分功能 在这一篇中 我们会学习到一些新的元字符 然后再教大家如何使用组来获得被匹配的部分文本 更多元字符 还有一些元字符我们没有讲到 接下来小甲鱼一一为大家讲解 有些元字符它们不匹配
  • 现代控制理论(4)——李雅普诺夫稳定性理论

    文章目录 一 李雅普诺夫关于稳定性的定义 1 李氏意义下的稳定 2 渐近稳定 3 大范围渐近稳定 4 不稳定 二 李雅普诺夫第一法 1 线性系统的稳定判据 2 非线性系统的稳定判据 三 李雅普诺夫第二法 1 标量函数的定号性 2 稳定性原理
  • 钓鱼篇-利用RLO隐藏exe&文件捆绑&office免杀-远程模板加载上线CS

    RLO伪装图片执行 利用msf生成木马x exe msfvenom p windows meterpreter reverse tcp LHOST 192 168 96 128 LPORT 4444 f exe o x exe Metasp
  • 使用matlab里的集成树进行数据回归预测

    当使用MATLAB时 您可以使用集成学习方法中的决策树来进行数据回归预测 决策树回归是一种基于树状结构的机器学习算法 它通过对训练数据进行分层次的决策来进行预测连续值的输出 MATLAB提供了一个称为RegressionTree的集成树回归
  • pandas数据判断是否为NaN值的方式

    实际项目中有这样的需求 将某一列的值 映射成类别型的数据 这个时候 需要我们将范围等频切分 或者等距切分 具体的做法可以先看某一些特征的具体分布情况 然后我们选择合适的阈值进行分割 def age map x if x lt 26 retu