pandas用均值填充nan_pandas dataframe 填充 NaN(填补缺失值)的方法 fillna 函数使用说明...

2023-11-04

在基于 pandas 的 DataFrame 对象进行数据处理时(如样本特征的缺省值处理),可以使用 DataFrame 对象的 fillna 函数进行填充,同样可以针对指定的列进行填补空值,单列的操作是调用 Series 对象的 fillna 函数。

fillna 函数

DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)

fillna 函数将用指定的值(value)或方式(method)填充 NA/NaN 等空值缺失值。

value

用于填充的值,可以是数值、字典、Series 对象 或 DataFrame 对象。

method

当没有指定 value 参数时,可以该参数的内置方式填充缺失值,可选项有 {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None},默认值为 None;backfill 和 bfill 用下一个非缺失值填充该缺失值,pad 和 ffill 用前一个非缺失值去填充该缺失值。该参数通常和 axis 一起使用,值得注意的是,method 参数不能与 value 同时出现。

axis

指定填充维度,具体指行维度或列维度,也可以理解为指定填充的方向,可选值有整数 0 或 1,也可以是字符串,选项有 'index' 或 'columns',0 等同于 'index' 表示行维度,1 等同于 'columns' 表示列维度。

inplace

是否修改原对象的值,True 表示修改,默认是 False,表示创建一个副本,修改副本,原对象不变。

limit

指定填充的个数上限,默认为 None,即不限制。

示例

通过常数填充 NaN

填充前:

import pandas as pd

df = pd.read_csv("nba.csv")

DataFrame 对象 df 如下图:

下面将如上示例的 College 列的 NaN 填充为 'No College',同时改变原对象的值,代码如下:

import pandas as pd

df = pd.read_csv("nba.csv")

df["College"].fillna("No College", inplace = True)

执行上述代码后,df 变为如下输出:

利用 method 参数填充 NaN

下面示例,指定 method 为 ffill,即缺失值的前一个值来填充 NaN,同样针对 College 列进行操作,会看到第 4、5 行的空值变为 Georgia State。

import pandas as pd

df = pd.read_csv("nba.csv")

df["College"].fillna(method ='ffill', inplace = True)

输出如下:

使用 limit 参数设置填充上限

设置 limit 参数为 1,这样只会按序填充完 1 个空值,具体示例如下:

import pandas as pd

df = pd.read_csv("nba.csv")

df["College"].fillna(method ='ffill', limit = 1, inplace = True)

代码执行完结果为只改变了第 4 行数据,第 5 行空值未填充,输出如下:

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

pandas用均值填充nan_pandas dataframe 填充 NaN(填补缺失值)的方法 fillna 函数使用说明... 的相关文章

  • 腾讯云视频上传问题总结

    使用腾讯云提供java sdk4 4 MultipartUploadVodFile使用此接口 分片上传 分片大小设置1024 1024 20会被腾讯服务器拒绝 无法上传 目前设置为1024 1024 5 最小分片设置为1024 512 域名
  • adaboost原理(包含权重详细解释)

    1 1 Adaboost是什么 AdaBoost 是英文 Adaptive Boosting 自适应增强 的缩写 由Yoav Freund和Robert Schapire在1995年提出 它的自适应在于 前一个基本分类器分错的样本会得到加强
  • 为什么说区块链的性能严重不足?

    现如今 性能过低是当前区块链技术面临的主要挑战之一 区块链的性能指标主要包括交易吞吐量和延时 交易吞吐量表示在固定时间能处理的交易数 延时表示对交易的响应和处理时间 在实际应用中 需要综合两个要素进行考察 只使用交易吞吐量而不考虑延时是不正
  • STM32CubeMX学习——旋转编码器模块

    前言 雨打灯难灭 风吹色更明 若飞天上去 定作月边星 李白 咏萤火 一 旋转编码器介绍 旋转编码器是一种可以左右旋转 同时也可以按下 也可以按下旋转的器件 通过左右旋转对应着内部不同开关的导通 同时按下也可以旋转 由此看来旋转编码器可以实现
  • 计算机msvcp120.dll丢失的解决方法

    计算机msvcp120 dll丢失的解决方法 相信困扰着不少小伙伴 msvcp120 dll系统文件是电脑重要的文件 丢失或者被损坏的话 很多软件跟游戏都会无法运行 需要怎么修复呢 小编今天就把教程分享给大家 修复教程如下 首先是打开电脑浏
  • el-dialog 对话框显示怎么往上调一调 或者往下调调显示

  • Python股票历史数据预处理(一)

    Python股票历史数据预处理 一 在进行量化投资交易编程时 我们需要股票历史数据作为分析依据 下面介绍如何通过Python获取股票历史数据并且将结果存为DataFrame格式 处理后的股票历史数据下载链接为 http download c
  • layui中form.val()使用,不起作用的原因

    在使用layui中 form表单数据的获取和渲染时绕不开的话题 在layui中form数据的渲染有个方法 form val 但是在使用的过程中很容易陷入误区 下面我就来为大家介绍如何解决form val 不显示的问题 let obj tit
  • error An unexpected error occurred: “https://registry.yarnpkg.com/axios: con 解决方案

    error An unexpected error occurred https registry yarnpkg com axios con 今天用在跑一个项目的时候发现了这个错误 看着像是网络连接不上 发现这里是用的Dokcerfile
  • 向ACCESS中的"时间/日期"字段中插入DateTime.Now时出现“标准表达式中数据类型不匹配。”错误的解决办法

    在使用下面的代码向Access数据库中添加数据的时候 如果是日期字段 则会出现 标准表达式中数据类型不匹配 的错误 这可能是C 中的日期类型无法直接转换成Access中的日期类型OleDbType DBDate所致 string Conne
  • Maximum Sum Subarray of Size K--滑动窗口题型

    滑动窗口题型 滑动窗口类型的题目经常是用来执行数组或是链表上某个区间 窗口 上的操作 比如找最长的全为1的子数组长度 滑动窗口一般从第一个元素开始 一直往右边一个一个元素挪动 当然了 根据题目要求 我们可能有固定窗口大小的情况 也有窗口的大
  • 电脑副业能做什么?一台电脑能做的副业

    现在很多人都想在工作之余开展一些副业 特别是今年经济形势不好 更让很多人明白了 有一份副业的重要性 这样可以在自己没有工作的时候还能有一份收入 那么有哪些副业可以在网络上做呢 如果你只有一台电脑的话 可以做哪些副业呢 1 自媒体 悟空问答或
  • Docker常用命令超细介绍,Java校招面试指南

    2 3 docker pull 前面我们介绍了 search命令可以从docker hub上搜索到相关的镜像 接下来看看我们通过docker pull 来下载镜像 docker pull 镜像名称 TAG 通过镜像加速下载还是比较快的 2
  • 解决下载github-production-release-asset-2e65be.s3.amazonaws.com上release文件慢的问题

    1 问题 去github下载BloomRPC工具进行测试grpc 果然一如既往的慢 想到把github转到码云进行下载 奈何我要下载的是release的文件 有两个代下地址 GitHub代下载服务 永久免费 这个最近貌似挂了 试试下面那个
  • java 之 反射 (结合Class理解)

    反射机制使静态语言java变为准动态语言 Reflection 反射机制允许程序在执行期借助于Reflection API取得任何类的内部信息 并能直接操作任意对象的内部属性及方法 反射方式 实例化对象 getClass 方法 得到完整的
  • Keil MDK环境下FreeModebus移植踩坑记录

    Keil MDK环境下FreeModebus移植踩坑记录 文章目录 Keil MDK环境下FreeModebus移植踩坑记录 armcc arm compiler v5 环境 实验一 实验二 armclang arm compiler v6
  • NFTScan 与 Atem Network 在 NFT 数据领域达成战略合作

    近日 Web3 基础设施 NFTScan 浏览器与 Atem Network 协议达成战略合作伙伴关系 双方已在 NFT 数据领域展开深度了合作 Atem Network 是一个 Web3 社交平台 用户可以通过 NFT 创建 连接和拥有自
  • 蓝桥杯-刷题统计

    问题描述 小明决定从下周一开始努力刷题准备蓝桥杯竞赛 他计划周一至周五每天 做 aa 道题目 周六和周日每天做 bb 道题目 请你帮小明计算 按照计划他将在 第几天实现做题数大于等于 nn 题 输入格式 输入一行包含三个整数 a ba b
  • 联想笔记本BIOS设置中文详解

    对于很多新装系统的小伙伴们 可能很多都不是太懂BIOS中都是干什么用的 小编这里给大家详细介绍一下 联想笔记本的主板BIOS设置跟别的笔记本或许有些不同但大体相差不多 和大家分享一下 BIOS介绍 中文解释就是 基本输入输出系统 其实它是固

随机推荐

  • python关于初始化和实例化之----log日志打印两次的问题综述

    我在写appium desktop自动化框架的时候 我发现在我运行demo的时候 日志会运行两次 我查了一堆资料也没有发现我错在哪里 一 开始我以为是 init 的问题 我检查了 init 方法 发现他们属于同一对象 没有多余的对象 二 然
  • 5g信号频率是多少赫兹_我家WiFi也有“5G”,这是5G信号吗?

    大家都知道5G吧 5G是最近很火热的名词 大家都知道它和手机有关系 有些小伙伴在用手机和电脑连WiFi的时候 也能看到一些WiFi名字后面跟着一个 5G 这个 5G 是平时说的那个5G吗 答案是 否 5G是 5th generation m
  • 服务器拷贝文件工具,windows命令行下也有好工具(四)-拷贝文件到多台服务器...

    做系统管理员 经常需要从本机向多台服务器拷贝文件 或者从多台服务器向本机拷贝文件 如果使用windows界面 要一次次的点击鼠标进行操作 太麻烦了 在linux下可以使用scp命令 用一个脚本就可以解决 当然每次都要输入口令 也可以命令行带
  • [Python]网络爬虫 urllib爬虫案例

    urllib爬虫案例 爬取公众号文章中的图片 第1步 确定公众号文章的地址 以微信公众号 Python小屋 里的一篇文章为例 文章标题为 报告PPT 163页 基于Python语言的课程群建设探讨与实践 地址为 https mp weixi
  • Hadoop Mapreduce编程之Reduce端join实现

    1 数据准备 movies dat 数据格式 movieid moviename movietype ratings dat 数据格式 userid movieid rating timestamp 2 Mapper端开发 1 定义必要的变
  • virtualbox 清理磁盘占用空间

    目录 1 虚拟系统整理 2 压缩磁盘 1 虚拟系统整理 Windows虚拟机 下载sdelete工具 执行下面的命令 sdelete z c Linux虚拟机执行下面的命令 sudo dd if dev zero of EMPTY bs 1
  • 软件设计师考试内容复习(二)

    一 层次化存储结构 二 Cache Cache的功能 提高CPU数据输入输出的速率 突破CPU与存储系统间数据传输带宽限制 在计算机存储系统体系中 Cache是访问速度最快的层次 使用Cache改善系统性能的依据是程序的局部性原理 如果以
  • docker 镜像容器导入导出、查看日志、拷贝文件命令

    1 本地文件拷贝到docker 容器中 参考 docker cp root pcl pcl 1 8 1 tar gz 7ff95b333e12 docker cp root lib64 a 7ff95b333e12 2 docker从容器里
  • 蓝桥杯决赛真题——国王的遗产

    标题 国王的遗产 X国是个小国 国王K有6个儿子 在临终前 K国王立下遗嘱 国王的一批牛作为遗产要分给他的6个儿子 其中 大儿子分1 4 二儿子1 5 三儿子1 6 直到小儿子分1 9 牛是活的 不能把一头牛切开分 最后还剩下11头牛 分给
  • 5种开源虚拟化技术推荐

    zz http www oschina net news 14907 5 opensource virtualization soft 论坛 http bbs chinaunix net forum 283 1 html 虚拟化现在已经成为
  • 力扣977-有序数组的平方

    有序数组的平方链接 给你一个按 非递减顺序 排序的整数数组 nums 返回 每个数字的平方 组成的新数组 要求也按 非递减顺序 排序 示例 1 输入 nums 4 1 0 3 10 输出 0 1 9 16 100 解释 平方后 数组变为 1
  • python开发工程师考试_Python开发工程师丨网易游戏

    本期导读 计科校友 榜样说 vol 15 方向很重要 实践出真知 蔡钰莹 Python开发工程师丨网易游戏 软件工程师 广州合明软件科技有限公司 前端开发工程师 广东中科慈航信息科技有限公司 网易游戏 公司简历 网易 NASDAQ NTES
  • SpringSecurity跨域问题,配置了相关配置还是报错

    跨域问题基础配置 跨域的本质是响应头问题 只要加上下述的响应头即可解决跨域 下述1 配置跨域中的代码是通过aop来实现该功能的一种方式 1 配置跨域 正常的跨域配置 Component public class CORSIntercepto
  • 【uni-app项目如何引入 uView组件库】

    uniapp项目引入uView组件库 一 uView官方文档 二 公司项目中引入并使用uView 一 uView官方文档 uView官方文档 二 公司项目中引入并使用uView 第一步 在公司创建完成uniapp项目后引入uView 第二步
  • ESP8266-NodeMCU——使用U8g2库点亮OLED

    前言 U8g2是嵌入式设备的单色图形库 U8g2库提供了大量绘制函数 简单引用即可实现想要的效果 并且适用大部分屏幕驱动 一 软件准备 1 Arduino IDE 2 u8g2库文件 点击跳转 如果在IDE里不能下载就从这下载 解压后放去库
  • C++中同类的不同对象可以相互访问成员(包括私有成员)

    如拷贝 复制 构造函数中 include using namespace std class Data public Data int a x a Data const Data r 调用别对象的函数 x r x void s cout l
  • 【c++】理解模板类型推导

    理解模板类型推导 函数模板 第一种情况 ParamType 是个非通用的引用或者是一个指针 第二种情况 ParamType 是个通用的引用 Universal Reference 第三种情况 ParamType 既不是指针也不是引用 数组参
  • 浅谈Hybrid技术的设计与实现第第2章

    前言 接上文 浅谈Hybrid技术的设计与实现 阅读本文前 建议阅读这个先 上文说了很多关于Hybrid的概要设计 可以算得上大而全 有说明有demo有代码 对于想接触Hybrid的朋友来说应该有一定帮助 但是对于进阶的朋友可能就不太满足了
  • Linux 终端颜色,界面着色

    环境 Ubuntu Liniux终端着色分2块 1 提示符及命令行和输出颜色 2 显示目录和文件 ls命令 颜色 一 提示符及命令行颜色设置 设置PS1命令 可立即生效 e后面为颜色设置部分 32 40m 32为前景色 40为背景色 m 不
  • pandas用均值填充nan_pandas dataframe 填充 NaN(填补缺失值)的方法 fillna 函数使用说明...

    在基于 pandas 的 DataFrame 对象进行数据处理时 如样本特征的缺省值处理 可以使用 DataFrame 对象的 fillna 函数进行填充 同样可以针对指定的列进行填补空值 单列的操作是调用 Series 对象的 filln