sklearn.impute.SimpleImputer 数据填充

2023-11-14

数据缺失值补全方法sklearn.impute.SimpleImputer

imp=SimpleImputer(missing_values=np.nan,strategy=’mean’)

创建该类的对象,missing_values,也就是缺失值是什么,一般情况下缺失值当然就是空值啦,也就是np.nan

strategy:也就是你采取什么样的策略去填充空值,总共有4种选择。分别是mean,median, most_frequent,以及constant,这是对于每一列来说的,如果是mean,则该列则由该列的均值填充。而median,则是中位数,most_frequent则是众数。需要注意的是,如果是constant,则可以将空值填充为自定义的值,这就要涉及到后面一个参数了,也就是fill_value。如果strategy=‘constant’,则填充fill_value的值。
imp.fit(df)
#df为read_csv和table读取的文件返回的变量,该方法提供中位数,均值等数据补全方法,采用什么方法补全取决于创建对象时参数strategy的参数值。如mean为均值填充
df = imp.transform(df)
#开始填充(按照每一列的内容,根据前面确定的填充方案填充该列缺少的数据)

例如:下面有的是自定义的数据填充

from sklearn.impute import SimpleImputer
import pandas as pd
import numpy as np

file = '班级作业提交情况1.csv'
df = pd.read_table(file, delimiter=',',header=None) 
imp = SimpleImputer(missing_values=np.nan, strategy='constant',fill_value='1') 
imp.fit(df)
df = imp.transform(df)
print(type(df))
print(df)

读取的文件(需要填充数据的文件)
结果为
在这里插入图片描述
通过索引查出谁没交作业

from sklearn.impute import SimpleImputer
import pandas as pd
import numpy as np

file = '班级作业提交情况1.csv'
df = pd.read_table(file, delimiter=',',header=None) 
imp = SimpleImputer(missing_values=np.nan, strategy='constant',fill_value='1') 
imp.fit(df)
df = imp.transform(df)
x = (df[:,3] == "0")
print("Second_work没交",df[x,0])
x = (df[:,4] == "0")
print("Fouth_work没交",df[x,0])

结果为
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

sklearn.impute.SimpleImputer 数据填充 的相关文章

随机推荐

  • JavaObject类初识

    Java所有的类都继承Object类 Object类中的方法 Object类中的方法一般都需要重写 Sting toString 默认的 toString 返回的是对象的堆内存地址 重写 toString一般用于输出对象的属性 class
  • csdn测试

    测试
  • EasyPR编译指南

    1 下载源码 https github com liuruoze EasyPR Download ZIP或者git https github com liuruoze EasyPR git 将代码解压到硬盘目录下 例如F 车牌识别 Easy
  • Kotlin的一点学习资源

    本来想写一点Kotlin的文章的 后来看了一下它的中文文档 质量很不错 我再写就纯属浪费时间了 所以这里干脆整理一点Kotlin的学习资源吧 文档类 Kotlin官方网站 Kotlin官方文档 Kotlin中文网站 Kotlin中文文档 K
  • 达芬奇系列教程2-简单剪辑及一些快捷键

    达芬奇系列教程2 简单剪辑及一些快捷键 前言 一 初步设置 二 剪辑 1 步骤 2 剪辑面板功能键 3 剪辑 4 快编面板 5 字幕 三 快捷键 总结 前言 以下内容为 B站 影视飓风 达芬奇系列教程 文字版笔记 一 初步设置 1 创建面板
  • 【无标题】50hz IIR 滤波的实现

    使用fdatool Fs 依据采样率 Apass 选择衰减率 如果选为30db 即为衰减1000倍 并不是衰减率越高越好 而是够用就好 选择完毕后 按Design Filter 即可生成需要的IIR 50hz陷波器 在界面中也可以查看幅频特
  • python学习随笔

    打开文件管理器窗口方式 方式一 import subprocess 执行指令 explorer是windows文件管理器的指令 目录 subprocess Popen r explorer C Users dell Desktop hmui
  • 任意文件上传

    文章目录 渗透测试漏洞原理 任意文件上传 1 任意文件上传概述 1 1 漏洞成因 1 2 漏洞原理 1 3 漏洞危害 1 4 漏洞的利用方法 1 5 漏洞的验证 2 WebShell解析 2 1 Shell 2 1 1 命令解释器 2 2
  • 面试大闯关:自我介绍放大招

    It s the most feared question during any job interview Can you tell me about yourself Before I share a list of 10 memora
  • 掌握Python的X篇_9_关系运算符与逻辑运算符

    文章目录 1 True与False关键字 2 关系运算符 3 逻辑运算符 1 True与False关键字 Python中有True和False关键字 对应了生活中的 真 假 2 关系运算符 python中有以下的关系运算符 用于比较两个操作
  • 计算机专业毕业设计题目大全——各种类型系统设计大全

    计算机专业毕业设计题目大全 一 ASP类计算机专业毕业设计题目 1 网络留言薄 2 客户管理系统 3 多媒体积件管理库的开发与应用 4 基于WEB的多媒体素材管理库的开发与应用 5 网络教学软件中的教学设计与应用 6 小型教育网站的开发与建
  • [na]完全理解icmp协议

    1 ICMP出现的原因 在IP通信中 经常有数据包到达不了对方的情况 原因是 在通信途中的某处的一个路由器由于不能处理所有的数据包 就将数据包一个一个丢弃了 或者 虽然到达了对方 但是由于搞错了端口号 服务器软件可能不能接受它 这时 在错误
  • AndroidStudio Connection Reset 问题

    解决方案
  • 1012.数字分类- PAT乙级真题

    给定一系列正整数 请按要求对数字进行分类 并输出以下 5 个数字 A 1 能被 5 整除的数字中所有偶数的和 A 2 将被 5 除后余 1 的数字按给出顺序进行交错求和 A3 被 5 除后余 2 的数字的个数 A 4 被 5 除后余 3 的
  • mpVue 微信小程序用户授权及wx.getUserProfile代替wx.getUserInfo获取用户信息及判断用户是否已经授权;不弹出微信授权窗口;只能使用头像、昵称填写能力

    一 前言 2021年4月15日整改 为 优化用户的使用体验 平台将进行以下调整 1 2021年2月23日起 若小程序已在微信开放平台进行绑定 则通过wx login接口获取的登录凭证可直接换取unionID 2 2021年4月13日后发布的
  • select框既可以手输入也可以选择

  • typescript封装axios

    import axios AxiosInstance AxiosResponse AxiosError from axios 定义返回数据类型 interface ResponseData code number message strin
  • vs code python_VSCode:无法识别术语“ python”……但是py可...

    我刚刚在VS Code上安装了python 但无法使用python命令运行任何python代码 python命令 似乎默认情况下使用python命令 但无法识别它 当我右键单击并选择 运行代码 时 它会抱怨 无法将 python 识别为内部
  • 树莓派 Raspberry 4B 刷机、上网、录音外设、文件传输、电脑投屏问题汇总

    硬件 重要 一定要用正版品牌方的的sd卡 比如闪迪 读写速率至少要class10 否则开启启动很慢 界面很卡 上网连接 开机连接wifi后 wifi名字和密码会被写入配置文件中 开机密码 默认开机密码 raspberry 可修改 也可去掉开
  • sklearn.impute.SimpleImputer 数据填充

    数据缺失值补全方法sklearn impute SimpleImputer imp SimpleImputer missing values np nan strategy mean 创建该类的对象 missing values 也就是缺失