随机森林补充缺失值

2023-11-14

#导入必要的库
import numpy as np
import pandas as pd
from sklearn.ensemble import RandomForestRegressor
#读取数据
data = data_all1
#找出所有缺失值所在的行和列
nan_rows,nan_cols = np.where(pd.isnull(data))
#建立随机森林模型，以非缺失值为训练集,缺失值为预测集
rf = RandomForestRegressor()

#rf.fit(data.iloc[:, ~np.isnan(data).any(axis=0)],data.iloc[:,nan_cols])
rf.fit(data.iloc[:, ~np.isnan(data).any(axis=0)],data.iloc[:,nan_cols])
#预测缺失值
predicted = rf.predict(data.iloc[:,~np.isnan(data).any(axis=0)])
#填补缺失值
data.iloc[nan_rows,nan_cols] = predicted
#输出数据
print(data)

注意：需要有完全非缺失的数据集合训练

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

写论文使用

python

随机森林

机器学习

随机森林补充缺失值的相关文章

使用 Python 编辑 RTF 文件

也许这是一个愚蠢的问题但我不明白所以道歉我有一个 RTF 文档我想更改它例如有一个表我想复制一行并以面向对象的方式更改代码中第二行中的文本我认为 pyparsing 应该是可行的方法但我摆弄了几个小时但没有明白我没有提供
Python 和 Numpy 是 nan 和 set

我在使用 Python 的 Numpy set 和 NaN 非数字时遇到了不可预测的行为 gt gt gt set np float64 nan np float64 nan set nan nan gt gt gt set np flo
Tkinter：消息小部件中锚点选项的正确值是多少？

我一直在学习 tkinterTkinter 中的消息小部件 https python course eu tkinter message widget in tkinter php at Python 课程和教程 https python
通过 boto3 承担 IAM 用户角色时访问被拒绝

Issue 我有一个 IAM 用户和一个 IAM 角色我正在尝试将 IAM 用户配置为有权使用 STS 承担 IAM 角色我不确定为什么收到访问被拒绝错误 Details IAM 角色 arn aws iam 123456789 r
将 yerr/xerr 绘制为阴影区域而不是误差线

在 matplotlib 中如何将误差绘制为阴影区域而不是误差条例如而不是忽略示例图中各点之间的平滑插值这需要进行一些手动插值或者只是获得更高分辨率的数据您可以使用pyplot fill between https matpl
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
指示电子邮件的类型

我有以下自动化程序它将电子邮件发送给我自己并添加了特定的链接 import win32com client as win32 import easygui import tkinter as to from tkinter import
将 C++ 指针作为参数传递给 Cython 函数

cdef extern from Foo h cdef cppclass Bar pass cdef class PyClass cdef Bar bar def cinit self Bar b bar b 这总是会给我类似的东西 Can
从 pyspark.sql 中的列表创建数据框

我完全陷入了有线的境地现在我有一个清单li li example data map lambda x get labeled prediction w x collect print li type li 输出就像 0 0 59 0 0
将 pandas 剪切操作转换为常规字符串

我明白了 pandas cut 操作的输出 0 0 20 1 0 20 2 0 20 3 0 20 4 0 20 5 0 20 6 0 20 7 0 20 8 0 20 9 0 20 如何将 0 20 转换为 0 20 我正在这样做 str
如何使用 Homebrew 在 Mac 上安装 Python 2 和 3？

我需要能够在 Python 2 和 3 之间来回切换我如何使用 Homebrew 来做到这一点因为我不想弄乱路径并陷入麻烦现在我已经通过 Homebrew 安装了 2 7 我会用pyenv https github com yyuu
如何使用 opencv python 计算乐高积木上的孔数？

我正在开发我的 python 项目我需要计算每个乐高积木组件中有多少个孔我将从输入 json 文件中获取有关需要计算哪个程序集的信息如下所示 img 001 red 0 blue 2 white 1 grey 1 yellow 1 r
Python MySQL 操作错误：1045，“用户 root@'localhost' 的访问被拒绝

我试图通过以下方式从我的 python 程序访问数据库 db mysql connect host localhost user Max passwd maxkim db TESTDB cursor db cursor 但是我在第一行代码
为什么这个 if 语句会导致语法错误

我正在尝试设置一个 elif 语句如果用户按下 Enter 键代码将继续但是我不断遇到语法错误 GTIN 0 while True try GTIN int input input your gtin 8 number if len
App Engine 实体到字典

将 google app engine 实体在 python 中复制到字典对象的好方法是什么我正在使用 db Expando 对象所有属性均为扩展属性 Thanks 有一个名为foo尝试 foo dict
将字符串中的随机字符转换为大写

我尝试随机附加文本字符串这样就不只是有像这样的输出 gt gt gt david 我最终会得到类似的东西 gt gt gt DaViD gt gt gt dAviD 我现在的代码是这样的 import random import stri
使用 suds SOAP 库进行 HTTP 身份验证的奇怪行为

我有一个正在运行的 python 程序它使用 suds 通过 SOAP 获取大量数据 Web服务是通过分页功能实现的这样我就可以抓取nnn每个 fetch 调用的行并获取下一个nnn与后续的电话如果我使用如下代码向 HTTP 服务器进
Discord.py 嵌入中禁用按钮/冻结按钮

I m trying to make a replica of this bot in which when I press any of the buttons below it shows a dropdown menu and you
根据多个阈值将 SciPy 分层树状图切割成簇

我想将 SciPy 的树状图切割成多个具有多个阈值的簇我尝试过使用 fcluster 但它只能削减一个阈值例如这是我从另一个问题中摘取的一段代码 import pandas data pandas DataFrame total ru
仅允许正小数

在我的 Django 模型中我创建了一个如下所示的小数字段 price models DecimalField u Price decimal places 2 max digits 12 显然价格为负或零是没有意义的有没有办法将小数

随机推荐

三、ElasticSerach-映射操作

上一章学习了Es的文档操作 ElasticSerach 文档操作本章我们来学习索引中映射的操作 1 创建映射可以在创建索引的时候就创建可以参考一 ElsaticSerach 索引操作创建索引的时候没有添加映射可以后面添加创建索引
牛客网-网易2018笔试第7题 -合唱（DP问题）

题目描述小Q和牛博士合唱一首歌曲这首歌曲由n个音调组成每个音调由一个正整数表示对于每个音调要么由小Q演唱要么由牛博士演唱对于一系列音调演唱的难度等于所有相邻音调变化幅度之和例如一个音调序列是8 8 13 12 那么它的难度等于
gganimate:构建R语言可视化gif动图

gganimate简介 gganimate是一款基于ggplot2的动态可视化扩展包简单就是将ggplot2绘图对象转为gif动图的形式这对于一些统计分析原理和可视化展示尤为重要可以让抽象的数理理论更加形象化也便于理解和方便课堂教学
什么是SSC(时钟扩频)，为什么要时钟扩频

SSC全称Spread Spectrum Clocking 即扩频时钟由于信号的辐射主要是由于信号的能量过于集中在其载波频率位置导致信号的能量在某一频点位置处的产生过大的辐射发射因此为了进一步有效的降低EMI辐射芯片厂家在设计芯片时
Vijava 学习笔记之VirtualMachine(基础配置信息{VirtualMachineConfigSummary})

Vijava 代码 package com vmware client import com vmware util Session import com vmware vim25 VirtualMachineConfigSummary i
Docker搭建kafka集群

Docker搭建kafka集群集群规划镜像版本 kafka为什么需要依赖zookeeper 创建docker网络搭建zk集群新建文件docker compose zk yml 启动搭建kafka集群新建三个挂载文件挂载原因挂
TIA博途S7-1200学习笔记——数据类型

目录一概述二基本数据类型 1 二进制数 1 1 BOOL 位 1 2 BYTE 1 3 WORD 1 4 DWORD 1 5 LWORD 2 整数 2 1 SINT 2 2 USINT 2 3 INT 2 4 UINT 2 5 DI
注解@TableName、@TableField

目录 TableName value 当数据库名与实体类名不一致或不符合驼峰命名时需要在此注解指定表名不加这个注解默认将实体类的小写形式在db中寻找 TableField 字段注解该注解用于标识非主键的字段将数据库列与 JavaBe
幂函数与指数函数的区别

a表示底数 n表示指数 a n叫做幂幂就是一个数和它自己相乘的积二个乘是二次幂三个乘是三次幂四个乘是四次幂象三五这样的幂是奇次幂二四是偶次幂负数乘负数是正数负数乘正数是负幂函数与指数函数的区别指数函数自变量 x 在指
关于欧拉角的问题

一简单介绍自己主要做一个知识记录想着学了还是要写点东西的首先我们可以把欧拉角看成是描述方位的一种方法我们可以用欧拉角来表示旋转也可以用四元数以及用矩阵来表示旋转欧拉角是一种常用的描述方位的方法在这里简单的介绍下方向和方位的
阿里巴巴“三板斧”管理到底是什么？

阿里巴巴从最初的以马老师为首的18罗汉创始员工发展至今拥有4万员工从杭州的湖畔花园起家到去美国纽约证券交易所上市敲钟阿里巴巴如何走到现在它背后的管理机制是怎样的我们到底向它学什么阿里巴巴管理总纲阿里巴巴九板斧中层能力三板斧
哈希表与树的介绍

前言该篇文章主要带我们认识什么哈希表和树为我们在研究各个数据结构的实现及扩展算法有个基本的认识哈希表特点数组寻址容易数据连续存储空间链表插入与删除容易放在堆内存中对象存储并不连续哈希表寻址容易插入删除也容易的
多模态机器翻译

摘录自机器翻译基础与模型东北大学文章目录 1 背景 2 机器翻译需要更多的上下文 3 图像翻译 4 基于图像增强的文本翻译 4 1 基于特征融合的方法 4 2 基于联合模型的方法 5 参考文献 1 背景基于上下文的翻译是机器翻译的
js实例学习笔记
Elasticsearch ILM (index lifecycle management): logstash vs fluentd

ILM Elasticsearch在升级到7 x之后推出了一项新功能ILM 用于管理被大家诟病已久的index lifecycle management问题只需要在kibana内简单配置就可以管理以前我们不得不设置cronjob去删除
C#比较运算符及解析

文章目录博主写作不容易孩子需要您鼓励万水千山总是情先点个赞行不行比较运算符得出的结果是逻辑型 bool 即 True 或 False 比较运算符又称关系运算符我们可以把它理解为一种判断判断的结果是真或者是假关系表达式的返回值
Android 权限大全-转载

Android 权限大全转自博客园博客园链接 Key android permission ACCESS CHECKIN PROPERTIES Title 访问检入属性 Memo 允许对检入服务上传的属性进行读写访问普通应用程序不能
初入HTML

1 HTML语言用来做什么 html语言专门用来描述网页它属于一种标记语言它是由一组标签构成 2 HTML元素一个HTML元素是包含了开始标签和结束标签当然还有一些是单标签例如 p 段落标签 p 双标签 br 换行标签单标签
openlayers地图坐标coordinate转换为屏幕像素坐标pixel

openlayers地图坐标coordinate转换为屏幕像素坐标pixel 网上查资料试了很多人的方法需要各种转换但没成功后来发现openlayers的map对象自带该方法记录下来希望帮助到大家方法说明获取坐标的像素坐标这将
随机森林补充缺失值

导入必要的库 import numpy as np import pandas as pd from sklearn ensemble import RandomForestRegressor 读取数据 data data all1 找出所

随机森林补充缺失值

随机森林补充缺失值 的相关文章

随机推荐

热门标签

随机森林补充缺失值的相关文章