使用 scikit-learn 的 Imputer 模块预测缺失值

2024-01-30

我正在编写一个非常基本的程序来预测数据集中的缺失值scikit-learn 的输入器 class.

我制作了一个 NumPy 数组，创建了一个带有策略 ='mean' 的 Imputer 对象，并对 NumPy 数组执行了 fit_transform() 。

当我在执行 fit_transform() 后打印数组时，“Nan”仍然存在，并且我没有得到任何预测。

我在这里做错了什么？我如何预测缺失值？

import numpy as np
from sklearn.preprocessing import Imputer

X = np.array([[23.56],[53.45],['NaN'],[44.44],[77.78],['NaN'],[234.44],[11.33],[79.87]])

print X

imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
imp.fit_transform(X)

print X

Per 文档 http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.Imputer.html#sklearn.preprocessing.Imputer.fit_transform, sklearn.preprocessing.Imputer.fit_transform回报一个新数组，它不会改变参数数组。因此，最小的修复是：

X = imp.fit_transform(X)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

scikitlearn

Prediction

imputation

使用 scikit-learn 的 Imputer 模块预测缺失值的相关文章

在 Python 中比较浮点数是否几乎相等的最佳方法是什么？

众所周知由于舍入和精度问题比较浮点数是否相等有点繁琐例如比较浮点数 2012 年版 https randomascii wordpress com 2012 02 25 comparing floating point number
让 Django 提供可下载文件

我希望网站上的用户能够下载路径被遮挡的文件因此无法直接下载它们例如我希望 URL 是这样的 http example com download f somefile txt 在服务器上我知道所有可下载的文件都位于该文件夹中 home
使用 scipy、python、numpy 进行非线性 e^(-x) 回归

下面的代码为我提供了一条最佳拟合线的平坦线而不是沿着 e x 模型的一条适合数据的漂亮曲线谁能告诉我如何修复下面的代码以使其适合我的数据 import numpy as np import matplotlib pyplot as pl
在Python中整齐地绘制PMF

有没有一个库可以帮助我在 python 中整齐地绘制样本的概率质量函数如下所示通过matplotlib pyplot的stem模块 matplotlib pyplot stem args kwargs from matplotlib p
统计Sweep算子的Python实现

我正在学习一些用书中缺失的数据进行统计的技术缺失数据的统计分析作者利特尔和鲁宾对于处理单调无响应数据来说一个特别有用的函数是扫频操作员详情见第 148 151 页我知道 R 模块gmm有swp函数可以做到这一点但我想知道是否有
pandas groupby 并转换为 json 列表

我有一个如下所示的 pandas 数据框 idx f1 f2 f3 1 a a b 2 b a c 3 a b c 87 e e e 我需要将其他列转换为基于索引列的字典列表所以最终结果应该是 idx features 1 f1 a f
在 Python 中通过网络发送对象的最佳方式是什么？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我需要通过网络发送对象我将使用 Twisted 并且我刚刚开始查看它的文档据我所知 python实现套接字的唯一方式是通过文本那么我如何使
Python 中的 Firebase 身份验证时出现 KeyError：“databaseURL”

相信你做得很好我是 firebase 的新手正在尝试进行用户身份验证我已经安装了pyrebase4并在firebase控制台上创建了一个项目我还启用了使用电子邮件和密码登录并尝试连接我的应用程序下面是我正在尝试的代码 impo
Python：Factory Boy 生成对象创建时指定长度的列表

我正在尝试使用 Factoryboy 在创建时指定长度的对象中创建一个列表我可以创建列表但由于提供的长度大小的惰性性质每次尝试创建具有指定长度的列表都会导致问题这是我到目前为止所拥有的 class FooFactory facto
启动客户端时，代码要求提供电话/机器人令牌

使用 Telethon 库运行我的第一个代码时它要求提供机器人令牌这是实际的代码 from telethon import TelegramClient events sync api id 1234567 api hash xxxxx
Tensorflow `tf.layers.batch_normalization` 不会向 `tf.GraphKeys.UPDATE_OPS` 添加更新操作

以下代码复制粘贴可运行说明了如何使用tf layers batch normalization import tensorflow as tf bn tf layers batch normalization tf constant
如何在 Windows 7 中使用 Python 廉价地创建非常大的文件？ [复制]

这个问题在这里已经有答案了可能的重复在Windows系统上快速创建大文件 https stackoverflow com questions 982659 quickly create large file on a windows s
检查图像中是否有太薄的区域

我正在尝试验证雕刻机的黑白图像更多的是剪贴画图像不是照片我需要考虑的主要事情之一是区域的大小或线条的宽度因为机器无法处理太细的线条所以我需要找到比给定阈值更细的区域以此图为例竖琴的琴弦可能太细而无法雕刻我正在阅读有关 Ma
使用 Python 获取 Youtube 数据

我正在尝试学习如何分析网络上可用的社交媒体数据我从 Youtube 开始 from apiclient errors import HttpError from outh2client tools import argparser fro
如何通过异常值检测方法在周期性或基于序列的数据上生成脉冲作为异常值以进行实验？

我想对一些时间序列数据进行一些实验KM https scikit learn org stable auto examples cluster plot cluster iris html sphx glr auto examples cl
如何从 PyObject 获取指向字符串的 char*

我怎样才能得到一个char from a PyObject它指向一个字符串例如这是 python 脚本 Test Connect 272 22 20 65 1234 这是 C 代码 static PyObject Connect PyO
如何将动态数据传递给装饰器

我正在尝试编写一个基本的 CRUD 控制器类来执行以下操作下列的 class BaseCrudController model field validation template dir expose self template dir
Paramiko ValueError“p 的长度必须恰好为 1024、2048 或 3072 位”

我正在尝试使用 Python 脚本连接 SFTP 由于 p 错误我无法连接 import paramiko client paramiko SSHClient client load system host keys client con
`numpy.diff` 和 `scipy.fftpack.diff` 在微分时给出不同的结果

我正在尝试计算一些数据的导数并且正在尝试比较有限差分的输出和谱方法的输出但结果却截然不同我无法弄清楚到底为什么考虑下面的示例代码 import numpy as np from scipy import fftpack as sp
收到 Python 错误“来自：无法读取 /var/mail/Bio”

我正在运行一个 bio python 脚本这会导致以下错误 from can t read var mail Bio 由于我的脚本与邮件没有任何关系我不明白为什么我的脚本在 var mail 中查找这里似乎有什么问题我怀疑这会有帮助

随机推荐

Android 打开 pdf 不起作用

一段时间以来我一直在努力让它发挥作用我在这里看到了有关如何从 Android 打开 pdf 的其他问题普遍的共识是我下面的代码我错过了什么吗 try Uri path Uri parse android resource com Te
是否可以增加 CloudFlare 超时？

是否可以增加 CloudFlare 超时如果是怎么办我的代码需要一段时间才能执行而且我不打算在未来几天对其进行 Ajax 化不 CloudFlare 仅提供这种服务企业计划定制 https www cloudflare com e
在Perl中，如何根据绝对位置的条件来计算成功匹配的出现次数

仅使用onePerl替换或匹配正则表达式语句如何修改以下代码我需要修改的值 pattern在下面的代码中代码将计算在字符串中找到成功匹配的次数前提是成功匹配的绝对位置满足特定条件 pattern F1 string F1234F12
.(点) 访问静态方法

下面是一个流行的代码 class A public static const string TYPE AEvent const string getType return TYPE 上面的代码可以这样使用 if aInstance getT
使用 POST 方法将参数发送到 url，而不使用表单

我想使用 POST 方法将参数发布到 URL 但无法使用表单即使我确实使用了表单它也必须在没有用户交互的情况下自动发布这可能吗我怎样才能做到这一点 Using jQuery post http docs jquery com Aja
不再支持 UITextField -webView

使用某些文本字段时我得到以下调试输出 UITextField webView 被调用新的文本架构不再支持此方法有人可以解释为什么会出现这种情况吗我目前正在 iOS 7 上运行 XCode 5 在 iOS 7 之前的以前的 iOS 版
VLC 流至 MP4 WEBM 和 Flash

我正在尝试将视频从 IP 摄像机流式传输到我的 WordPress 网站我希望我的流可以通过常见设备 Windows Mac Android 和 IOS 访问目前我正在使用 VLC 进行流式传输但我只能使用 flash 流但我想做
使用 LINQ 搜索关键字

如果我有一个包含标题的文本字段并且有一个关键字列表我如何搜索标题并检查标题中的 n 个关键字因此如果我的标题是烘焙鸡肉培根和韭菜派并且用户搜索鸡肉培根萝卜我想返回上述食谱本质上我想说的是如果标题包含 2 个或更多搜索词
Vuetify V-Data-Table 页脚添加按钮

我想在 v data table 页脚中添加一个与此图像类似的按钮问题是如果表包含数据我通常可以添加一个按钮但是如果没有数据则该按钮不会呈现这是代码
Grails 获取子域对象

我有两个域类一个是父域类另一个是子域类它们之间有一个 hasMany 关系父类有很多子类子类属于父类这是编码示例 class Parent String name static hasMany childs Child stat
以编程方式更新 MSI 属性

我需要一个解决方案希望它应该相当简单更新 MSI 属性我们有许多在 TFS 2012 中进行源代码控制的 WiX 项目并且我们生成其相关的 MSI 以便通过 TeamCity 构建配置进行部署这些配置通常会构建所需的 wixpro
Access SQL 中的逆透视

大家好我正在尝试在 MS Access 上的 SQL 中使用 unpivot 我在网上找到了以下代码 SELECT CustomerID Phone FROM SELECT CustomerID Phone1 Phone2 Phone3
Jenkins 使用变量 ${GIT_BRANCH} 作为 sonarqube 参数（不带“origin/”）进行构建

大型团队每个团队都有单独的 git 分支并使用声纳作为代码质量检查器 scm 工具设置为选取与该名称对应的每个分支 feature branch 对于 Maven 构建来说它工作得很好我想设置 sonarqube 这样它就会为每个实
Angularjs $http post 文件和表单数据

我在 python 中有以下请求 import requests json io cookie payload Name abc url test file out test json fi file file open file r re
如何在 Python 中将十六进制转换为十进制？ [复制]

这个问题在这里已经有答案了我有一些 Perl 代码其中 hex 函数将十六进制数据转换为十进制我怎样才能做到Python http en wikipedia org wiki Python 28programming language
“连续两项”错误

我正在尝试编写如下紧凑的行代码是从使用动态作用域特殊变量 IN 读取 STDIN 的脚本中提取的你能告诉我如何正确地写这一行吗这有效 for IN lines last when say VERBOSE is the string i
BASH 复制除一个之外的所有文件

我想将除名为 Default png 的文件之外的所有文件复制到目录之外似乎有很多方法可以做到这一点什么对你来说最有效应如下所示 cp r Default png dest 如果复制到嵌套在当前文件夹中的文件夹在下面的情况下称为示例
类型错误：r.getClientRects 不是函数

我正在尝试按照以下链接在 KendoUI 网格中创建自定义工具栏 http demos telerik com kendo ui grid toolbar template http demos telerik com kendo ui g
惰性评估 - 空间泄漏

用 Haskell 进行函数式思考 http www cambridge org us academic subjects computer science programming languages and applied logic t
使用 scikit-learn 的 Imputer 模块预测缺失值

我正在编写一个非常基本的程序来预测数据集中的缺失值scikit learn 的输入器 class 我制作了一个 NumPy 数组创建了一个带有策略 mean 的 Imputer 对象并对 NumPy 数组执行了 fit transfor

使用 scikit-learn 的 Imputer 模块预测缺失值

使用 scikit-learn 的 Imputer 模块预测缺失值 的相关文章

随机推荐

热门标签

使用 scikit-learn 的 Imputer 模块预测缺失值的相关文章