StandardScaler -ValueError：输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值

2024-02-09

我有以下代码

X = df_X.as_matrix(header[1:col_num])
scaler = preprocessing.StandardScaler().fit(X)
X_nor = scaler.transform(X)

并得到以下错误：

  File "/Users/edamame/Library/python_virenv/lib/python2.7/site-packages/sklearn/utils/validation.py", line 54, in _assert_all_finite
    " or a value too large for %r." % X.dtype)
ValueError: Input contains NaN, infinity or a value too large for dtype('float64').

I used:

print(np.isinf(X))
print(np.isnan(X))

这给了我下面的输出。这无法真正告诉我哪个元素有问题，因为我有数百万行。

[[False False False ..., False False False]
 [False False False ..., False False False]
 [False False False ..., False False False]
 ..., 
 [False False False ..., False False False]
 [False False False ..., False False False]
 [False False False ..., False False False]]

有没有办法确定矩阵 X 中的哪个值实际上导致了问题？人们一般如何避免它？

numpy https://docs.scipy.org/doc/numpy-1.10.1/reference/routines.logic.html包含针对此类事物的各种逻辑元素测试。

在您的特定情况下，您将需要使用isinf https://docs.scipy.org/doc/numpy-1.10.1/reference/generated/numpy.isinf.html and isnan https://docs.scipy.org/doc/numpy-1.10.1/reference/generated/numpy.isnan.html#numpy.isnan.

回应您的编辑：

您可以将 np.isinf() 或 np.isnan() 的结果传递给 np.where()，这将返回条件为 true 的索引。这是一个简单的例子：

import numpy as np

test = np.array([0.1, 0.3, float("Inf"), 0.2])

bad_indices = np.where(np.isinf(test))

print(bad_indices)

然后，您可以使用这些索引来替换数组的内容：

test[bad_indices] = -1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NaN

StandardScaler -ValueError：输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值的相关文章

Docker 进程被神秘的“Killed”消息杀死

在 docker 容器中运行 python 脚本一切似乎都运行顺利看到一些 STDOUT 消息大约 5 分钟后我得到了Killed消息没有进一步的解释并且该过程停止查询数据库可能是磁盘空间问题也可能是 OOM 问题我不确定
刷新访问令牌时出现“invalid_grant”错误的情况？

最近我一直在为这个问题揪心一些背景使用oauth2客户端 https code google com p google api python client 库来管理用户的令牌这些令牌用于定期并发执行各种后台任务每次要为用户运行其中一
Python中#和"""注释的区别

开始用 Python 编程我看到一些带有注释的脚本 and comments 这两种评论方式有什么区别最好的事情就是阅读PEP 8 Python 代码风格指南 https www python org dev peps pep 0008
同情因子简单关系

我在 sympy 中有一个简单的因式分解问题无法解决我在 sympy 处理相当复杂的积分方面取得了巨大成功但我对一些简单的事情感到困惑如何得到 phi 2 2 phi phi 0 phi 0 2 8 因式分解 phi phi 0 2
垂直线 axvline 在 matplotlib 的 loglog 图中绘制位于错误位置的线

我在使用 axvline 在 matplotlib 的 loglog 图中绘制垂直线时遇到问题第一个问题是垂直线没有出现在正确的位置第二个问题可能相关的是当我放大或平移绘图时垂直线只是保持在原位并且没有通过平移滑动绘图或放大
在一张图中同时绘制两个截面强度

我有一个形状数组 512 512 看起来像行 x 列 y 密度 z 数组的数量 0 012825 0 020408 0 022976 0 015938 0 02165 0 024357 0 036332 0 031904 0 025462
Python 中的二进制相移键控

我目前正在编写一些代码以使用音频转换通过激光传输消息文件和其他数据我当前的代码使用 python 中 binascii 模块中的 hexlify 函数将数据转换为二进制然后为 1 发出一个音调为 0 发出不同的音调这在理论上是
在 C# 中实例化 python 类

我已经用 python 编写了一个类我想通过 IronPython 将其包装到 net 程序集中并在 C 应用程序中实例化我已将该类迁移到 IronPython 创建了一个库程序集并引用了它现在我如何真正获得该类的实例该类看起来
Python：如何重构循环导入

我有件事可以帮你做engine setState
打印一个 Jupyter 单元中定义的所有变量

有没有一种更简单的方法来以漂亮的方式显示单个单元格中定义的所有变量的名称和值我现在做的方式是这样的但是当有30个或更多变量时我浪费了很多时间您可以使用whos http ipython readthedocs io en stable
获取 zeep.exceptions.ValidationError：缺少与 suds 一起使用的方法的元素

我正在移植开发的代码suds 0 6到zeep 2 4 0 以前的泡沫代码 client Client WSDLfile proxy proxy faults True config client factory create perUse
如何在Python中正确声明ctype结构+联合？

我正在制作一个二进制数据解析器虽然我可以依靠 C 但我想看看是否可以使用 Python 来完成该任务我对如何实现这一点有一些了解我当前的实现如下所示 from ctypes import class sHeader Structure
将 ASCII 字符转换为“”unicode 表示法的脚本

我正在对 Linux 区域设置文件进行一些更改 usr share i18n locales like pt BR 并且需要格式化字符串例如 d m Y H M 必须以 Unicode 指定其中每个在本例中为 ASCII 字符表示为
如何在 Spyder IDE 中安装 Selenium 包

我刚刚在工作中安装了 Spyder IDE 仅 Spyder 不是整个 Anaconda 并且希望使用 FireFox 自动化我的工作我的问题是如何安装 Selenium 软件包 I figured it out Here is ins
Pandas - 分割大的Excel文件

我有一个大约有 500 000 行的 Excel 文件我想将其拆分为多个 Excel 文件每个文件有 50 000 行我想用熊猫来做这样它会是最快和最简单的有什么想法如何制作吗感谢您的帮助假设您的 Excel 文件只有一个第
python 的 fcntl.flock 函数是否提供文件访问的线程级锁定？

Python 的 fcnt 模块提供了一种名为 flock 1 的方法来证明文件锁定其描述如下对文件执行锁定操作op 描述符 fd 文件对象提供 fileno 方法被接受为出色地请参阅 Unix 手册集群 2 了解详情在某些系统上
升级后 pip 损坏

我做了 pip install U easyinstall 然后 pip install U pip 来升级我的 pip 但是当我尝试使用 pip 时我现在收到此错误 root d8fb98fc3a66 which pip usr lo
如何获取所有Python标准库模块的列表？

我想要类似的东西sys builtin module names标准库除外其他不起作用的事情 sys modules 只显示已经加载的模块 sys prefix 包含非标准库模块并且似乎无法在 virtualenv 内工作的路径我想要这
在 pip 中为 Flask 应用程序构建 docker 映像失败

from alpine latest RUN apk add no cache python3 dev pip3 install upgrade pip WORKDIR backend COPY backend RUN pip no cac
使用Python的timeit获取“全局名称'foo'未定义”

我想知道执行一条Python语句需要多少时间所以我上网查了一下发现标准库提供了一个名为timeit http docs python org library timeit html旨在做到这一点 import timeit def fo

随机推荐

将现有的 Maven 项目导入 Eclipse

我有一个现有的 Maven 项目我使用 Eclipse Helios 作为我的 IDE 我需要将现有的 Maven 项目导入到我的 IDE 中请告诉我导入现有 Maven 应用程序的正确方法是什么我们应该选择 Import Exist
为什么 (new Date() == new Date()) 为 false，而 (Date() == Date()) 为 true？ [复制]

这个问题在这里已经有答案了我一直在用 JSFiddle 来解决this https www freecodecamp com challenges friendly date rangesFreeCodeCamp 中的问题当我使用日期作
在数组中查找子数组

我有数组 array 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 我想找到子数组的索引 1 2 3 4 所以它应该返回值 0但每次我尝试这样做时它都会返回 1 这是我尝试过的 array indexOf
使用单个 HELM 模板的多个资源

默认情况下我们一直对每个应用程序公共使用单个入口但根据最近的要求我们还需要为某些应用程序公开私有端点这意味着我们有一个如下所示的模板模板 ingress yaml if Values ingress enabled ful
当替换构造函数执行时， std::Optional 不应该包含它的值吗？

在实际代码中构造函数可能非常复杂因此emplace of a std optional可以查询选项本身的状态当发生这种情况时通常会有点复杂但这里有一个人为的最小示例 include
更改 UIAlertView 中取消按钮的位置？

我注意到当我从 iPhone 主屏幕删除应用程序时出现的警报视图左侧显示删除按钮右侧显示取消按钮但是当我使用 UIAlertView 在应用程序中构建删除功能时按钮似乎仅显示左侧的取消和右侧的删除我希望我的应用程
Android：获取Facebook好友列表

我正在使用脸书软件开发工具包 https github com facebook facebook android sdk 在墙上张贴消息现在我需要获取 Facebook 好友列表有人能帮我解决这个问题吗编辑 try Facebook
Android 设置视图位置 - setY 与 setTop

我打算以编程方式移动按钮的位置按钮处于相对布局我研究发现我们可以使用 setY or setTop 看起来它们的工作原理应该是一样的但就我而言 setTop 根本不改变位置并且 setY 仅有效我不确定我误解了什么但这对我来说很奇
如何摆脱 VS Code 中的“同步更改 1 ↑”按钮？

最近由于某种原因每次我想要将更改推送到 GitHub 存储库时我都必须按此按钮我不记得是否有一个设置是我不小心切换的我也从未在 VS Code 环境之外更改我的存储库我正在使用 Gatsby GitHub Netlify 设置
软键盘覆盖 PopupWindow 中的 EditText

我整理了一个简单的测试项目它显示一个包含 EditText 的 PopupWindow 在 Android 2 2 上当我点击 EditText 时会显示软键盘正如我所期望的那样但是软键盘覆盖了 EditText 并且我无法平移
APC缓存碎片问题

我在 CentOS 服务器 5 上运行 APC php 缓存每天 13 000 次访问运行 php 5 3 3 APC 3 1 4 和 4Gb RAM 在过去的几周里我经历了很多 unable to allocate memory f
响应图表不受控制地增长

我有一个 vue 组件它实现了 vue chartjs 的 Horizo ntalBar 组件我将其渲染为 bootstrap vue 表中的单元格我的愿望是让图表保持固定的高度但随着窗口的增大缩小而水平缩放当页面首次加载时图
使用堆栈反转数组

我正在尝试使用堆栈反转数组但是我收到错误arr i stack top 在 Eclipse 中解决它的建议是将其更改为arr i stack pop 或添加演员阵容还有其他方法吗或者我犯了一个错误我看到教程和问题询问如何使用堆栈反
如何在 R 中使用 H2o 从 SQL Server 加载表？

我尝试使用 h2o 将表加载到 R 中但出现以下错误 my data lt h2o import sql table my sql conn table username password 错误意外的 HTTP 状态代码 500 服务器
Javascript - innerHTML 不适用于 HTML 选择菜单

在我的 HTML 页面中我有 2 个选择菜单其 ID 为月和日页面加载时日为空月有 12 个选项其值 1 12 对应于一月至十二月 month 有一个 onchange 事件调用此函数 function showOut
属性 KeyValuePair.Value 没有 setter

我正在使用一个Dictionary
Java 中的时区

我允许我的网络应用程序上的用户根据他们选择的时区安排活动我想向最终用户提供一份良好的时区列表然后将其轻松转换为java util TimeZone服务器端的对象 String TimeZone getAvailableIds 是我可以使
从 vs 2017 以编程方式连接到 TFS

我在用TFS 15 x package Error Microsoft TeamFoundation TeamFoundationServerUnauthorizedException TF30063 您无权访问 https myproje
使用钩子时，React 批量状态更新功能是否有效？

对于类组件 this setState如果在事件处理程序内部则调用批处理但是如果状态在事件处理程序之外更新并使用会发生什么useState hook function Component const a setA useState a
StandardScaler -ValueError：输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值

我有以下代码 X df X as matrix header 1 col num scaler preprocessing StandardScaler fit X X nor scaler transform X 并得到以下错误 File

StandardScaler -ValueError：输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值

StandardScaler -ValueError：输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值 的相关文章

随机推荐

热门标签

StandardScaler -ValueError：输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值的相关文章