如何解决报错ValueError: Input contains NaN, infinity or a value too large for dtype('float64')的问题

2023-05-16

这两天在做信用卡的数据分析项目,出现了除标题错误以外 +

ValueError: Found input variables with inconsistent numbers of samples: [56411, 27785]

这两个报错,因为标题字数有限,所以只写了一个。现在我们先解决第一个问题:
在这里插入图片描述
正如上面报错所写,错误原因就是:
输入的数据里面包含NaN值或者无穷大的数据
所以解决办法
找到NaN值补齐或者删除该列;减小样本数据
然后先用pandas的describe()和head()属性来查看一下数据集情况,前者是对整个数据有个概览,后者可以直接打印出前几行数据,这里我们选择前5看看,代码如下:

print(data1.describe())
#数据集概览
print(data1.head(5))
#前5行

然后输出的结果发现:
在这里插入图片描述
在这里插入图片描述
可以看出来bankCard这一列的数据是不完整的,存在NaN值,鉴于他对于预测模型的生成没有太大影响,所以直接删除了该列,问题解决!

data1.drop(['bankCard'], axis = 1)

==================================================================================================分割线

好了,现在解决第二个问题:
在这里插入图片描述
这个错误的原因是:
输入的训练集数据的数目与测试集的数据数目不一致导致的!!!比如你的训练集是1000个数据,那么你的测试集也要是1000个数据才行
上次我这里理解错了,不好意思?(网上搜到的那个同样问题的博客,他的理解也是错误的。。。所以还是要看官方文档啊!!!)这里不是说的训练集和测试集数目不一致,而是 因为训练集的样本数与你选的特征变量数不一致才导致的!!!即如果你的train_x 是(21000,23),那么 train_y也要是(21000,)!

解决办法:
使结果长度保持一致即可

再次运行,问题解决?

PS:
第一个问题其实还有一种查看数据有没有缺失值的办法,就是用pandas的.isnull().any() 方法,比如看下面代码:

print(data4.isnull().any())

结果打印出来是:

loanProduct         False
gender              False
age                 False
dist                False
edu                 False
                    ...  
ncloseCreditCard    False
unpayIndvLoan       False
unpayOtherLoan      False
unpayNormalLoan     False
5yearBadloan        False
Length: 99, dtype: bool

解释一下,False代表该字段没有空值,所以是完整的,不存在缺失值;
True代表该字段有缺失值。

可以看出来,这里显示的是没有缺失值,但是我们刚刚通过开头的方法已经发现了缺失值的字段,
所以当特征字段太多的时候,此方法就不容易看出缺失的字段; 建议特征字段较少的时候使用该方法。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何解决报错ValueError: Input contains NaN, infinity or a value too large for dtype('float64')的问题 的相关文章

随机推荐

  • 文本编辑器Notepad++使用技巧

    除了语法高亮 xff0c 一般不用操作 还有两点经常使用的 xff1a 正则表达式查找替换和列模式编辑 这些可以在VS Eclipse Word等里也有 xff0c 但是有时打开一个文件就慢了 本来想总结记录一下技巧的 xff0c 却无意中
  • linux系统磁盘block、inode占满处理

    1 磁盘的block占满 xff0c 查看命令 df vh 然后查看占用百分比 2 磁盘inode占满 xff0c 查看命令df ih 同样也是查看占用百分比 block占满处理办法 需要用到的命令如下 LL 列出当前目录下的文件 df v
  • Code::Blocks平台下Fortran的编译

    问题背景 xff1a 因为之前学习数值方法 xff0c 有用到Fortran的地方 xff0c 所以上网查了一些资料 关于Fortran语言的编辑器安装 xff0c 目前本人接触到的支持Fortran的编辑器有VisualStdio和Cod
  • powershell远程连接

    在Linux中 xff0c 我们可以使用安全的SSH方便的进行远程管理 但在Windows下 xff0c 除了不安全的Telnet以外 xff0c 从Windows Server 2008开始提供了另外一种命令行原创管理方式 xff0c 那
  • 2022年学习总结暨2023年规划

    2022年总结 2022年是我在C站的创作元年 xff0c 在第一年也收获了不少成就 xff0c 比如 Java领域新星创作者 发布100篇博文 拿到了C站的书包 吃到了C站的月饼 成功上榜了330 43 截止目前收获粉丝8600 43 在
  • 《Prometheus+Grafana 实践派》专栏介绍

    专栏名称 Prometheus 43 Grafana 实践派 专栏介绍 本专栏根据本公司统一监控落地实践编写 在该专栏您将学到 企业级监控的选型Prometheus的基础知识Grafana的基础知识快速搭建Prometheus 43 Gra
  • 泊松分布–计算概率分布的公式

    Probability Distributions play an important role in our daily lives We commonly use them when trying to summarise and ga
  • Prometheus 的介绍和安装

    介绍 Prometheus 是一个开源的监控和报警系统 最初由SoundCloud于2012年创建 随着越来越多的公司采用Prometheus以及非常活跃的社区 Prometheus于2016年加入云原生基金会 成为Kubernetes之后
  • 因为锁的问题,我们被扣了1万

    前言 春节放假期间 xff0c 一个项目上的积分接口被刷 xff0c 而且不止一个人在刷 xff0c 并且东西也被兑走 xff0c 放假晚上被人叫起来排查问题 xff0c 通过这个人的积分明细观察 xff0c 基本一秒就能获取一次 xff0
  • Prometheus 告警机制介绍及命令解读

    本文您将了解到Prometheus 告警模块Alertmanager的架构介绍 核心概念 命令解析和AMTool的基本使用 Prometheus的告警模块并不存在于Prometheus中 而是 以独立项目Alertmanager存在 Pro
  • Prometheus 告警模块配置深度解析

    本文您将了解到Prometheus 告警模块Alertmanager 配置的深度解析 Alertmanager 配置解析 Alertmanager 配置可以用命令行配置 也可以通过配置文件配置 命令行用来配置不可变的系统参数 配置文件用来定
  • 不会前端没事,用GWT Boot和Spring Boot构建Web程序

    本文介绍了一种使用Java构建Web应用程序的方式 xff0c 其中GWT或者J2CL是必不可少的 xff0c 另外还有多个UI框架可以配套使用 xff0c 比如Domino UI VueGWT GWT Material Design GM
  • Prometheus 监控云Mysql和自建Mysql(多实例)

    本文您将了解到 Prometheus如何配置才能监控云Mysql 包括阿里云 腾讯云 华为云 和自建Mysql Prometheus 提供了很多种Exporter 用于监控第三方系统指标 如果没有提供也可以根据Exporter规范自定义Ex
  • 2023年 Java 发展趋势

    GitHub 语言统计表明 xff0c Java在编程语言中排名第二 xff0c 而在2022年的TIOBE指数中 xff0c Java排在第四 抛开排名 xff0c Java是自诞生以来企业使用率最高的编程语言 xff0c 作为一种编程语
  • Spring Boot 中文参考指南(二)-Web

    Spring Boot 版本 2 7 8 原文 xff1a https docs spring io spring boot docs 2 7 8 reference htmlsingle Spring Boot 3 x 第一个 GA 版本
  • Java 编写Vue组件(VueGWT的初尝试)

    在之前 xff0c 我曾写过这样的文章 不会前端没事 xff0c 用GWT Boot和Spring Boot构建Web程序 xff0c 这篇文字使用的Domino UI来做前端页面 xff0c 由于现在更流行VUE xff0c 并且VUE的
  • Spring Boot 源码阅读初始化环境搭建

    在开始源码阅读之前 xff0c 需要先搭建一个简易的SSM环境用于测试 xff0c 这里不过解释怎么搭建 xff0c 相信都开始看源码了 xff0c 还不会搭建Demo环境就先去学习下基础 demo环境地址 xff1a https gith
  • python列表平均值函数_如何计算列表的平均值-统计信息和Python的均值函数详细解释

    python列表平均值函数 Mathematics and programming go hand in hand If you are a programmer at some point you will have to use mat
  • C++ typedef详解

    typedef的用途 1 定义一种类型的别名 注意typedef并不是简单的宏替换 xff0c 如下例所示 xff1a span class token keyword int span span class token function
  • 如何解决报错ValueError: Input contains NaN, infinity or a value too large for dtype('float64')的问题

    这两天在做信用卡的数据分析项目 xff0c 出现了除标题错误以外 43 xff08 ValueError Found input variables with inconsistent numbers of samples 56411 27