使用 numpy.genfromtxt 填充缺失值

2024-04-12

尽管前面的问题提出了建议：

-9999 作为 numpy.genfromtxt() 的缺失值 https://stackoverflow.com/questions/12274709/9999-as-missing-value-with-numpy-genfromtxt

使用 genfromtxt 导入 numpy 中缺失值的 csv 数据 https://stackoverflow.com/questions/3761103/using-genfromtxt-to-import-csv-data-with-missing-values-in-numpy

我仍然无法处理以缺失值结尾的文本文件，

a.txt:

1 2 3
4 5 6
7 8

我尝试过多种选择的安排missing_values, filling_values并且无法让它工作：

import numpy as np

sol = np.genfromtxt("a.txt", 
                    dtype=float,
                    invalid_raise=False, 
                    missing_values=None,
                    usemask=True,
                    filling_values=0.0)
print sol

我想得到的是：

[[1.0 2.0 3.0]
 [4.0 5.0 6.0]
 [7.0 8.0 0.0]]

但我得到的是：

/usr/local/lib/python2.7/dist-packages/numpy/lib/npyio.py:1641: ConversionWarning: Some errors were detected !
    Line #3 (got 2 columns instead of 3)
  warnings.warn(errmsg, ConversionWarning)
[[1.0 2.0 3.0]
 [4.0 5.0 6.0]]

Using pandas http://pandas.pydata.org/:

import pandas as pd

df = pd.read_table('data', sep='\s+', header=None)
df.fillna(0, inplace=True)
print(df)
#    0  1  2
# 0  1  2  3
# 1  4  5  6
# 2  7  8  0

pandas.read_table将丢失的数据替换为NaNs。你可以替换那些NaNs 与一些其他值使用df.fillna.

df is a pandas.DataFrame。您可以使用以下命令访问底层 NumPy 数组df.values:

print(df.values)
# [[ 1.  2.  3.]
#  [ 4.  5.  6.]
#  [ 7.  8.  0.]]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Parsing

NumPy

genfromtxt

使用 numpy.genfromtxt 填充缺失值的相关文章

jinja2.exceptions.TemplateNotFound：index.html

我尝试使用 Flask 打开 index html run py from app import app app run debug True init py from flask import Flask app Flask name f
Google PubSub 在阻止和等待消息时没有标准输出

我正在使用这个问题底部的 Python 代码监听 Google PubSub 消息它实际上是来自 Google 的异步拉取示例我运行我的程序并输出到文件 python my script py tee log txt 如果我在接收消息时
pyqt5调用url时处于无响应状态

我刚刚在 pyqt 中实现了登录但在调用 url 和获取响应之间 qt 窗口显示无响应状态谁能建议我如何避免不响应状态 code class Login QDialog def init self height width parent
如何动态构造方法？

我设计了一个类它非常标准具有一些方法属性 class foo def f1 self print f1 def f2 self print f2 def fn self print fn 现在我想创建一个包含一组 foo 实例的类 cl
TensorFlow 未编译为使用 SSE（等）指令，但这些指令是可用的

我第一次使用一些示例代码运行 TensorFlow 运行代码时我收到以下警告有谁知道为什么会发生这种情况以及如何解决它 2017 03 31 02 12 59 346109 W c tf jenkins home workspace re
使用 python 在网络上部署 matlab 应用程序

您好我想使用 python 在网络上部署 matlab 应用程序有没有办法做到这一点我已按照数学工作网站上的文档将我的应用程序转换为 jar 文件 java 类有人能指出我前进的正确方向吗事实上您的 Matlab 代码打包为 J
使用光栅重新投影 .tiff 文件：CRSError：无法解析 WKT。 OGR 错误代码 6

我正在尝试使用以下代码将 tiff 文件重新投影到 EPSG 32638 我安装过的版本光栅版本 1 1 5 Numpy 版本 1 18 1 这是我正在使用的代码 https rasterio readthedocs io en late
scikit-learn - 具有置信区间的 ROC 曲线

我可以使用 ROC 曲线scikit learn with fpr tpr thresholds metrics roc curve y true y pred pos label 1 where y true是基于我的黄金标准的值列表即
float.Parse 不再在 Unity 中工作 (C#)

我有一个包含以下代码行的工作项目 public InputField mass float val float Parse mass text 非常简单用户输入一定量的质量然后将其从文本解析为浮动几天前这工作得很好我什至能够多次导出
Django 抛出此错误：SMTPException：服务器不支持 STARTTLS 扩展

由于 gmail 中发送邮件的限制我在我的一台服务器上安装了 exim4 设置如下 dc eximconfig configtype internet dc other hostnames mydomain com localhost l
C 或 C++ 中是否有轻量级的多部分/表单数据解析器？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在考虑将多部分表单数据解析集成到 Web 服务器模块中以便可以减轻后端 Web 应用程序通常用动
Pandas 多索引数据框删除行

我的多索引 DF 如下 tuples list zip a a b b c d c d index pd MultiIndex from tuples tuples names i1 i2 df pd DataFrame 5 6 7 8 i
您忽略了哪些 PEP 8 准则，哪些是您坚持的？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案多年来我编写的 Python 越多我就越发现自己同意大多数准则尽管我出于自己的原因始终有意地违反了一些准则我很想知道 PEP 8 也可能
如何将填充轮廓投影到 3D 曲面图上

我只是想在 3D 中绘制一个表面及其轮廓就像this http matplotlib org examples mplot3d contourf3d demo2 html例子这是我用来执行此操作的代码 import matplotlib
如何在 Microsoft Azure 中提取 Blob 存储中的 Blob 的上次修改日期

我对 MS Azure 的世界还很陌生我正在尝试使用 Python 获取保存在我的 blob 存储中的一堆文件块 blob 的文件名和最后修改日期这是我正在使用的代码 import datetime from azure storag
日志处理程序是否使用单独的线程？

蟒蛇的日志处理程序 http docs python org library logging handlers html都很棒其中一些例如SMTP处理程序 http docs python org library logging han
带日志图的 Type 1 字体

我正在尝试使用 Matplotlib 图表作为相机就绪的一部分提交出版社要求使用Type 1字体仅有的我发现 PDF 后端很乐意输出 Type 1 字体具有线性 Y 轴的简单图形但输出 Type 3 字体对数 Y 轴使用对数
如何在 python pandas 中的同一列上进行分组并将唯一值的计数和某些值的计数作为聚合？

我的问题与我之前的问题有关Question https stackoverflow com questions 42022767 how to do group by and take count of one column divide
如何使用 Google Drive API 通过服务帐户访问域中的共享文件？

我一直在尝试从 Python 3 7 脚本访问有关 Google Shared Drive 文件的一些简单信息上次修改共享云端硬盘上的 Google 表格文件的时间我创建了一个服务帐户在 GCP Drive API 菜单中它可以通过
从tensorflow 2.0 beta中的tf.data.Dataset检索下一个元素

在tensorflow 2 0 beta之前要从tf data Dataset中检索第一个元素我们可以使用迭代器如下所示 usr bin python import tensorflow as tf train dataset tf

随机推荐

`spark.debug.maxToStringFields` 和 `spark.sql.debug.maxToStringFields` 关系？

火花v2 4 spark sql debug maxToStringFields在这里定义https github com apache spark blob master sql catalyst src main scala org a
Visual Studio 2005 中的代码分析

我有一个 Visual Studio 2005 解决方案工作区其中包含 8 个项目我想分析完整的代码所有项目并获取有关每个函数执行所花费的绝对周期的一些度量或者至少是周期消耗的百分比我查看了 VS 2005 的帮助以及项目设置选
Resharper 中的重新排列代码快捷方式在 VS2015 中不起作用

When I try to use the shortcut for moving lines up down Ctrl Alt Shift it highlights the code and shows the tooltip mess
在 VB6 中什么时候必须将变量设置为“Nothing”？

在我的一个 VB6 表单中我创建了几个其他 Form 对象并将它们存储在成员变量中 Private m frm1 as MyForm Private m frm2 as MyForm Later Set m frm1 New MyForm
如何一次“vagrant up”多个节点？

我有一个定义了多个节点的 Vagrantfile 比如节点1 节点2 节点3 我想运行一个命令 vagrant up provision node1 node2 但这似乎在一个命令行中不可能唯一的方法似乎是并行运行两个命令 vagrant
多线程时 For 循环索引超出范围 ArgumentOutOfRangeException

当我迭代时我遇到了一些奇怪的行为dummyText List in the ThreadTest方法我得到索引超出范围异常 ArgumentOutOfRangeException 但是如果我删除线程并且只打印出文本那么一切都会正常这是
Azure 文件存储 SMB 列出目录中的文件速度很慢

我们有一个通过 Azure 文件列出文件夹中文件的应用程序当我们使用C 方法时 Directory GetFiles account file core windows net xyz 当有 2000 个文件时大约需要一分钟如果我们使
MPMoviePlayerController 取消全屏模式在 iOS 6 中不起作用

The MPMoviePlayerController在装有 iOS 5 的 iPad 上运行良好最初视频通过添加MPMoviePlayerController到某个帧的自身子视图按全屏按钮MPMoviePlayerController
如何记录 REST API？

如何记录 REST API 不仅仅是资源的文档而且实际上是请求中发送的数据是什么以及响应中发回的数据是什么知道某些东西期望发送 XML 并返回 XML 是不够有用的或 JASN 管他呢如何记录请求中发送的数据和响应中发回的数据到目
Realm Swift：如何捕获 RLMException？

我以为我做得正确 let realm try Realm do try realm write realm add myObject catch print something went wrong 但我仍然遇到崩溃而不是打印语句我对避免
我怎样才能有不同的提交来进行合并和冲突解决

我将开发分支合并到我的功能分支中这导致在解决我提交和推送的分支后出现合并冲突现在的问题是合并和冲突解决更改位于一次提交中很难找到解决冲突的方法当存在合并冲突时如何才能有两个单独的提交一个用于合并另一个用于冲突修复如果你真的想
Angularjs 未捕获错误：[$injector:unpr]

我正在用java开发购物网站我正在使用angularjs 我对这些文件有问题 DashboardControll js use strict var app angular module DashboardApp app controll
MLlib MatrixFactorizationModel suggestProducts(user, num) 在某些用户上失败

我训练了一个MatrixFactorizationModel https spark apache org docs 1 3 0 api java org apache spark mllib recommendation MatrixFa
在 JPA 查询中转义冒号字符“:”

我正在尝试通过使用字符的 JPA 运行本机查询特定实例在查询中使用 MySQL 用户变量 SELECT foo bar baz rownum if id foo rownum 1 1 as rownum id foo as rep id
在 View AngularJS 中使用服务

我对 angularJS 服务有疑问我有简单的服务 angular module mainApp services factory AuthService function http var currentUser null var au
删除过多的 try-catch 块

我正在重构一个由其他开发人员编写的中型 WinForms 应用程序几乎每个类的每个方法都被一个try catch堵塞 99 的情况下这些 catch 块仅记录异常或清理资源并返回错误状态我认为很明显这个应用程序缺乏适当的异常处理机制
以逗号分隔的标签输入字段

我正在开发一个网络应用程序允许用户通过标签发布内容但问题是如果标签被comma并且文本字段值仍然相同只是用户的视图会有所不同一个例子是 YouTube 或 StackOverflow 目前我不需要它来检查数据库或任何东西 Than
Java 8 从 Map 中的匹配值中提取所有键

我对 Java8 比较陌生我有一个场景我需要从 Map 中检索与对象匹配的所有键想知道是否有一种方法可以获取所有键而无需再次从列表中迭代它们 Person java private String firstName private S
如何在 Android 上使用 GraphQL 和 Retrofit？

我是 GraphQL 的新手但我已经使用 Retrofit 一段时间了它易于使用且快速 GraphQL 在传递数据的方式方面与 REST API 有很大不同关于在 Android 上使用 GraphQL 的教程确实不多我只能找到这个
使用 numpy.genfromtxt 填充缺失值

尽管前面的问题提出了建议 9999 作为 numpy genfromtxt 的缺失值 https stackoverflow com questions 12274709 9999 as missing value with numpy g

使用 numpy.genfromtxt 填充缺失值

使用 numpy.genfromtxt 填充缺失值 的相关文章

随机推荐

热门标签

使用 numpy.genfromtxt 填充缺失值的相关文章