numpy.genfromtxt 生成看起来像元组的数组,而不是二维数组 - 为什么?

2024-06-26

我在跑genfromtxt像下面这样:

date_conv = lambda x: str(x).replace(":", "/")
time_conv = lambda x: str(x)

a = np.genfromtxt(input.txt, delimiter=',', skip_header=4,
      usecols=[0, 1] + radii_indices, converters={0: date_conv, 1: time_conv})

Where input.txt来自这个要点 https://gist.github.com/1958483.

当我查看结果时,它是一个一维数组而不是二维数组:

>>> np.shape(a)
(918,)

它似乎是一个元组数组:

>>> a[0]
('06/03/2006', '08:27:23', 6.4e-05, 0.000336, 0.001168, 0.002716, 0.004274, 0.004658, 0.003756, 0.002697, 0.002257, 0.002566, 0.003522, 0.004471, 0.00492, 0.005602, 0.006956, 0.008442, 0.008784, 0.006976, 0.003917, 0.001494, 0.000379, 6.4e-05)

如果我从genfromtxt调用它工作正常并生成一个二维数组:

>>> np.shape(a)
(918, 24)

返回的内容称为结构化数组,参见例如这里:http://docs.scipy.org/doc/numpy/user/basics.rec.html http://docs.scipy.org/doc/numpy/user/basics.rec.html。这是因为您的数据不是同质的,即并非所有元素都具有相同的类型:数据包含字符串(前两列)和浮点数。 Numpy 数组必须是同构的(参见here http://docs.scipy.org/doc/numpy/user/whatisnumpy.html以获得解释)。

结构化数组通过对每个记录或行使用元组来“解决”同质性的约束,这就是返回的数组是一维的原因:一系列元组,但每个元组(行)由多个字段组成,因此您可以将其视为行和列。不同的列可通过以下方式访问a['nameofcolumn'] e.g. a['Julian_Day'].

删除前两列的转换器时它返回 2D 数组的原因是,在这种情况下,genfromtxt考虑相同类型的所有数据,并返回一个普通的ndarray(默认类型是float,但您可以使用dtype争论)。

EDIT:如果你想使用列名,你可以使用names参数(并设置skip_header只有三个):

a2 = np.genfromtxt("input.txt", delimiter=',', skip_header=3, names = True, dtype = None,
                  usecols=[0, 1] + radii_indices, converters={0: date_conv, 1: time_conv})

你可以做的例如:

>>> a2['Dateddmmyyyy']
array(['06/03/2006', '06/03/2006', '18/03/2006', '19/03/2006',
       '19/03/2006', '19/03/2006', '19/03/2006', '19/03/2006',
       '19/03/2006', '19/03/2006'], 
      dtype='|S10')
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

numpy.genfromtxt 生成看起来像元组的数组,而不是二维数组 - 为什么? 的相关文章

随机推荐

  • HTML5 中填充笔划的透明度

    我正在 HTML5 中开发一个涂鸦应用程序 我想做一种桶功能 这个想法是绘制一条路径 它将被关闭并用选定的颜色 描边的颜色 填充 它对于纯色效果很好 但如果我想要透明的描边和填充 我会遇到这个问题 所发生的情况是填充完成到笔划的中间 路径的
  • Django 条件管理 list_editable

    无论如何 是否可以使 list editable 在每个对象的基础上可选 例如readonly fields属性有这个选项 它不会影响changelist view class MyAdmin admin ModelAdmin readon
  • 如何修改sass中的根父选择器[重复]

    这个问题在这里已经有答案了 如何修改父选择器链的根元素 使用 sass 3 3 x 类似 prepend prefix at root prefix note there is no dot separating it content fo
  • 如何在 Android 中没有视频视图的情况下从 URL 获取视频长度(以毫秒为单位)?

    我正在 Android 中制作一个媒体播放器 我需要一个代码来获取视频长度而不使用视频视图 我在堆栈溢出中看到了很多页面 但每个页面都用于显示如何在视频视图中获取视频的长度 但我需要没有视频视图 你可以使用媒体元数据检索器 http dev
  • Windows 安装程序 (C#) 错误代码 2869

    我在 VS 2005 中有一个项目 其中有一个控制台应用程序和一个与安装该应用程序关联的安装项目 我在控制台应用程序中还有一个安装程序类 安装项目将使用它在安装前进行一些验证 这些任务正在检查数据库连接字符串并检查某些目录位置以确保它们在安
  • 客户端和服务器之间的安全连接

    我正在开发一个服务器组件 它将为嵌入式客户端的请求提供服务 这也在我的控制之下 现在一切都是测试版 安全性是这样的 客户端通过 https 发送用户名 密码 服务器返回访问令牌 客户端使用自定义标头中的访问令牌通过 http 发出进一步请求
  • SQL Server到Mysql迁移(使用Mysql Workbench)数据传输错误

    我正在使用 Mysql Work bench 6 3 将数据库从 MS Sql server 2008 迁移到 Mysql 在 批量数据传输 期间出错并出现以下警告 这种情况仅发生在像 varchar char 这样的列类型上 当我尝试使用
  • 将阿拉伯语文本导出为图像

    我有一堆 UTF 8 格式的阿拉伯文本 我尝试显示此设备的设备不支持显示阿拉伯语文本 因此 我需要将文本转换为图像 我想将每行文本保存为具有特定宽度的图像 我还需要使用特定的字体 做这个的最好方式是什么 有人知道这里有一个有用的工具吗 到目
  • 如何使 Mercurial 按提交日期对“hg log”的输出进行排序?

    我怎样才能使 Mercurial 排序输出hg log按提交日期 输出似乎是按我将提交拉入存储库的日期而不是提交的时间排序的 您需要使用转速集 hg log r sort all date 如果您想首先查看最近的提交 请执行以下操作 hg
  • 创建将一把小提琴按色调分割的小提琴图的正确方法是什么?

    创建将一把小提琴分开的小提琴图的正确方法是什么hue 我尝试了不同的方法 似乎唯一的方法是创建一个为数据集中的每个条目共享相同值的功能 并将该功能的名称传递为x fig plt figure figsize 20 8 fig add sub
  • 使用 git 合并两个文件夹

    我正在和一些以前从未使用过 git 的人一起开发一个项目 由于不了解 git 的功能 他们创建了该项目的两个版本 开发版本和生产版本 这两个版本都存在于当前环境中 更复杂的是 除了旧的开发文件夹之外 另一个用户还创建了这些文件夹 所以项目目
  • 在 Rails 中,如何创建用户组作为另一个关联,例如“成员”?

    我正在尝试在两个现有模型之间创建特殊关系 User and Dwelling A Dwelling只有一个所有者 Dwelling belongs to user User has one dwelling 在创建时 但其他用户可以添加到此
  • 显示进度的脚本?

    当我的 python 脚本处理大文件时 我想向用户显示进度 我见过脚本印刷 在 shell 中的同一光标位置显示进度 我怎样才能在Python中做到这一点 你应该使用python 进度条 http code google com p pyt
  • Scipy odeint 非负解

    显然 从 ODE 求解器获得非负解并非易事 https stackoverflow com questions 6977107 solving a delay differential equation dde system constra
  • git 列出所有可用命令

    有没有命令可以显示 GIT 中所有可用命令的列表 有git help但它显示 usage git version exec path
  • 系统.安全.加密与 PCLCrypto

    我们正在删除系统中的许多共享功能并将其移植到 PCL 库中 我在使用 PCLCrypto 时遇到问题 我正在获取数据库中的一些现有数据 并尝试使用相同的算法对其进行解密 我得到了值 但末尾有 16 个额外字节 这些字节都是垃圾 参见下面的代
  • 如何提取世界上每只海龟走过的路径并将其保存在 .csv 文件中?

    我仍在尝试提取世界上每只海龟所走路径的坐标 例如 我想知道海龟 0 所采取的路径是 patch 00 patch 0 5 patch 0 2 和 patch 1 4 并将此信息保存在 csv 文件中 这样 我想提取世界上所有海龟所走路径的坐
  • corr.test 与 cor.test p 值

    我正在尝试使用 psych 包 psych 1 6 9 中的 corr test 但在使用 method spearman 时 它似乎给出了与 cor test 不同的 p 值 相关系数相同 但 p 值不同 我整理了一些示例代码和输出 如下
  • 使用 roxygen2 记录数据集

    我正在尝试使用 roxygen2 记录 R 包中的一些数据集 仅考虑其中之一 I have mypkg data CpG human GRCh37 RDa 其中包含一个名为的对象CpG human GRCh37 和一个名为 mypkg R
  • numpy.genfromtxt 生成看起来像元组的数组,而不是二维数组 - 为什么?

    我在跑genfromtxt像下面这样 date conv lambda x str x replace time conv lambda x str x a np genfromtxt input txt delimiter skip he