Python从单个numpy数组中的多个文件获取数据的快速方法

2024-04-22

我需要读取存储在许多格式相同但长度不同的文件中的数据，即相同的列，但行数不同。此外，我需要将每一列数据存储在一个数组中（最好是一个 numpy 数组，但列表也可以接受）。

现在，我循环读取每个文件numpy.loadtxt()然后连接结果数组。假设数据由 3 列组成，存储在两个文件“foo”和“bar”中：

import numpy as np
filenames = ["foo", "bar"]
col1_all = 0  #data will be stored in these 3 arrays
col2_all = 0
col3_all = 0
for f in filename:
    col1, col2, col3 = np.loadtxt(f, unpack=True)
    if col1.shape[0] > 0: # I can't guarantee file won't be empty
        if type(col1_all) == int:
            # if there is no data read in yet, just copy arrays
            col1_all = col1[:]
            col2_all = col2[:]
            col3_all = col3[:]
        else:
            col1_all = np.concatenate((col1_all, col1))
            col2_all = np.concatenate((col2_all, col2))
            col3_all = np.concatenate((col3_all, col3))

我的问题是：有更好/更快的方法吗？我需要尽快完成，因为我需要读取数百个文件。

例如，我可以想象，首先找出我总共有多少行，然后“分配”一个足够大的数组来首先容纳所有数据，然后复制该数组中的读入数据可能会表现更好，当我绕过串联时。我不知道总行数，所以这也必须在 python 中完成。

另一个想法是首先读入所有数据，单独存储每个读入的数据，最后将它们连接起来。（或者，因为这本质上给了我总行数，所以分配适合所有数据的行，然后将数据复制到那里）。

有人有什么最有效的经验吗？

不要将每个文件与其余文件连接起来，读取列表中的所有内容，并最终构建结果

import numpy as np
filenames = ["foo", "bar"]
data = np.concatenate([np.loadtxt(f) for f in filenames])

喜欢的话可以分data分成列，但大多数情况下，这不是一个好主意。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Arrays

python27

NumPy

Python从单个numpy数组中的多个文件获取数据的快速方法的相关文章

生成非连续组合

我正在尝试创建一个生成器支持执行 next 的迭代器可能在 python 中使用yield 它给出来自 1 2 n n 和 r 是参数的 r 元素的所有组合这样在选出的r个元素没有两个是连续的例如对于 r 2 且 n 4 生成
Google PubSub 在阻止和等待消息时没有标准输出

我正在使用这个问题底部的 Python 代码监听 Google PubSub 消息它实际上是来自 Google 的异步拉取示例我运行我的程序并输出到文件 python my script py tee log txt 如果我在接收消息时
Python，将CSV文件转换为SQL表

我有一个没有标题的 CSV 文件并尝试从文件中的某些列创建 SQL 表我尝试了这里给出的解决方案使用 Python 将 CSV 文件导入 sqlite3 数据库表 https stackoverflow com questions 2
Redis SYNC 套接字上的错误情况：连接被拒绝

在我的 django 应用程序中使用 celery 和 redis 一切都工作正常直到我遇到了问题 redis 文件的位置已更改 redis 无法访问它们经过查找原来这是由于网络随机攻击造成的需要添加confg 我添加文件后一段时
Pymacs 助手在 30 秒后未启动

我见过其他关于此的问题但没有一个得到真正的回答而且没有一个是我的问题我有一个新系统 emacs 23 1 Centos 6 2 我认为我下载了最新的 pymacs 并安装了它但是我得到 error Pymacs helper d
在 Ruby 中覆盖 BigDecimal to_s 默认值

当我从数据库表中检索数据时会填充一个数组某些字段被定义为小数和货币字段并且在数组中它们表示为 BigDecimal 我使用这些数组值来填充 CSV 文件但问题是所有 BigDecimal 值默认都以科学格式表示这是 BigDeci
有效地减去不同形状的 numpy 数组

使用 numpy 出色的广播规则您可以减去形状 3 数组v来自形状 5 3 数组X with X v 结果是一个形状 5 3 数组其中每一行i是有区别的X i v 有没有办法减去形状 n 3 数组w from X使得每一行w从整个数组中
UserDict 类的优点？

使用有什么好处UserDict class 我的意思是我真正得到的不是 class MyClass object def init self self a 0 self b 0 m MyClass m a 5 m b 7 我将写下以下内容
使用请求和多处理时的奇怪问题

请检查这个Python代码 usr bin env python import requests import multiprocessing from time import sleep time from requests import
如何在 Ubuntu 上通过 pip 安装 python3 版本的软件包？

我两者都有python2 7 and python3 2安装在Ubuntu 12 04 符号链接python链接到python2 7 当我输入 sudo pip install package name 它将默认安装python2的版本pa
如何使用 OpenCV 检测图像帧中的对象？

我正在使用 Raspberry Pi 开发一个漫游器它将清扫房间并捡起掉落在地上的物体为了检测物体我使用了在流动站操作开始时拍摄的参考图像以及每 10 秒单击一次的图像新图像为了确定图像帧是否发生变化我在参考图像和新图像之间进
如何在 Microsoft Azure 中提取 Blob 存储中的 Blob 的上次修改日期

我对 MS Azure 的世界还很陌生我正在尝试使用 Python 获取保存在我的 blob 存储中的一堆文件块 blob 的文件名和最后修改日期这是我正在使用的代码 import datetime from azure storag
如何让 list_blobs 表现得像 gsutil

我只想获得 GCS 上假文件夹结构的第一级如果我运行例如 gsutil ls gs gcp public data sentinel 2 tiles 我得到一个这样的列表 gs gcp public data sentinel 2 til
日志处理程序是否使用单独的线程？

蟒蛇的日志处理程序 http docs python org library logging handlers html都很棒其中一些例如SMTP处理程序 http docs python org library logging han
Pandas：Drop() int64 基于值返回对象

我需要删除其中一列低于某个值的所有行我使用了下面的命令但这将列作为对象返回我需要将其保留为int64 df customer id df drop df customer id df customer id lt 9999999 in
将 2D 数组中的每一列与另一个 2D 数组中的每一列相乘

我有两个 Numpy 数组x有形状 m i and y有形状 m j 所以行数是相同的我想将每一列相乘x每一列y逐元素使结果具有形状 m i j Example import numpy as np np random seed 1 x
如何使用电子表格中的第一行作为 Dataframe 列名称而不是 0 1 2...等？

我希望我的数据框将第一行名称显示为数据框列名称而不是从 0 等编号我该如何执行此操作我尝试使用 pandas 和 openpyxl 模块将我的 Excel 电子表格转换为数据框 import pandas as pd from ope
C# 泛型中的通配符等效项

假设我有一个通用类如下所示 public class GeneralPropertyMap
在另一个数组的每隔一个元素之后插入一个数组中的元素（一次一个）（不均匀拉链）

合并两个数组的优雅方法是什么使得生成的数组具有第一个数组中的两个项目后跟第二个数组中的单个项目以这种方式重复 array1 A1 A2 A3 A4 A5 potentially longer array2 B1 B2 B3 B4 B5
Python：从 apache authnz_ldap 获取用户

我正在通过 Apache2 的 authnz ldap 模块成功验证 ldap 用户我不清楚如何在他们登录后获取他们的用户名以便我可以通过任何以下表单网页与他们交互我尝试过典型的方法 os getenv os environ get

随机推荐

Facebook 如何在不重新加载页面的情况下更改 url？ [复制]

这个问题在这里已经有答案了可能的重复如何在不重新加载和 hack 的情况下更改 Windows 位置 https stackoverflow com questions 3997181 how could i change window
如何从用户列表中查找PC

我需要一些帮助我不太确定这是否可能我有清单samAccountName in csv文件我需要从中获取他们的 PC 名称和 IP 我不太确定如何构建这样的脚本一种方法是循环访问环境中的所有计算机并测试每台计算机这当然会是SLOW
泛型显式转换

我实现了从字符串到名为 Foo 的对象的显式转换所以 gt Foo f Foo foo 数据作品我需要实现一个将字符串转换为通用 T 的函数在本例中 T 是 Foo 数据类型 public T Get
宏的问题

HI 有人可以帮助我理解为什么 SQUARE x 的值为 49 吗我正在使用 Visual C 6 0 define SQUARE X X X int main int argc char argv int y 5 printf d n
如何在 SwiftUI 中为按下时的导航链接设置动画？

我试图通过在按下 NavigationLink 时提供一些反馈来改进用户体验我的意思是一个简单的动画它会增长然后缩小链接以显示它被按下或以任何其他方式提供反馈这是我正在尝试改进的代码 NavigationLink destinatio
在 C++ 中与 VARIANT 类型相互转换的简单方法

有没有便于使用高级类或库让您可以与VARIANT在 Visual C 中更具体地说我想在 POD 类型之间进行转换例如double long 字符串例如CString 和容器例如std vector and VARIANTs 例
如何使argparse在可执行程序中工作

我有一个使用 argparse 模块的命令行脚本 import argparse def run print Running def export print Exporting def argument parser parser arg
连接两个整数并将结果作为 SQL 中的字符串

在表中 2 个字段 ID 为 int Number 为小 int 我想连接这两个字段并显示为字符串 eg ID 101 and Number 9 output 101 9 ID 和 Number 之间要加点吗如何用SQL进行查询 You
按日期订购 asp.net MVC 5

我有一个创建新闻条目并显示 10 条新闻的应用程序它应该显示 10 条最新新闻现在它显示 10 个最旧的新闻我该如何更改它我是否更改控制器以便数据按日期排序或者我可以在视图中执行吗控制器 public ActionResul
postgres 检测零的重复模式

有没有办法在 Postgres 的时间序列中检测长度至少为 3 的零子序列 year value 1 0 2 0 3 0 4 33 5 72 6 0 7 0 8 0 9 0 10 25 11 0 12 56 13 37 因此在此示例中我
从链接服务器插入存储过程的结果

是否可以将远程存储过程的结果插入到临时表中例如 CREATE TABLE test id INT INSERT INTO test EXEC linkedserver remoteDB dbo tst DROP TABLE test 其中
Textview 在 Imageview 上滚动，就像 Pulse 应用程序滚动一样

In my application I want to scroll the text on Image view like Pulse application Need not scroll inside the text view Pl
分离Gdb而不恢复劣质

Gdb 与任何其他程序一样并不完美我时不时会遇到导致当前 Gdb 实例无法使用的错误此时如果我有一个调试会话其中有很多有价值的状态我希望能够在其上启动一个新的 Gdb 会话也就是说分离退出 Gdb 并启动一个新的 Gdb
如何使用 XPath 选择多个可能的文本值？

我必须从类似于下面的评级标签中选择评级代码但仅限于机构为 SP 或 SNP 时现在我有 ratings rating agency text SNP text SP code 但这似乎不起作用我究竟做错了什么
使用和不使用查询字符串路由旧请求

开始之前我知道this https stackoverflow com q 7395841 and this https stackoverflow com q 817325 我想找到一个更简洁的解决方案如果可能的话对于一个稍微更具体
使用 OpenCL 或其他 GPGPU 框架在现代 x86 硬件上的 CPU 和 GPU 之间共享数据

AMD Kaveri 的 hUMA 异构统一内存访问和 Intel 第四代 CPU 证明了 CPU 和 GPU 硬件的不断统一应该允许 CPU 和 GPU 之间进行无副本的数据共享我想知道最新的 OpenCL 或其他 GPGPU 框
Python 从数据库存储和检索密码的最安全方法

希望将用户名和密码存储在数据库中并且想知道最安全的方法是什么我知道我必须在某处使用盐但不确定如何安全地生成它或如何应用它来加密密码一些示例 Python 代码将不胜感激谢谢将密码盐存储为哈希值和盐看看Django是如何做的
如何在Android中的图像上绘画并将图像保存到手机图库

我的目的是将绘制的图像与我的背景视图一起保存到画廊 public boolean onTouch View view MotionEvent event draw the new Points to our internal canvas
将 tzinfo 插入日期时间

我有以下内容tzinfo具体子类定义 from datetime import datetime timedelta tzinfo class ManilaTime tzinfo def utcoffset self dt return t
Python从单个numpy数组中的多个文件获取数据的快速方法

我需要读取存储在许多格式相同但长度不同的文件中的数据即相同的列但行数不同此外我需要将每一列数据存储在一个数组中最好是一个 numpy 数组但列表也可以接受现在我循环读取每个文件numpy loadtxt 然后连接结果数组假

Python从单个numpy数组中的多个文件获取数据的快速方法

Python从单个numpy数组中的多个文件获取数据的快速方法 的相关文章

随机推荐

热门标签

Python从单个numpy数组中的多个文件获取数据的快速方法的相关文章