从 .csv 文件读取值并将其转换为浮点数组

2024-04-25

我偶然发现了一个小编码问题。我基本上必须从 .csv 文件中读取数据，该文件看起来很像这样：

2011-06-19 17:29:00.000,72,44,56,0.4772,0.3286,0.8497,31.3587,0.3235,0.9147,28.5751,0.3872,0.2803,0,0.2601,0.2073,0.1172,0,0.0,0,5.8922,1,0,0,0,1.2759

现在，我基本上需要一个由这样的行组成的整个文件，并将它们解析为 numpy 数组。到目前为止，我已经能够使用类似于以下的代码将它们放入一个大字符串类型对象中：

order_hist = np.loadtxt(filename_input,delimiter=',',dtype={'names': ('Year', 'Mon', 'Day', 'Stock', 'Action', 'Amount'), 'formats': ('i4', 'i4', 'i4', 'S10', 'S10', 'i4')})

到目前为止，该文件的格式由一组 S20 数据类型组成。我基本上需要将大 ORDER_HIST 数据类型中的所有数据提取到每列的一组数组中。我不知道如何保存日期时间列（我现在将其保留为字符串）。我需要将其余部分转换为浮点数，但下面的代码给了我一个错误：

    temparr=float[:len(order_hist)]
    for x in range(len(order_hist['Stock'])): 
        temparr[x]=float(order_hist['Stock'][x]);

有人可以告诉我如何将所有列转换为我需要的数组吗？？？或者可能引导我到一些链接来这样做？

男孩，我有请你吃吗？numpy.genfromtxt http://docs.scipy.org/doc/numpy/reference/generated/numpy.genfromtxt.html has a converters参数，它允许您在解析文件时为每一列指定一个函数。该函数接收 CSV 字符串值。它的返回值成为numpy数组中的对应值。

而且，dtype = None参数告诉genfromtxt对每列的类型做出明智的猜测。特别是，数字列会自动转换为适当的数据类型。

例如，假设您的数据文件包含

2011-06-19 17:29:00.000,72,44,56

Then

import numpy as np
import datetime as DT

def make_date(datestr):
    return DT.datetime.strptime(datestr, '%Y-%m-%d %H:%M:%S.%f')

arr = np.genfromtxt(filename, delimiter = ',',
                    converters = {'Date':make_date},
                    names =  ('Date', 'Stock', 'Action', 'Amount'),
                    dtype = None)
print(arr)
print(arr.dtype)

yields

(datetime.datetime(2011, 6, 19, 17, 29), 72, 44, 56)
[('Date', '|O4'), ('Stock', '<i4'), ('Action', '<i4'), ('Amount', '<i4')]

您的真实 csv 文件有更多列，因此您需要向其中添加更多项目names，但除此之外，该示例仍然有效。

如果你并不真正关心额外的列，你可以指定一个像这样的绒毛名称：

arr = np.genfromtxt(filename, delimiter=',',
                    converters={'Date': make_date},
                    names=('Date', 'Stock', 'Action', 'Amount') +
                    tuple('col{i}'.format(i=i) for i in range(22)),
                    dtype = None)

yields

(datetime.datetime(2011, 6, 19, 17, 29), 72, 44, 56, 0.4772, 0.3286, 0.8497, 31.3587, 0.3235, 0.9147, 28.5751, 0.3872, 0.2803, 0, 0.2601, 0.2073, 0.1172, 0, 0.0, 0, 5.8922, 1, 0, 0, 0, 1.2759)

您可能还有兴趣查看pandas http://pandas.pydata.org/模块是建立在numpy，这将解析 CSV 提升到了一个更高的水平：它有一个pandas.read_csv http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.parsers.read_csv.html函数其parse_dates = True参数将自动解析日期字符串（使用dateutil http://labix.org/python-dateutil#head-c0e81a473b647dfa787dc11e8c69557ec2c3ecd2).

使用 pandas，您的 csv 可以解析为

df = pd.read_csv(filename, parse_dates = [0,1], header = None,
                    names=('Date', 'Stock', 'Action', 'Amount') +
                    tuple('col{i}'.format(i=i) for i in range(22)))

注意不需要指定make_date功能. Just to be clear --pandas.read_csvreturns aDataFrame，而不是 numpy 数组。这DataFrame实际上可能对您的目的更有用，但您应该意识到它是一个不同的对象，具有可供利用和探索的全新方法世界。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从 .csv 文件读取值并将其转换为浮点数组的相关文章

Google PubSub 在阻止和等待消息时没有标准输出

我正在使用这个问题底部的 Python 代码监听 Google PubSub 消息它实际上是来自 Google 的异步拉取示例我运行我的程序并输出到文件 python my script py tee log txt 如果我在接收消息时
python 2.7 字符 \u2013 [重复]

这个问题在这里已经有答案了我有以下代码 coding utf 8 print u William Burges 1827 81 was an English architect and designer 当我尝试从cmd运行它时我收到以
C [x ... y] 范围赋值

今天我遇到了一些代码这些代码使用了我多年来进行 C 编程时从未见过的语法 MWE include
使用 python 在网络上部署 matlab 应用程序

您好我想使用 python 在网络上部署 matlab 应用程序有没有办法做到这一点我已按照数学工作网站上的文档将我的应用程序转换为 jar 文件 java 类有人能指出我前进的正确方向吗事实上您的 Matlab 代码打包为 J
使用光栅重新投影 .tiff 文件：CRSError：无法解析 WKT。 OGR 错误代码 6

我正在尝试使用以下代码将 tiff 文件重新投影到 EPSG 32638 我安装过的版本光栅版本 1 1 5 Numpy 版本 1 18 1 这是我正在使用的代码 https rasterio readthedocs io en late
为 Mercurial 执行 hgweb.cgi 时，指定的 CGI 应用程序行为不当...

我有 IIS 6 我将 Mercurial 安装在 c program files mercurial 中我在 c program files python 中安装了 Python 2 6 I added extension handli
scikit-learn - 具有置信区间的 ROC 曲线

我可以使用 ROC 曲线scikit learn with fpr tpr thresholds metrics roc curve y true y pred pos label 1 where y true是基于我的黄金标准的值列表即
在 JSON 转换为 CSV 期间保持 JSON 键的顺序

我正在使用此处提供的 JSON 库http www json org java index html http www json org java index html为了将 json 字符串转换为 CSV 但我遇到的问题是转换后键的顺序
有效地减去不同形状的 numpy 数组

使用 numpy 出色的广播规则您可以减去形状 3 数组v来自形状 5 3 数组X with X v 结果是一个形状 5 3 数组其中每一行i是有区别的X i v 有没有办法减去形状 n 3 数组w from X使得每一行w从整个数组中
Django 抛出此错误：SMTPException：服务器不支持 STARTTLS 扩展

由于 gmail 中发送邮件的限制我在我的一台服务器上安装了 exim4 设置如下 dc eximconfig configtype internet dc other hostnames mydomain com localhost l
如何在 Ubuntu 上通过 pip 安装 python3 版本的软件包？

我两者都有python2 7 and python3 2安装在Ubuntu 12 04 符号链接python链接到python2 7 当我输入 sudo pip install package name 它将默认安装python2的版本pa
Requests-html 导致 OSError: [Errno 8] 调用 html.render() 时执行格式错误

我正在使用 requests html 并尝试渲染功能但收效甚微当我使用 python3 8 运行这个脚本时 usr bin python3 from requests html import HTML file scrape temp
您忽略了哪些 PEP 8 准则，哪些是您坚持的？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案多年来我编写的 Python 越多我就越发现自己同意大多数准则尽管我出于自己的原因始终有意地违反了一些准则我很想知道 PEP 8 也可能
如何在 Python 中小写字符串？

有没有办法将字符串转换为小写 Kilometers kilometers See How to change a string into uppercase https stackoverflow com questions 9257094
如何让 list_blobs 表现得像 gsutil

我只想获得 GCS 上假文件夹结构的第一级如果我运行例如 gsutil ls gs gcp public data sentinel 2 tiles 我得到一个这样的列表 gs gcp public data sentinel 2 til
在 C 中初始化结构体的静态数组

我正在用 C 实现一个纸牌游戏纸牌有很多种类型每种纸牌都有大量信息包括一些需要单独编写与其关联的脚本的操作给定这样的结构并且我不确定我的语法是否适合函数指针 struct CARD int value int cost This
tweepy 计数限制为 200？

我目前正在尝试检索一些拥有大量关注者的大帐户的关注者我正在使用 Tweepy 和这段代码带光标 follower cursors tweepy Cursor api followers id id var count 5000 for
pyspark：将 schemaRDD 保存为 json 文件

我正在寻找一种将数据从 Apache Spark 以 JSON 格式导出到各种其他工具的方法我认为一定有一种非常简单的方法来做到这一点示例我有以下 JSON 文件 jfile json key value a1 key2 value
如何提取Python代码文件中使用的函数？

我想创建代码文件中使用的所有函数的列表例如如果我们在名为 add random py 的文件中有以下代码 import numpy as np from numpy import linalg def foo print np rand
C++ 中的 Ofstream 数组

我想要在我的项目中使用 41 个输出文件来在其上写入文本首先创建一个字符串数组list为了命名这些输出文件然后我尝试定义一个 ofstream 对象数组并使用list命名它们但我收到此错误 outfile cannot be used

随机推荐

获取 jQuery 中的“translateX”位置

此代码设置 translateX 位置 var pos 500px slide css webkit transform translateX pos px 但是以下代码没有获取translateX位置 var currTrans sli
将 D3 svg 保存为高质量图像

有没有办法将 D3 SVG 图像保存为高质量图像如果是的话请解释一下截至目前我正在使用以下代码将 svg 保存为图像但我得到的图像质量不高 var canvas1 document createElement canvas canv
如何使用 matplotlib 绘制与比例无关的箭头

我使用 matplotlib 在 python 中绘制了一条船的轨迹图如下所示现在我想添加一些箭头例如风向真实航向等但是无论绘图处于哪个缩放级别我都希望箭头具有相同的大小我尝试了 matplotlib pyplot arro
在asp.net MVC中不使用LabelFor Helper获取DisplayName属性

检索模型中项目的显示名称属性的最佳方法是什么我看到很多人使用 LabelFor 助手来处理所有事情但如果我只想列出数据则标签不合适如果我只想将其打印出来比如说一个段落是否有一种简单的方法可以获取名称属性 p p p 显然为了避
从 Xcode 分发时分析应用程序版本时出现什么错误？

我想分发应用程序但收到错误消息我不知道原因我使用 Xcode 版本 13 0 13A233 遇到错误 Error Analyzing App Version Build number request failed with error
适用于 Hotmail、Gmail 和 Yahoo 的 PHP API？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何在 C# 中调整图像大小并保持宽高比

我需要知道一种方法来调整图像大小以适合盒子而不会使图像拉伸太多该框已设置宽度和高度我希望图像尽可能多地填充框但保持其原始的纵横比 calculate the ratio double dbl double image Width d
cronjob 上的 PHP 错误，在提示时工作正常

我正在 cronjob 上运行以下脚本 cd etc parselog php run all php gt dev null 并收到以下错误 05 May 2009 20 30 12 PHP Warning PHP Startup Una
如何仅使用 CSS 制作图像轮播？

我正在寻找制作一个图像轮播用户可以通过单击箭头在图像之间切换例如但是我只能使用 HTML 和 CSS 不能使用 JavaScript 因此也不能使用 jQuery 我只需要基本设置平滑过渡等不是必需的我怎样才能做到这一点这很容
无效参数：隔离消息中的非法参数：（对象是aReceivePort）

我不确定我在这段代码中是否做错了什么但我在生成新隔离时显然传递了 SendPort 但是当我调用时 Infrastructure instance initialize 我收到以下异常 Invalid argument s Illegal
int q = {1,2};特殊的初始化列表

我遇到了下面的初始化可以看出VS2012 显示一个错误抱怨初始化程序太多在海湾合作委员会看来返回第一个元素作为值为什么 GCC 支持这种特殊的初始化 include
Git 日志仅获取特定分支的提交

我想列出仅属于特定分支的所有提交通过以下内容它列出了来自分支的所有提交也列出了来自父级主的所有提交 git log mybranch 我发现的另一个选项是排除 master 可到达的提交并给我我想要的东西但我想避免需要知道其他分
如何交换“NSMutableDictionary”键和值？

我有一个NSMutableDictionary我想交换值和键即交换值后成为键并且其对应的键成为值所有键和值都是唯一的寻找就地解决方案因为尺寸非常大此外键和值是NSString物体 NSMutableDictionary d
C# 中“dynamic”和“object”关键字有什么区别？ [复制]

这个问题在这里已经有答案了谁能简单解释一下 C 中 dynamic 和 object 关键字之间的区别 object 让我们先快速浏览一下 object 关键字我不会谈论太多因为它从 C 1 0 就已经存在了该关键字只不过是 Sys
如何检查单个精灵帧期间的重叠情况？并在玩家与帧重叠的每个循环中仅从玩家生命值中减去 1？

我有一个尖峰精灵其循环中有 4 个帧当玩家与尖峰精灵的第三帧重叠时我想从健康变量中减去 1 目前 on 函数无法正确加载我的游戏可以运行但重叠功能根本无法运行我编辑了收到的代码并删除了我认为不需要的方面测试了原始代码示例以检
Pygame 弹力球穿过地板下沉

下面的代码会弹起一个球但由于某种原因球在完成弹跳后会穿过地面有人知道为什么吗代码的想法是一个球从左上角开始然后下落并弹起然后向上和向下移动依此类推直到它停止弹跳但是当它停止弹跳时它开始抖动并慢慢下沉到地面我不知道为什么
如何删除已发布的 wmi 架构？

我已经发布了架构并且不再拥有包含发布该架构的 wmi 提供程序的 dll 如何删除架构如果您正在谈论其他问题中的程序集您可以简单地使用 wbemtest exe 连接到根命名空间枚举实例按钮超类名称命名空间删除名为 Tes
Visual Studio 2013 Shell（独立）安装失败并出现错误 997：重叠 I/O 操作正在进行

我正在尝试在 Windows 7 Pro 计算机上安装 Visual Studio 2013 Express for Desktop 我已经下载了 ISO 文件并在本地运行它我运行安装程序并收到有关未安装某些先决条件其中之一是 C 运行
局部变量隐藏字段是什么意思？

所以这只是我代码的一部分整个程序编译并运行但我不断在以 GameBoard myBoard this getGameBoard 开头的三行旁边看到局部变量隐藏字段我我只是好奇这实际上意味着什么以及从长远来看它是否对我的程序有任何
从 .csv 文件读取值并将其转换为浮点数组

我偶然发现了一个小编码问题我基本上必须从 csv 文件中读取数据该文件看起来很像这样 2011 06 19 17 29 00 000 72 44 56 0 4772 0 3286 0 8497 31 3587 0 3235 0 9147

从 .csv 文件读取值并将其转换为浮点数组

从 .csv 文件读取值并将其转换为浮点数组 的相关文章

随机推荐

热门标签

从 .csv 文件读取值并将其转换为浮点数组的相关文章