Excel 工作表到 Numpy 数组

2024-05-01

我正在尝试做一件令人难以置信的简单事情：将 Excel 工作表的部分内容加载到 Numpy 数组中。我发现了一个有用的拼凑，但它令人尴尬地不Pythonic：假设我的工作表被加载为“ws”，代码：

A = np.zeros((37,3))
for i in range(2,39):
   for j in range(1,4):
      A[i-2,j-1]= ws.cell(row = i, column = j).value

将“ws”的内容加载到数组 A 中。

必须有一种更优雅的方法来做到这一点。例如，csvread 允许更自然地执行此操作，虽然我可以很好地将 .xlsx 文件转换为 csv 文件，但使用 openpyxl 的全部目的是避免这种转换。那么，我们就到了，强大的管间的集体智慧：有什么更 Pythonic 的方法来执行这个概念上微不足道的操作？

预先感谢您的答复。

PS：我通过 Spyder 在 Mac 上运行 Python 2.7.5，是的，我确实阅读了 openpyxl 教程，这是我到目前为止的唯一原因。

你可以做

A = np.array([[i.value for i in j] for j in ws['C1':'E38']])

编辑-进一步解释。（首先感谢您向我介绍 openpyxl，我怀疑我会不时地使用它）

从工作表对象获取多个单元格的方法会生成一个生成器。如果您想处理一张大工作表，这可能会更有效，因为您可以立即开始，而无需等待将其全部加载到列表中。
要强制生成器创建一个列表，您可以使用list(ws['C1':'E38'])或上面的列表理解
每行都是一个元组（即使只有一列宽）
细胞对象。这些不仅仅是一个数字，还有更多的信息，但如果您想获取数组的数字，您可以使用 .value 属性。这确实是您问题的关键，csv 文件不包含 Excel 电子表格的结构化信息。
（据我所知）没有用于从一系列单元格中提取值的内置方法，因此您必须按照您所描绘的方式有效地执行某些操作。

按照我的方式这样做的优点是：不需要计算出数组的维数并从一个空数组开始，不需要计算出 np 数组的正确索引号，列表推导速度更快。缺点是它需要以“A1”格式定义“角”。如果不知道范围，则必须使用 iter_rows、行或列

A = np.array([[i.value for i in j[2:5]] for j in ws.rows])

如果您不知道有多少列，那么您将不得不循环并检查更像您最初想法的值

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Excel 工作表到 Numpy 数组的相关文章

Twisted 的 Deferred 和 JavaScript 中的 Promise 一样吗？

我开始在一个需要异步编程的项目中使用 Twisted 并且文档非常好所以我的问题是 Twisted 中的 Deferred 与 Javascript 中的 Promise 相同吗如果不是有什么区别你的问题的答案是Yes and No
使用 pygame 显示 unicode 符号

我检查了其他答案但不明白为什么我的代码错误地显示 This is what I currently see https i stack imgur com 8tNIK png 这是关于文本渲染的相关代码 font pygame font
如何以“正确”的方式处理带有空字节的 Python unicode 字符串？

Question PyWin32 似乎很乐意将 null 终止的 unicode 字符串作为返回值我想以正确的方式处理这些字符串假设我得到一个像这样的字符串 u C Users Guest MyFile asy x00 x00sy
Pandas：GroupBy 到 DataFrame

参考这个关于 groupby 到 dataframe 的非常流行的问题 https stackoverflow com questions 10373660 converting a pandas groupby object to dat
Python - 来自 .进口

我第一次尝试图书馆我注意到解决图书馆内导入问题的最简单方法是使用如下结构 from import x from some module import y 我觉得这件事有些糟糕也许只是因为我不记得经常看到它尽管公平地说我还没有深入研究
检查 Python 中的可迭代对象中的所有元素的谓词是否计算为 true

我很确定有一个常见的习语但我无法通过谷歌搜索找到它这是我想做的用Java Applies the predicate to all elements of the iterable and returns true if all ev
pyspark 数据框中的自定义排序

是否有推荐的方法在 pyspark 中实现分类数据的自定义排序我理想地寻找 pandas 分类数据类型提供的功能因此给定一个数据集Speed列可能的选项是 Super Fast Fast Medium Slow 我想实现适合上下文的
如何使用文本相似性删除 pandas 数据框中相似（不重复）的行？

我有数千个数据这些数据可能相似也可能不相似使用 python 的默认函数 drop duplicates 并没有真正的帮助因为它们只检测相似的数据例如如果我的数据包含类似以下内容怎么办嗨早上好嗨早上好 Python 不会将
结构差异 sudo() run('sudo 命令')

我想知道函数之间有什么区别sudo 和函数run sudo u user smth 文档上有 sudo 在所有运行方式上都是相同的除了它总是换行调用 sudo 程序中的给定命令以提供超级用户特权但有几次 sudo cmd 提示我输入
如果在等待“read -s”时中断，在子进程中运行 bash 会破坏 tty 的标准输出吗？

正如 Bakuriu 在评论中指出的那样这基本上与BASH 输入期间按 Ctrl C 会中断当前终端 https stackoverflow com questions 31808863 bash ctrlc during input b
Django send_mail SMTPSenderRefused 530 与 gmail

一段时间以来我一直在尝试使用 Django 从我正在开发的网站接收电子邮件现在我还没有部署它并且我正在使用Django开发服务器我不知道这是否会影响它这是我的 settings py 配置 EMAIL BACKEND djang
Python新式类和__subclasses__函数

有人可以向我解释为什么这有效在 Python 2 5 中 class Foo object pass class Bar Foo pass print Foo subclasses 但这不是 class Foo pass class Ba
Django 中所有应用程序的基本模板

我有一个包含 2 个应用程序的项目 project blog templates index html polls templates index html project templates base html index html 现在
使用“默认”环境变量启动新的子进程

我正在编写一个构建脚本来解析依赖的共享库及其共享库等这些共享库在正常情况下是不存在的PATH环境变量为了使构建过程正常工作让编译器找到这些库 PATH已更改为包含这些库的目录构建过程是这样的加载器脚本更改 PATH gt 基于
返回表示每组内最大值的索引的一系列数字位置

考虑一下这个系列 np random seed 3 1415 s pd Series np random rand 100 pd MultiIndex from product list ABDCE list abcde One Two T
动态过滤 pandas 数据框

我正在尝试使用三列的阈值来过滤 pandas 数据框 import pandas as pd df pd DataFrame A 6 2 10 5 3 B 2 5 3 2 6 C 5 2 1 8 2 df df loc df A gt 0
Elasticsearch 通过搜索返回拼音标记

我用语音分析插件 https www elastic co guide en elasticsearch plugins current analysis phonetic html由于语音转换从弹性搜索中进行一些字符串匹配我的问题是
Django 与谷歌图表

我试图让谷歌图表显示在我的页面上但我不知道如何将值从 django 视图传递到 javascript 以便我可以绘制图表姜戈代码 array Year Sales Expenses 2004 1000 400 2005 1170 460
TKinter 中的禁用/启用按钮

我正在尝试制作一个像开关一样的按钮所以如果我单击禁用按钮它将禁用按钮有效如果我再次按下它它将再次启用它我尝试了 if else 之类的东西但没有成功这是一个例子 from tkinter import fenster Tk
从 pandas DataFrame 中删除少于 K 个连续 NaN

我正在处理时间序列数据我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题我尝试查看一些链接例如标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que

随机推荐

在 Dart 中打印不带括号的列表

我想在打印时从列表中删除括号 Dart Code void main var lst new List 3 for int i 0 i lt 3 i lst i i print lst 电流输出 0 1 2 预期输出 0 1 2 您可以使用
多个 aiohttp Application() 在同一进程中运行？

Can two aiohttp web Application 对象在同一进程中运行例如在不同的端口上我看到了一堆 aiohttp 代码的示例例如 from aiohttp import web app web Application
如何在画布的右上角绘制位图

我正在尝试绘制位图top right hand corner of the Canvas 到目前为止我已经做了以下事情 100x40 dimensions for the bitmap bitmap BitmapFactory decode
当参数具有相同名称时如何恢复内置函数？ [复制]

这个问题在这里已经有答案了我知道你是不应该 https stackoverflow com questions 2417979 can i use variable name type as function argument in p
如何将 Pandas DataFrame 中加载的嵌入转换为 Gensim 模型？

我有一个 DataFrame 其中索引是单词并且有 100 个带有浮点数的列这样对于每个单词我将其嵌入为 100d 向量我想将我的 DataFrame 对象转换为gensim 模型对象 https radimrehurek com
Qt - 如何在 QGraphicsPixmapItem 中显示 gif（动画）图像

我正在尝试在 QGraphicsPixmapItem 中使用一张闪烁的图像显示的图像没有动画效果下面是原始图像下面是在 QGraphicsPixmapItem 中使用此图像的 QGraphicsScene 有人能说一下如何实现这一目标
QML 适合所有分辨率的屏幕

大家好我的 QML 代码有问题我犯了一个错误我给元素设置了一定的大小现在我在将应用程序放在其他设备上时遇到了问题我会将我的代码粘贴到有宽度和高度的位置以便您可以更改它以向我展示如何使用动态调整大小我需要说我正在使用以下代码从
numpy float：算术运算比内置函数慢 10 倍？

我对以下代码的计时非常奇怪 import numpy as np s 0 for i in range 10000000 s np float64 1 replace with np float32 and built in float 内
如何从注册表获取重定向字符串？

我正在使用从注册表中读取一些值Registry http msdn microsoft com en us library microsoft win32 registry 28v vs 110 29 aspx 我需要访问使用的一些值注册表
angularjs ng-grid：行之间的父子关系（隐藏/显示行）

我正在尝试使用预定义的隐藏行来实现渲染 ng grid 并在某些特定事件上我想显示它们我试图模拟行之间的父子关系但所有行都将以通常的方式呈现和放置默认情况下子行将呈现为折叠单击父项时子行将显示为展开的我正在尝试寻找一些解决
无需通过电子邮件发送密码即可恢复密码

所以我一直在玩asp PasswordRecovery发现我真的不喜欢它原因有几个 1 即使无法访问 Alice 的电子邮件也可以重置 Alice 的密码密码重置的安全问题缓解了这个问题但并不能真正令我满意 2 Alice 的新密
是否有任何 mongodb ORM 允许您为字段添加别名？

我刚刚看了这个 http blog mongodb org post 38467892360 mongodb schema design insights and tradeoffs from http blog mongodb org p
具有多个路径的 SVG 剪辑路径的悬停事件

我有一个 SVG 演示图像其中包含多个正在剪辑动画 GIF 的圆圈当用户将鼠标悬停在每个圆圈上时是否可以观察每个圆圈的悬停事件例如左上角的圆圈或右中角的圆圈另外当这些圆圈悬停时是否可以操纵这些圆圈上的颜色叠加 EDIT 理想情
Xcode 8：因特性而异，改变所有尺寸类别的布局

我正在尝试使用 xcode 8 2 1 上的 very for Traits 功能但是当我使用 Vary for Traits 更改一个尺寸类的布局然后在完成后完成变化时它实际上正在更改每个尺寸的布局我的故事板中的课程例如我尝试
Logstash删除类型并保留_type

我有一个logstash 客户端和服务器客户端将带有logstash的udp输出的日志文件发送到服务器服务器也运行logstash来获取这些日志在服务器上我有一个 json 过滤器它会在实际日志的字段中提取 json 格式的消息
如何使用 maven 在 JBoss AS 7 的 MANIFEST.MF 中生成模块依赖关系？

在 JBoss AS 7 中依赖于 AS 中包含的库的 Web 应用程序必须在 META INF MANIFEST MF 中声明这些依赖关系如下所示 Dependencies
XCode 7 中的 UI 测试文档 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我想知道 WWDC 2015 上引入的 XCode 7 中的新 UI 测试是否有任何文档如果没有文档
Spring JTA 事务与 Websphere 的 JPA 和 jndi 数据源

我有多个数据源和一个配置有 JPA 的数据库我正在使用 websphere 7 我希望将所有这些数据源配置为全局事务我正在使用下面的 spring 配置但事务没有按预期的全局事务工作如果一个数据库发生故障则另一个数据库将被提交这
窗口依赖注入

我想在 WPF 应用程序中使用 Unity 依赖注入我的窗口抛出 System Windows Markup XamlParseException 对于 MainWindow 类型没有找到默认构造函数这是我的代码应用程序 xaml
Excel 工作表到 Numpy 数组

我正在尝试做一件令人难以置信的简单事情将 Excel 工作表的部分内容加载到 Numpy 数组中我发现了一个有用的拼凑但它令人尴尬地不Pythonic 假设我的工作表被加载为 ws 代码 A np zeros 37 3 for i i

Excel 工作表到 Numpy 数组

Excel 工作表到 Numpy 数组 的相关文章

随机推荐

热门标签

Excel 工作表到 Numpy 数组的相关文章