如何使用 Pandas 从 Excel 读取某些列 - Python

2024-04-05

我正在读取 Excel 工作表，并且想要读取某些列：第 0 列（因为它是行索引）和第 22:37 列。现在这就是我所做的：

import pandas as pd
import numpy as np
file_loc = "path.xlsx"
df = pd.read_excel(file_loc, index_col=None, na_values=['NA'], parse_cols = 37)
df= pd.concat([df[df.columns[0]], df[df.columns[22:]]], axis=1)

但我希望有更好的方法来做到这一点！我知道如果我这样做parse_cols=[0, 22,..,37]我可以做到，但对于大型数据集来说这是没有意义的。

我也这样做了：

s = pd.Series(0)
s[1]=22
for i in range(2,14):
    s[i]=s[i-1]+1
df = pd.read_excel(file_loc, index_col=None, na_values=['NA'], parse_cols = s)

但它读取前 15 列，即长度s.

您可以像这样使用列索引（字母）：

import pandas as pd
import numpy as np
file_loc = "path.xlsx"
df = pd.read_excel(file_loc, index_col=None, na_values=['NA'], usecols="A,C:AA")
print(df)

对应文档 https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html:

usecols : int、str、类列表或可调用默认值 None

如果没有，则解析所有列。

如果是 str，则表示以逗号分隔的 Excel 列字母和列范围列表（例如“A:E”或“A,C,E:F”）。范围包括双方。

如果是 int 列表，则表示要解析的列号列表。

如果是字符串列表，则表示要解析的列名列表。

0.24.0 版本中的新增功能。

如果可调用，则根据它评估每个列名称，并在可调用返回 True 时解析该列。

根据上述行为返回列的子集。

0.24.0 版本中的新增功能。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

pandas

DataFrame

如何使用 Pandas 从 Excel 读取某些列 - Python 的相关文章

保留完整姓氏，在 pandas 列中获取名字的首字母（如果有的话，还有中间名）

我有一个 pandas 数据框其中有一列表示几位网球运动员的姓氏和姓名如下所示 Player 0 Roddick Andy 1 Federer Roger 2 Tsonga Jo Wilfred 我想保留完整的姓氏并获取姓名的首字母和中
pyspark 数据框中的自定义排序

是否有推荐的方法在 pyspark 中实现分类数据的自定义排序我理想地寻找 pandas 分类数据类型提供的功能因此给定一个数据集Speed列可能的选项是 Super Fast Fast Medium Slow 我想实现适合上下文的
Python 中的流式传输管道

我正在尝试使用 Python 将 vmstat 的输出转换为 CSV 文件因此我使用类似的方法转换为 CSV 并将日期和时间添加为列 vmstat 5 python myscript py gt gt vmstat log 我遇到的问题是
如何在 Python 中加密并在 Java 中解密？

我正在尝试在 Python 程序中加密一些数据并将其保存然后在 Java 程序中解密该数据在Python中我像这样加密它 from Crypto Cipher import AES KEY 1234567890123456789012
Keras：如何保存模型或权重？

如果这个问题看起来很简单我很抱歉但是阅读 Keras 保存和恢复帮助页面 https www tensorflow org beta tutorials keras save and restore models https www t
如何使用文本相似性删除 pandas 数据框中相似（不重复）的行？

我有数千个数据这些数据可能相似也可能不相似使用 python 的默认函数 drop duplicates 并没有真正的帮助因为它们只检测相似的数据例如如果我的数据包含类似以下内容怎么办嗨早上好嗨早上好 Python 不会将
如果在等待“read -s”时中断，在子进程中运行 bash 会破坏 tty 的标准输出吗？

正如 Bakuriu 在评论中指出的那样这基本上与BASH 输入期间按 Ctrl C 会中断当前终端 https stackoverflow com questions 31808863 bash ctrlc during input b
Django send_mail SMTPSenderRefused 530 与 gmail

一段时间以来我一直在尝试使用 Django 从我正在开发的网站接收电子邮件现在我还没有部署它并且我正在使用Django开发服务器我不知道这是否会影响它这是我的 settings py 配置 EMAIL BACKEND djang
使用 python 绘制正值小提琴图

我发现小提琴图信息丰富且有用我使用 python 库 seaborn 然而当应用于正值时它们几乎总是在低端显示负值我发现这确实具有误导性尤其是在处理现实数据集时在seaborn的官方文档中https seaborn pydata
聚合函数在数据框中创建不需要的向量

我在函数中创建数据帧时遇到了一个奇怪的问题但是在 data frame 之外使用相同的方法效果很好这是基本函数我用它来计算数据集的平均值标准差和标准误差 aggregateX lt function formula dataset
如何在 pandas 中使用 read_fwf 跳过空行？

I use pandas read fwf http pandas pydata org pandas docs stable generated pandas read fwf htmlPython pandas 0 19 2 中的函数读
用 python 编写的数学语法检查器

我需要的只是使用 python 检查字符串是否是有效的数学表达式为了简单起见假设我只需要运算符也作为一元带有数字和嵌套括号为了完整性我还添加了简单的变量名称所以我可以这样测试 test 3 2 1 valid test 3
Python：IndexError：修改代码后列表索引超出范围

我的代码应该提供以下格式的输出我尝试修改代码但我破坏了它 import pandas as pd from bs4 import BeautifulSoup as bs from selenium import webdriver im
返回表示每组内最大值的索引的一系列数字位置

考虑一下这个系列 np random seed 3 1415 s pd Series np random rand 100 pd MultiIndex from product list ABDCE list abcde One Two T
在系统托盘中隐藏 tkinter 窗口 [重复]

这个问题在这里已经有答案了我正在制作一个程序来提醒我朋友的生日这样我就不会忘记祝福他们为此我制作了两个 tkinter 窗口 1 First one is for entering name and birth date 2 Sec
从 NumPy 数组到 Mat 的 C++ 转换 (OpenCV)

我正在围绕 ArUco 增强现实库基于 OpenCV 编写一个薄包装器我试图构建的界面非常简单 Python 将图像传递给 C 代码 C 代码检测标记并将其位置和其他信息作为字典元组返回给 Python 但是我不知道如何在 Pytho
Django Admin 中的反向内联

我有以下 2 个型号现在我需要将模型 A 内联到模型 B 的页面上模型 py class A models Model name models CharField max length 50 class B models Model n
双击打开 ipython 笔记本

相关文章通过双击 osx 打开 ipython 笔记本 https stackoverflow com questions 16158893 open an ipython notebook via double click on osx
查找总和为给定数字的值组合的函数

这个帖子查找提供的 Sum 值的组合 https stackoverflow com a 20194023 1561176呈现函数subsets with sum 它在数组中查找总和等于给定值的值的组合但由于这个帖子已经有6年多了我发这
Apache Beam Pipeline 写表后查询表

我有一个 Apache Beam Dataflow 管道它将结果写入 BigQuery 表然后我想查询该表以获取管道的单独部分但是我似乎无法弄清楚如何正确设置此管道依赖性我编写的新表然后想要查询与一个单独的表连接以进行某些过滤

随机推荐

SecurityException - GoogleCertificatesRslt：不允许

我们有一个拥有数百万用户的应用程序在过去的一周里我们从 Firebase Crashlytics 的旧版本应用程序中收到了大约 30 个速度警报其中包含如下错误消息 Fatal Exception java lang Securit
使用按钮在打印机中打印 jLabel 的图标[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我有一个带有图标的 jLabel 我想使用按钮在打印机佳能惠普爱普生任何打印机中打印该图标我怎样才能做到这一点有什么有用的代码
在 MS Access 上与多个程序员一起工作

您是否建议与多个程序员一起开发 MS Access 应用程序我们的一款 MS Access 应用程序已经发展到了这样的程度一名程序员无法在要求的时间范围内处理大量的更改错误修复和新功能我们正在尝试使用 VBA 中未记录的 Save
如何缩小自定义 Skobbler 离线地图应用程序的大小

我正在将 Skobbler 地图集成到我的 iOS 应用程序中目前该应用程序的大小为 160Mb 这太大了但我注意到已经集成了一堆地图我想删除所有地图并让用户下载他需要的地图现在当我包含 SKMaps framework 时其
Typescript 编译器突然开始生成错误

我正在开发一个 Angular 2 项目当我尝试运行打字稿编译器时突然开始出现很多很多错误有人可以建议从哪里开始搜索吗我没有故意更改任何基本内容即使当我从存储库克隆一个新副本时错误仍然存在错误如下 node modules
Facebook SDK 3.1 - 错误：HTTP 状态代码：400

自昨天 10 月 9 日起我已更新至 facebook SDK 3 1 后我收到以下错误错误 HTTP 状态代码 400 但就与 Facebook 连接而言一切功能都完全正常每次在我的应用程序上启动 Facebook 会话时我都会
Rails 3 和图形数据库

在 Postgresql 上运行的 Rails 3 应用程序需要切换到图形数据库才能成长它们有很多并且都提供不同类型的 API 主要是 REST 我深受启发talks http nosql mypopescu com post 3429
如何使用 FFmpeg 在 C++ 中将 AVFrame 保存为图像

在我的项目中我想保存 Hevc 文件中的一帧我在源代码中使用 FFmpeg 来解码 Hevc 文件并获取 AVFrame 和 AVCodecContext 我需要的是将框架保存为图片全彩我尝试将其保存为 pgm 文件因此图片只是灰
isSet() 或运算符 void*() 或显式运算符 bool() 或其他什么？

是什么最先进的关于函数检查值是否已设置例如下面的迭代器解析单元格某些单元格包含值其他单元格为空最方便的方法是什么 struct iterator usage bool isset const if it isset bool is
如何解决“错误 TS2351：无法将“new”与类型缺少调用或构造签名的表达式一起使用。”？

我正在将一个名为 Auth js 的 js 文件所以不是 ts 文件导入到我的 Reactjs TypeScript 应用程序中所以在我的组件中我有这个 import as Auth from Auth Auth const auth
如何使用 Meteor js 触发自定义事件

是否可以使用 Meteor 触发自定义事件我发现触发自定义 jquery 事件不起作用因为 Meteor 事件与 jQuery 是分开的正如这里所讨论的 https stackoverflow com questions 106465
javax.naming.InitialContext 是线程安全的吗

目前我正在使用以下代码来查找普通 POJO 类的 EJB3 无状态会话 bean 我们使用的是 JEE5 所以我们无法在普通 POJO 类中注入无状态会话 Bean 我必须使用查找 import javax naming Context i
使用 pthread_create 时出现 valgrind 内存泄漏错误

我正在使用 pthread 库编写一个程序当我使用命令运行程序时valgrind leak check full 我得到以下错误描述 11784 11784 HEAP SUMMARY 11784 in use at exit 4 952
分裂长长

如何拆分即 long long 类型以便它的第一部分位于 long 类型的 var 中第二部分也位于 long 类型的 var 中 long long long type 0xaaaabbbbccccdddd 在第一个 int 中
textarea、tinyMCE 并在 textarea 中插入图像

我想用 jquery 在文本区域中插入图像我知道 img 标签无法插入到文本区域中我正在使用tinymce img src image jpg class po
如何仅导入子模块而不执行包中的 exec __init__.py

当从包中导入子模块时包文件夹中的 init py 文件将首先被执行如何禁用它有时我只需要一个包中的一个函数导入整个包有点繁重例如pandas io clipboard模块不依赖于 pandas 中的任何其他函数 from pand
iPhone 上的 CoreData 支持 IN 谓词吗？

我正在尝试根据用户定义的类型列表来获取某种类型的一堆记录 fetchRequest setEntity NSEntityDescription entityForName myRecord inManagedObjectContext se
如何在 Genymotion 虚拟设备上安装 Google 框架（Play、帐户等）？ [复制]

这个问题在这里已经有答案了我目前正在尝试 Genymotion 天哪它比 ADT 模拟器快得多但我需要安装 Google Play 才能下载一些应用程序我该怎么做呢 2017 年 5 月 28 日更新据我所知我不再支持此方法并
MySQL 到 Oracle 语法错误（限制/偏移/更新）

我有一个适用于我当前的 MySQL 数据库的 MySQL 查询我被迫转向 Oracle 因此我尝试移植所有存储过程程序以使用 Oracle SQL 语法我在一个特定查询上遇到了很多麻烦这是 MySQL 查询它使用子查询更新表 up
如何使用 Pandas 从 Excel 读取某些列 - Python

我正在读取 Excel 工作表并且想要读取某些列第 0 列因为它是行索引和第 22 37 列现在这就是我所做的 import pandas as pd import numpy as np file loc path xlsx d

如何使用 Pandas 从 Excel 读取某些列 - Python

如何使用 Pandas 从 Excel 读取某些列 - Python 的相关文章

随机推荐

热门标签