Pandas 在读取 CSV 之前忽略前几行

2023-12-09

我正在使用 Pandas 库和 Python。

我有一个 Excel 文件，在 Excel 工作表的顶部有一些标题信息，我不需要这些信息来提取数据。

但是，标题信息可能需要更长的行，因此无法预测它有多长。

所以，我的数据提取应该从“ID”的地方开始...... 对于这种特殊情况，它从第 5 行开始，但它可能会发生变化。

该图像显示在底部（我在第 5 行之后将其变灰以显示敏感信息）。

我如何将其放入逻辑中（跳过标题并跳转到第 5 行）？模式应该是，行标题从“ID，EMP_ID”等开始。

with open('File.xls') as fp:
    skip = next(filter(
        lambda x: x.startswith('ID'),
        enumerate(fp)
    ))[0]

df = pd.read_excel('File.xls', usercols=['ID', 'EMP_ID'], skiprows=skip)
print df

您可以使用pd.read_csv并指定skiprows=4:

df = pd.read_csv('test.csv', skiprows=4)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Excel

pandas

DataFrame

Pandas 在读取 CSV 之前忽略前几行的相关文章

在 python 中发送标头[重复]

这个问题在这里已经有答案了我有以下 python 脚本我想发送假标头信息以便我的应用程序就像 Firefox 一样运行我怎么能这么做呢 import urllib urllib2 cookielib username passw
NumPy 数组与 SQLite

我在 Python 中见过的最常见的 SQLite 接口是sqlite3 但是有什么东西可以很好地与 NumPy 数组或 rearray 配合使用吗我的意思是它可以识别数据类型不需要逐行插入并提取到 NumPy rec 数组中有点
对法语文本进行词形还原[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一些法语文本需要以某种方式进行处理为此我需要首先将文本标记为单词然后对这些单词进行词形还原以避免多次处理相同的词根据我
将列表值转换为 pandas 中的行

我有数据帧其中一列具有相同长度的 numpy ndarray 值 df list 0 Out 92 array 0 0 0 0 29273096 0 30691767 0 27531403 我想将这些列表值转换为数据框并从 df iloc
如何在Python中手动对数字列表进行排序？

规格 Ubuntu 13 04 Python 3 3 1 背景 Python的初学者遇到了这个手动排序问题我被要求做的事情让用户输入 3 个数值并将它们存储在 3 个不同的变量中不使用列表或排序算法手动将这 3 个数字从小到大
从 .Net 将简单数据插入 Excel 文件的最简单方法

我有一个 Excel 文件大约有 10 列和 1 20 行我需要插入 1 20 行包含各种数据元素我想知道是否有一种方法可以将一些标签放入 Excel 文件中以便可以找到并替换它们将列标记为名称的东西这样我就可以在代码中说
如何在 VB.NET 中将 DataGridView 导出为 Excel 格式

我使用 OLE 通过 VB NET 连接到数据库并在 DataGridView 中显示结果我想将 DataGridView 中的数据导出到 Excel 格式文件即用户可以将 DataGridView 的内容保存为 MS Excel 文
Pygame：有人可以帮我实现双跳吗？

我知道已经有其他关于此问题的帖子了但我的运动系统与我发现的有点不同所以随后我问这个问题我的运动系统基于一个名为的命名元组Move up left right down 然后就是这个 def update self move block
机器学习的周期性数据（例如度角 -> 179 与 -179 相差 2）

我使用 Python 进行核密度估计并使用高斯混合模型对多维数据样本的可能性进行排名每一条数据都是一个角度我不确定如何处理机器学习的角度数据的周期性首先我通过添加 360 来删除所有负角因此所有负角都变成了正角 179 变成了
“KMeans”对象没有属性“k”

我使用 Yellowbrick 包绘制数据集的肘部曲线以使用 KMeans 作为模型找到数据集的最佳簇数我正在使用 Scikit learn KMeans 和 Yellowbrick kelbowvisualizer 函数生成了肘部曲
将 str.contains 映射到 pandas DataFrame

python 初学者我正在寻找创建字符串的字典映射以及关联的值我有一个数据框想要创建一个新列如果字符串匹配则会将该列标记为 x df pd DataFrame comp dell notebook dell notebook S3
在Python中随机交错2个数组

假设我有两个数组 a 1 2 3 4 b 5 6 7 8 9 我想将这两个数组交错为变量 c 注意 a 和 b 不一定具有相同的长度但我不希望它们以确定性的方式交错简而言之仅仅压缩这两个数组是不够的我不想要 c 1 5 2 6 3
如何在类型提示中定义元组或列表的大小

有没有办法在参数的类型提示中定义元组或列表的大小目前我正在使用这样的东西 from typing import List Optional Tuple def function name self list1 List Class1 if
本地主机上的 Google App Engine GQL 查询

我正在 Google App Engine Windows 上的 SDK 版本 1 7 0 上开发一个应用程序我需要经常测试该应用程序并且此测试涉及数据存储上的大量 GQL 查询您可以在 App Engine 管理界面的浏览器中在线运
将二进制数据视为文件对象？

在此代码片段由另一个人编写中 self archive是一个大文件的路径并且raw file是以二进制数据形式读取的文件内容 with open self archive rb as f f seek offset raw file s
如何使用 python 模块的多个 git 分支？

我想使用 git 来同时处理我正在编写的模块中的多个功能我目前正在使用 SVN 只有一个工作区因此我的 PYTHONPATH 上只有该工作区我意识到这不太理想所以我想知道是否有人可以建议一种更正确的方法来做到这一点让我用一个假
为数据集生成随机 JSON 结构排列

我想生成 JSON 结构的许多不同排列作为同一数据集的表示最好不需要对实现进行硬编码例如给定以下 JSON name smith occupation agent enemy humanity nemesis neo 应该产生许多不同
如何创建简单的梯度下降算法

我正在研究简单的机器学习算法从简单的梯度下降开始但在尝试用 python 实现它时遇到了一些麻烦这是我试图重现的示例我获得了有关房屋的数据居住面积以英尺为单位和卧室数量以及最终的价格居住面积英尺2 2104 卧室 3 价
如何在不同的目录中执行python脚本？

Solved对于可能觉得这有帮助的人请参阅下面我的答案我有两个脚本 a py 和 b py 在我当前的目录 C Users MyName Desktop MAIN 中我运行 gt python a py 第一个脚本 a py 在我当前
美丽的汤刮 - 登录凭据不起作用

尝试使用登录凭据抓取页面 payload email gmail com password urls login url https www spotrac com signin url https www spotrac com nba

随机推荐

每天在特定时间发送 Ionic 3 本地通知

我已使用以下命令将 Ionic 3 本地通知插件添加到我的项目中 ionic cordova plugin add cordova plugin local notification npm install save ionic nativ
将一列附加到二维数组

我在 Python 中有一个名为 AllLines 的二维数组 Suppliers Spend Test Field n Dell Inc 9000 1 n Dell Computers 9000 2 n HBC Corp 9000 3 n
如何动态分配组件/字段权限给 Angular 中的某些角色？

I am working on an Angular 7 project and developing a role permission management dashboard where a super admin can assig
java nio ServerSocketChannel 接受如何工作？

我不明白 NIO 在幕后是如何工作的这是示例代码 Create the server socket channel ServerSocketChannel server ServerSocketChannel open nonblocki
添加一个实例来引用另一个实例中的字段

对不起这个问题可能以不同的形式存在但我确实到处搜索但没有看到它我曾经使用过 C 并且习惯于指针我在用 C 模拟代码替换我的逻辑时遇到问题这是我的 C 代码 class Parent public Parent A get set
如何在 Rails 中的 date_select 帮助器中设置默认日期

我正在尝试在我的 Rails 应用程序 2 3 5 中设置出生日期助手目前是这样这会生成一组功能完美的日期字段工作得很好但是它们默认为今天的日期这对于出生日期字段来说并不理想我不确定是什么但除非您正在运行新生儿科否则今天的
requirements.txt 中的安装时依赖项

我正在使用 tox 准备 venv 并运行单元测试我的应用程序需要 openopt 库该库又导入numpy distutils core在其 setup py 中无论我如何在我的requirements txt中订购numpy和ope
分配给大R数据框[重复]

这个问题在这里已经有答案了在 R 中我通过以下方式创建数据框 data lt data frame dummy rep dummy 10000 data number 0 data another 1 当我运行一个为数据框分配值的 fo
如何在代码中设置colorAccent？

我想在代码中更改我的应用程序的主题所以我用谷歌搜索它不幸的是我找不到任何方法在java代码中设置colorAccent 我不想像这样在 xml 中设置这个属性
Tkinter 和多线程

我使用以下代码来检查 Tkinter 是否与多线程一起工作但是下面的代码不起作用 Gui一运行就没有响应谁能解释一下为什么它不起作用 from threading import Thread import tkinter as tk w
HashMap 应该是未排序的，但仍然根据键排序

根据这些 http docs oracle com javase 6 docs api java util HashMap html HashMap LinkedHashMap 和 TreeMap 的区别 java初学者如何在哈希图中对键
Pygame 显示无响应

因此我尝试为使用精灵进行 X 和 Y 运动的基本 2D Python 游戏创建基础然而尽管这里的代码试图screen fill and screen blit playerX 50 playerY 50 player pygame i
帆蓝图生命周期

我需要向结果添加一些额外的数据find蓝图我找到了这个解决方案 module exports find function req res return sails hooks blueprints middleware find req
在 Visual Studio 中引用 system.management.automation.dll

我开始研究 PowerShell 模型和管理单元开发我注意到的第一件事是引用 System management automation dll 然而在 Visual Studio 中 NET 选项卡没有该程序集也无法浏览到 C win
如何刷新Google地图中的坐标？

我可以在点击刷新按钮时刷新谷歌地图但它显示的是旧坐标在某些区域它显示矩形图像其中有十字图像错误在哪里或者我必须对其进行哪些修改这是我的代码 public class GmapActivity extends MapActivit
Julia：为什么共享内存多线程没有给我带来加速？

我想在 Julia 中使用共享内存多线程正如 Threads threads 宏所做的那样我可以使用 ccall jl threading run 来执行此操作虽然我的代码现在并行运行但我没有获得预期的加速以下代码旨在作为我正在采
是否可以保证使用 @PostConstruct 注解的方法先于同一 bean 中使用 @Scheduled 的方法执行？

假设我正在定义一个缓存 bean 它将在应用程序启动时初始化并以固定的时间间隔刷新如下所示 Component public class Cache PostConstruct public void initializeCache S
如何检查没有。使用 MYSQLI_STMT_PREPARE 和 MYSQLI_FETCH_ARRAY 时返回的行数？

我以为我可以用MYSQLI STMT NUM ROWS and MYSQLI STMT STORE RESULT检查是否有返回的行数参见注释行 1 2 3 但在下面的上下文中似乎并非如此此代码确实有效没有注释行但我试图添加额外的检
python 按周或月分割 pandas 数据框，并根据这些 sp 对数据进行分组

DateOccurred CostCentre TimeDifference 03 09 2012 2073 28138 03 09 2012 6078 34844 03 09 2012 8273 31215 03 09 2012 8367
Pandas 在读取 CSV 之前忽略前几行

我正在使用 Pandas 库和 Python 我有一个 Excel 文件在 Excel 工作表的顶部有一些标题信息我不需要这些信息来提取数据但是标题信息可能需要更长的行因此无法预测它有多长所以我的数据提取应该从 ID 的地方开

Pandas 在读取 CSV 之前忽略前几行

Pandas 在读取 CSV 之前忽略前几行 的相关文章

随机推荐

热门标签

Pandas 在读取 CSV 之前忽略前几行的相关文章