Python循环遍历Excel表格，放入一个df中

2024-01-03

我有一个 Excel 文件foo.xlsx约40张sh1, sh2等。每张纸的格式为：

area      cnt   name\nparty1   name\nparty2
blah      9         5               5
word      3         7               5

在每张表中，我想用以下格式重命名变量name\nparty只拥有party作为标签。输出示例：

area      cnt    party1    party2     sheet
bacon     9         5         5        sh1
spam      3         7         5        sh1
eggs      2         18        4        sh2

我正在阅读文件：

book = pd.ExcelFile(path)

然后想知道我是否需要这样做：

for f in filelist:
    df = pd.ExcelFile.parse(book,sheetname=??)
    'more operations here'
    # only change column names 2 and 3
     i, col in enumerate(df):
     if i>=2 and i<=3:
        new_col_name = col.split("\n")[-1]
        df[new_col_name] =

或类似的东西？

The read_excel的方法pandas如果您设置关键字参数，则可以一次读取所有工作表sheet_name=None（在某些旧版本中pandas这被称为sheetname）。这将返回一个字典 - 键是工作表名称，值是作为数据帧的工作表。

使用它，我们可以简单地循环字典并：

向包含相关工作表名称的数据框添加额外的列
Use the rename重命名我们的列的方法 - 通过使用lambda，我们只需在出现新行时获取通过拆分每个列名称而获得的列表的最终条目。如果没有换行，则列名不变。
追加到列表中，在末尾合并。

完成此操作后，我们将所有工作表合并为一张pd.concat。然后我们重置索引，一切都会好起来的。注意：如果您在一张纸上有参与方，但没有其他参与方，这仍然有效，但会用以下内容填充每张纸的任何缺失列NaN.

import pandas as pd

sheets_dict = pd.read_excel('Book1.xlsx', sheet_name=None)

all_sheets = []
for name, sheet in sheets_dict.items():
    sheet['sheet'] = name
    sheet = sheet.rename(columns=lambda x: x.split('\n')[-1])
    all_sheets.append(sheet)

full_table = pd.concat(all_sheets)
full_table.reset_index(inplace=True, drop=True)

print(full_table)

Prints:

    area  cnt  party1  party2   sheet
0  bacon    9       5       5  Sheet1
1   spam    3       7       5  Sheet1
2   eggs    2      18       4  Sheet2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python循环遍历Excel表格，放入一个df中的相关文章

从 Azure ML 实验中访问 Azure Blob 存储

Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块但是我需要将 JSON 文件写入 blob 存储由于没有模块可以执行此操作因此我尝试在Ex
使用 Django 将文件异步上传到 Amazon S3

我使用此文件存储引擎在上传文件时将文件存储到 Amazon S3 http code welldev org django storages wiki Home http code welldev org django storages w
Series.sort() 和 Series.order() 有什么区别？

s pd Series nr randint 0 10 5 index nr randint 0 10 5 s Output 1 3 7 6 2 0 9 7 1 6 order 按值排序并返回一个新系列 s order Output 2 0
如何确保 re.findall() 停止在正确的位置？

这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
如何使用 Rrank() 函数创建新的ties.method？ [复制]

这个问题在这里已经有答案了我试图按人口和日期排序这个数据框所以我使用order and rank 功能 gt df lt data frame idgeoville c 5 8 4 3 4 5 8 8 date c rep 1950 4
Python Anaconda：如何测试更新的库是否与我现有的代码兼容？

我在 Windows 7 机器上使用 Python 2 7 Anaconda 安装进行数据分析和科学计算当新的库发布时例如新版本的 pandas patsy 等您建议我如何测试新版本与现有代码的兼容性是否可以在同一台机器上安装两个
Paste.httpserver 并通过 HTTP/1.1 Keep-alive 减慢速度；使用 httperf 和 ab 进行测试

我有一个基于paste httpserver 的Web 服务器作为HTTP 和WSGI 之间的适配器当我使用 httperf 进行性能测量时如果每次使用 num conn 启动一个新请求我每秒可以执行超过 1 000 个请求如果我使
Spark 和 Python 使用自定义文件格式/生成器作为 RDD 的输入

我想问一下 Spark 中输入的可能性我可以看到从http spark apache org docs latest programming guide html http spark apache org docs latest pro
python中basestring和types.StringType之间的区别？

有什么区别 isinstance foo types StringType and isinstance foo basestring 对于Python2 basestring是两者的基类str and unicode while type
给定一个排序数组，就地删除重复项，使每个元素仅出现一次并返回新长度

完整的问题我开始在线学习 python 但对这个标记为简单的问题有疑问给定一个排序数组就地删除重复项使得每个元素只出现一次并返回新的长度不分配另一个数组的额外空间您必须通过修改输入来完成此操作数组就地具有 O 1 额外内
Excel：COUNTIF 函数将“小于”字符视为运算符

预读说明我使用的是 LibreOffice 而不是 Excel 但大多数功能应该适用于两者我正在制作一个电子表格其中有大量数据对于每个属性例如员工数量或姓名我需要一个函数来计算包含每个不同值的行数我已经提取了不同的值现在我使
在骨架图像中查找线 OpenCV python

我有以下图片我想找到一些线来进行一些计算平均长度等我尝试使用HoughLinesP 但它找不到线我能怎么做这是我的代码 sk skeleton mask rows cols sk shape imgOut np zeros row
Python 中维基百科 API 中的 DisambiguationError 和 GuessedAtParserWarning

我想获得维基百科与搜索词相关的可能且可接受的名称列表在这种情况下是电晕当输入以下内容时 print wikipedia summary Corona 这给出了以下输出 home virej local lib python3 8 si
使用 Python 将连续日期分组在一起

Given dates datetime 2014 10 11 datetime 2014 10 1 datetime 2014 10 2 datetime 2014 10 3 datetime 2014 10 5 datetime 201
XPath：通过当前节点属性选择当前和下一个节点的文本

首先这是从我之前的问题 https stackoverflow com questions 5202187 xpath select current and next nodes text by current node attribut
如何给URL添加变量？

我正在尝试从网站收集数据我有一个 Excel 文件其中包含该网站的所有不同扩展名 F i www example com example2 我有一个脚本可以成功从网站中提取 HTML 但现在我想为所有扩展自动执行此操作然而当我说 s
如何从namedtuple实例列表创建pandas DataFrame（带有索引或多索引）？

简单的例子 from collections import namedtuple import pandas Price namedtuple Price ticker date price a Price GE 2010 01 01 30
pandas 中数据帧中的随机/洗牌行

我目前正在尝试找到一种方法来按行随机化数据框中的项目我在 pandas 中按列洗牌排列找到了这个线程在 pandas 中对 DataFrame 进行改组排列 https stackoverflow com questions 157
python从二进制文件中读取16字节长的双精度值

我找到了蟒蛇struct unpack 读取其他程序生成的二进制数据非常方便问题如何阅读16 字节长双精度数出二进制文件以下 C 代码将 1 01 写入二进制文件三次分别使用 4 字节浮点型 8 字节双精度型和 16 字节长双精度型
无法安装最新版本的 Numpy (1.22.3)

我正在尝试安装最新版本的 numpy 即 1 22 3 但看起来 pip 无法找到最后一个版本我知道我可以从源代码本地安装它但我想了解为什么我无法使用 pip 安装它 PS 我有最新版本的pip 22 0 4 ERROR Could n

随机推荐

埃米特覆盖片段

我一直在关注 Jeffery Way 在 Tuts 上提供的有关 HTML 和 CSS 的课程 http learncss tutsplus com http learncss tutsplus com 我观看了有关 Zen Coding
使用 lambda 和流按值对映射进行排序

我是 Java 8 的新手不知道如何使用流及其排序方法如果我有如下所示的地图如何使用 Java 8 按值对该地图进行排序以仅获取前 10 个条目 HashMap
使 JQuery Validation 插件评估变得非惰性

根据 JQuery 验证插件的文档验证是惰性的在第一次提交表单之前用户可以通过选项卡浏览字段而不会收到烦人的消息有没有什么方法可以在用户通过表单选项卡时显示消息 Cheers 您可以覆盖默认值onfocusout http docs
无法从 .net 中的 JSON 响应中删除 .d 封装

即使在发表了精彩的博客文章之后再也不用担心 ASP NET AJAX 的 d http encosia com simplify calling asp net ajax services from jquery 我无法逃避 JSON 响应
如何避开 Google Directions API 中的限制收费站和高速公路？

谷歌路线API http code google com apis maps documentation directions Restrictions让我们能够尝试通过提供参数来避免通行费 avoid tolls 另外我们还可以尝试通过
闪亮面板中的 LaTeX 公式

我想在闪亮的面板中显示 LaTeX 格式的公式但我找不到组合的方法textOutput with withMathJax 我尝试了以下方法但没有成功任何帮助将不胜感激 ui r tabPanel Diagnostics h4 tex
TableModel 与 ColumnModel：谁拥有列值？

有什么区别JTable getModel getColumnName and JTable getColumnModel getColumn index getHeaderValue 两者似乎没有共享任何数据我的猜测是TableModel
Ruby / Rails：如何通过 rforce gem 通过一次 API 调用在 salesforce 中创建多条记录？

我正在使用rforce https github com undees rforcegem 在我的 Salesforce 数据库中创建记录 rforce文档中创建记录的示例是 opportunity type Opportunity acc
在用户不知情的情况下使用前置摄像头拍摄照片

我想通过前置摄像头捕获图片而用户不知道他在身份验证失败时被捕获有人可以建议我该怎么做吗谢谢柴坦亚 K 不确定但可以尝试这段代码是Android 拍照而不显示预览 http www 41post com 3794 programmi
接受特定范围内用户的日期

我有一个表格我只想通过它接受给定日期范围内的日期但是无论我获取哪个日期它都会返回 false 并显示不正确的范围以下是相关代码注册 html div class form group row div
如何在 .NET 中生成版本 1 Guid？

据我了解在 Windows 2000 或类似版本中依赖于时间戳和 MAC 地址的版本 1 Guid 已被版本 4 更加随机所取代如果我更喜欢版本 4 而不是版本 1 从 Net 生成版本 1 guid 的最简单方法是什么 I do希
Maven：如果配置文件 B 未激活，则仅激活配置文件 A？

我有两个 Maven 配置文件 profile A 和 profile B 仅当 A 未激活时才应激活 B 所以如果我打电话 mvn install 执行配置文件 B 但不执行配置文件 A 但如果我打电话 mvn install Pprof
错误：安装 mysql2 时出错：错误：无法构建 gem 本机扩展

我在尝试为 Rails 安装 gem install mysql2 v 0 3 17 时遇到一些问题当我尝试通过运行 gem install mysql2 v 0 3 17 或 gem install mysql2 v 0 3 17 来安
getLoginStatus javascript facebook 在页面重新加载时消失

我实现了 facebook connect 并且工作正常该函数在登录后返回我的名字 FB getLoginStatus function response if response response status connected FB
.onload 从 Firefox 扩展调用多次

我正在开发一个 Firefox 扩展并具有以下代码 function initialize For accessing browser window from sidebar code var mainWindow window Query
IE 中的事件处理

我下面包含的代码允许我在用户第一次将鼠标悬停在元素上时执行某些操作然后删除该事件它在 W3C 事件模型浏览器中运行良好但在 IE6 8 中不断抛出错误我从另一个问题中得到了代码并相信它可以处理 IE 有人看到我做错了什么吗
如何使用 Tesseract OCR 从图像中读取表格数据？

有谁知道如何从图像中读取和解析任何表格数据我正在使用 asp net 应用程序并且已使用 Tesseract OCR API 成功读取数据但无法从图像读取表格请用c 代码给出解决方案 None
在 div 上使用 .FindControl() 失败

我有一个 html div 元素其中包含多个 div 其值我想放入数组服务器端我的 html div 看起来像 div div class box 2 div div class box 1 div div class box 3 di
jQuery：如何找到第一个可见的输入/选择/文本区域（不包括按钮）？

I tried input not input type button input type submit button visible first 但它没有找到任何东西我的错误是什么 UPD 我在 document load 上执行此操
Python循环遍历Excel表格，放入一个df中

我有一个 Excel 文件foo xlsx约40张sh1 sh2等每张纸的格式为 area cnt name nparty1 name nparty2 blah 9 5 5 word 3 7 5 在每张表中我想用以下格式重命名变量nam

Python循环遍历Excel表格，放入一个df中

Python循环遍历Excel表格，放入一个df中 的相关文章

随机推荐

热门标签

Python循环遍历Excel表格，放入一个df中的相关文章