用 pandas 解析打印精美的表格数据

2024-02-17

复制包含不同分隔符、列名中的空格等的表的最佳方法是什么？该函数pd.read_clipboard()无法自行管理此任务。

示例1：

| Age Category | A | B  | C  | D |
|--------------|---|----|----|---|
| 21-26        | 2 | 2  | 4  | 1 |
| 26-31        | 7 | 11 | 12 | 5 |
| 31-36        | 3 | 5  | 5  | 2 |
| 36-41        | 2 | 4  | 1  | 7 |
| 41-46        | 0 | 1  | 3  | 2 |
| 46-51        | 0 | 0  | 2  | 3 |

预期结果：

 Age Category  A  B   C   D    
 21-26         2  2   4   1 
 26-31         7  11  12  5 
 31-36         3  5   5   2 
 36-41         2  4   1   7 
 41-46         0  1   3   2 
 46-51         0  0   2   3

EDIT:

示例2：

+---+---------+--------+
| id|firstName|lastName|
+---+---------+--------+
|  1|     Mark|   Brown|
|  2|      Tom|Anderson|
|  3|   Joshua|Peterson|
+---+---------+--------+

预期结果：

   id firstName  lastName
0   1      Mark     Brown
1   2       Tom  Anderson
2   3    Joshua  Peterson

我寻找一种可以应用于最常见表类型的通用方法。

之所以如此复杂，是因为这些类型的 ASCII 表在设计时并未真正考虑到数据传输。它们的真正功能是以视觉上令人愉悦的方式描绘数据。

这并不意味着不能用它来转移到 pandas 中！让我们从.read_clipboard():

df = pd.read_clipboard(sep='|').iloc[1:,1:-1]

我们定义的不是使用逗号作为（默认）分隔符|作为分隔符。

The .iloc[1:,1:-1]去掉第一行（-----------）和第一列和最后一列：因为尾随|在每行的开头和结尾pandas在那里看到一个“空”列。

现在剩下的就是从列名和值中去除空格：

stripped_columns = []
for column_name in df.columns:
    df[column_name] = df[column_name].str.strip()
    stripped_columns.append(column_name.strip())
df.columns = stripped_columns

如果你想要Age Category成为你的索引：

df.set_index('Age Category', inplace=True)

我要做的最后一步是确保所有列现在实际上保存的是数字而不是字符串：

df = df.astype('int')

导致：

<class 'pandas.core.frame.DataFrame'>
Index: 6 entries, 21-26 to 46-51
Data columns (total 4 columns):
A    6 non-null int64
B    6 non-null int64
C    6 non-null int64
D    6 non-null int64
dtypes: int64(4)
memory usage: 400.0+ bytes

我不确定您从剪贴板中读取它的原因是什么。更优雅的解决方案可能是将其粘贴到.csv归档并使用更高级的功能.read_csv() https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html必须提供。然而，必要的转变将保持不变。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

clipboard

copypaste

用 pandas 解析打印精美的表格数据的相关文章

带有指针数组的 cython

我在 python 中有一个 numpy ndarrays 列表具有不同的长度并且需要非常快速地访问 python 中的列表我认为指针数组就可以解决问题我试过 float type t list of arrays no of ar
美丽的汤从谷歌搜索中提取href

谷歌搜索给出了以下 HTML 的第一个结果 h3 class r a href https rads stackoverflow com amzn click com 0470284889 class l vst em Quantitati
如何使用 pandas 选择所有非 NaN 列和非 NaN 最后一列？

如果标题有点令人困惑请原谅我假设我有test h5 下面是使用读取该文件的结果df read hdf test h5 testdata 0 1 2 3 4 5 6 0 123 444 111 321 NaN NaN NaN 1 12 2
帮助需要在可选条件下编写正则表达式[关闭]

我有一个日志文件包含如下内容 log Using data from yyyy mm dd 2011 8 3 0 files queued for scanning Warning E test H ndler pdf File not F
静态文件配置不正确

我已经在 Heroku 上部署了简单的博客应用程序它运行在Django 1 8 4 我在静态文件方面遇到了一些问题当打开我的应用程序时我看到Application Error页面所以我尝试调试它并发现当我提交到 Heroku 时它无
Python 小数.InvalidOperation 错误

当我运行这样的东西时我总是收到此错误 from decimal import getcontext prec 30 b 2 3 Decimal b Error Traceback most recent call last File Te
使用字母而不是数字进行顺序计数[重复]

这个问题在这里已经有答案了我需要一种方法将字符串递增到 z 然后将 aa 递增到 az 然后将 ba 递增到 bz 依此类推就像 Excel 工作表中的列一样我将向该方法提供前一个字符串它应该增加到下一个字母 PSEUDO C
Pandas Pivot_Table ：非数字值的行计算百分比

这是我在数据框 df 中的数据 Document Name Time SPS2315511 A 1 HOUR SPS2315512 B 1 2 HOUR SPS2315513 C 2 3 HOUR SPS2315514 C 1 HOUR S
在函数调用之间保存数据的Pythonic方式是什么？

对我来说上下文是我需要在调用修改该值的函数之间保留的单个 int 的信息我可以使用全局但我知道这是不鼓励的现在我使用了包含 int 的列表形式的默认参数并利用了可变性以便在调用之间保留对值的更改如下所示 def increm
Selenium：等到 WebElement 中的文本发生变化

我在用着selenium使用Python 2 7 从网页上的搜索框检索内容搜索框动态检索结果并在框本身中显示结果 from selenium import webdriver from selenium webdriver common
如何使用 msgpack 进行读写？

如何序列化反序列化字典data with msgpack http msgpack org The Python 文档 http msgpack python readthedocs io en latest badge latest似乎
如何在matplotlib中基于x轴更改直方图颜色

我有根据 pandas 数据框计算出的直方图我想根据 x 轴值更改颜色例如 If the value is 0 the color should be green If the value is gt 0 the color shoul
为 Python 2.4 改进“with”语句的直接替换

您能否建议一种方法来编写可在 Python 2 4 中使用的 with 语句的直接替换代码这将是一个 hack 但它可以让我更好地将我的项目移植到 Python 2 4 EDIT 删除了不相关的元类草图只需使用 try finally
如何使用数据库在 Django 中的应用程序之间交换数据？

我正在使用 Django 在网络上工作我创建了 2 个应用程序第一个用于客户端注册并将其数据添加到数据库第二个应用程序供用户访问和查看交互界面这个想法是使用第二个应用程序从数据库中的客户端获取数据并使用它向用户显示一些信息我的问
网页抓取 - 如何识别网页上的主要内容

给定一个新闻文章网页来自任何主要新闻来源例如时报或彭博社我想识别该页面上的主要文章内容并丢弃其他杂项元素例如广告菜单侧边栏用户评论在大多数主要新闻网站上都可以使用的通用方法是什么有哪些好的数据挖掘工具或库最好是基于Py
从 C 线程调用 Python 代码

我对从 C 或 C 线程调用 Python 代码时如何确保线程安全感到非常困惑 The Python 文档 http docs python org c api init html non python created threads似乎是
如何让你的精灵在pygame中跳跃

目前我已经制作了一个平台游戏可以左右移动我的角色他从地上开始关于如何让他跳的任何想法因为我不明白目前如果我按住向上键我的玩家精灵将连续向上移动或者如果我按下它我的玩家精灵将向上移动并保持向上我想找个办法远离他让我重新跌
使 matplotlib 图形默认看起来像 R？

Is there a way to make matplotlib behave identically to R or almost like R in terms of plotting defaults For example R t
C# 粘贴到文本框时检查剪贴板中的字符

有没有一些方法可以在粘贴到文本框 C 之前仅检查剪贴板中的字符 Ctrl V 和右键单击 gt 粘贴但不使用 MaskedTextbox 在文本框文本更改中添加规则以仅接受数字例如 private string value privat
如何动态创建 Luigi 任务

我正在为 Luigi Tasks 构建一个包装器但遇到了一个障碍Register http luigi readthedocs io en stable modules luigi task register html Register该

随机推荐

我可以让 javascript 同时做两件事吗？

我有一个奇怪的需求我想在 javascript 中执行以下操作当一个函数被调用时我想要更改 DIV 的颜色并然后 1 2 秒后我想把它改回来与 1 同时我会比如进行 Ajax 调用电话通常需要一秒钟换句话说我希望步骤
木偶在循环中添加数组元素

我想要这样的东西 ssl domains dev mydomain com admin api web each site tom jeff harry each developer ssl domains lt lt site devel
使用 Chef 时主管打开文件限制不会改变

我正在机器上修改 etc security limits conf 然后在 Chef 配方中安装 Supervisor 菜谱运行完成后如果我运行cat proc
DNSPython 异步解析超时，但同步解析不会超时

我在 Python 3 9 7 x64 dnspython 2 1 0 和 Windows 10 21H1 上执行了测试问题很简单 dns resolver Resolver 工作正常但不dns asyncresolver Resolve
使用相同的密钥签署两个应用程序

我构建了两个应用程序第一个应用程序 com pakname pak1 第二个应用程序使用 com pakname pak2 包名称然后我得到了一个密钥 mykey keystore 如果我使用相同的密钥对这两个应用程序进行签名并将它们发
在手机上自动播放视频？ Facebook Home 做到了。我缺少什么？

我正在尝试将视频添加到我的主页来代替滑块我了解移动设备如何以及为何禁用自动播放但是 FacebookHome 和 Youtube 将在移动设备上自动播放 https bg bg facebook com home https bg bg
在 Firemonkey 中获取应用程序路径

因此在 VCL 中可以使用以下代码行来检索应用程序路径 ExtractFilePath Application ExeName 我尝试了同样的 Firemokey 我注意到 ExeName 不再可用我可以使用什么代码来替代这个尝试使
导轨型号

我有一个名为 test rb 的模型当我在控制器中使用 tests Test new 时出现以下错误有人可以告诉我如何解决这个问题吗测试模块的未定义方法新如果您认为存在命名冲突则看起来 test 已经是名为 Test 的模块
如何使用-webkit-animation - 向外环创建脉冲效果

我找到了这篇文章 http www zurb com article 221 css3 animation will rock your world http www zurb com article 221 css3 animation
像编辑文本一样的旋转器

我有一个带有 TextInputLayout TextInputEditText 和微调器的表单我想要微调器高度换行文本但下拉列表中有大项目问题是微调器的高度取决于下拉项的高度 simple spinner dropdown item
JavaFX：使用REST服务并在前端显示数据

我正在开发一个 JavaFX 在带有 SceneBuilder 的 JDK8 上项目该项目应该与基于 Spring MVC 的服务器连接我想从服务器访问一些对象并显示它我已经对 Spring 服务器进行了编程以根据请求返回所需的对
为什么 Type.GetFields() 不返回基类中的支持字段？

在 C 中如果您使用Type GetFields 对于表示派生类的类型它将返回 a 派生类中所有显式声明的字段 b 派生类中自动属性的所有支持字段以及 c 基类中所有显式声明的字段为什么基类中自动属性的 d 支持字段缺失 Exampl
适用于（嵌入式 C/C++）开发人员的 Eclipse IDE 2020-12：经典深色主题深黑色背景和菜单中的文本

Eclipse 2020 12 4 18 中 C C 的深色经典主题存在问题菜单全黑顶部面板也有同样的问题那是一个bugEclipse TMF 默认包含在面向 C C 开发人员的 Eclipse IDE and the 面向嵌入式
将 JavaScript 日期转换为 .NET 日期的最佳方法

我在 JavaScript 中有一个日期它的值是这样的 2011 年 4 月 1 日星期五 05 00 00 GMT 0530 印度标准时间现在将日期转换为 NET 日期的最佳方法是什么请注意我的客户端用户可以位于世界各地我将从那
如何在 Javascript 中向用户显示是/否消息框？

如何在 Javascript 客户端向用户显示是否消息框我不想向用户显示确定和取消这是默认行为confirmJavaScript 中的函数任何帮助将不胜感激您无法修改默认确认框的确定取消但您可以使用第 3 方库例如
Python 中的指针？ ` x.pointerDest = y.pointerDest`?

我正在把我的老问题分成几个部分因为它非常混乱here https stackoverflow com questions 4590407 how can i evaluate variable to another variable be
在 C# 中使用属性反序列化 XML

我在反序列化 API 调用的 XML 响应时遇到问题我的选项对象的属性描述为空下面是 XML 的示例
检查用户是否通过 django TokenAuthentication 进行身份验证

我正在尝试使用 DRF 开发 REST APITokenAuthentication 这将在 Android 应用程序中使用我能够对用户进行身份验证并检索其令牌我现在遇到的问题是以下视图 csrf exempt def foo requ
将 blob (.bacpac) 转换为 .bacpac 文件以将数据库导入到 SQL Server Azure？

在 Azure 中使用 MVC C 时我需要从存储在 blob 存储中的 bacpac 文件恢复数据库我正在使用 DAC Framework API 从 Blob 存储访问 bacpac Issue DacServices Import
用 pandas 解析打印精美的表格数据

复制包含不同分隔符列名中的空格等的表的最佳方法是什么该函数pd read clipboard 无法自行管理此任务示例1 Age Category A B C D 21 26 2 2 4 1 26 31 7 11 12 5 31 36

用 pandas 解析打印精美的表格数据

用 pandas 解析打印精美的表格数据 的相关文章

随机推荐

热门标签

用 pandas 解析打印精美的表格数据的相关文章