pandas 相当于 R dcast

2024-04-22

我有一些这样的数据：

import pandas as pd
df = pd.DataFrame(index = range(1,13), columns=['school', 'year', 'metric', 'values'], )
df['school'] = ['id1']*6 + ['id2']*6
df['year'] = (['2015']*3 + ['2016']*3)*2
df['metric'] = ['tuition', 'admitsize', 'avgfinaid'] * 4
df['values'] = range(1,13)
df
   school  year     metric  values
1     id1  2015    tuition       1
2     id1  2015  admitsize       2
3     id1  2015  avgfinaid       3
4     id1  2016    tuition       4
5     id1  2016  admitsize       5
6     id1  2016  avgfinaid       6
7     id2  2015    tuition       7
8     id2  2015  admitsize       8
9     id2  2015  avgfinaid       9
10    id2  2016    tuition      10
11    id2  2016  admitsize      11
12    id2  2016  avgfinaid      12

我想将指标和值列转换为宽格式。也就是说，我想要：

school  year  tuition  admitsize  avgfinaid
   id1  2015        1          2          3
   id1  2016        4          5          6
   id2  2015        7          8          9
   id2  2016       10         11         12

如果这是 R，我会这样做：

df2 <- dcast(df, id + year ~ metric, value.var = "values")

我该如何在熊猫中做到这一点？我读过了这个（否则非常有帮助）所以答案 https://stackoverflow.com/questions/25618650/r-dcast-equivalent-in-python-pandas and 这个（在其他方面也很出色）示例 http://pandas.pydata.org/pandas-docs/stable/comparison_with_r.html在 pandas 文档中，但没有理解如何将其应用到我的需求。我不需要像 dcast 这样的单行代码，只需一个如何在标准 DataFrame（不是 groupby、多索引或其他奇特对象）中获取结果的示例。

您可以使用数据透视表（） http://pandas.pydata.org/pandas-docs/stable/generated/pandas.pivot_table.html:

In [23]: df2 = (df.pivot_table(index=['school', 'year'], columns='metric',
   ....:                       values='values')
   ....:          .reset_index()
   ....:       )

In [24]:

In [24]: df2
Out[24]:
metric school  year  admitsize  avgfinaid  tuition
0         id1  2015          2          3        1
1         id1  2016          5          6        4
2         id2  2015          8          9        7
3         id2  2016         11         12       10

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pandas 相当于 R dcast 的相关文章

无法安装时间模块

我试过了pip install time and sudo H pip install time 但我不断收到错误找不到满足要求时间的版本从版本未找到时间匹配的发行版我正在 PyCharm 中工作但真正没有意义的是我可以在 Py
如何用xlrd读取公式

我正在尝试做一个解析器它读取几个 Excel 文件我通常需要位于行底部的值您可以在其中找到所有上部元素的总和因此单元格值实际上是 sum 或 A5 0 5 可以说对于使用 Excel 打开此文件的用户来说它看起来像一个数字这
为 PyCharm 中的所有配置设置相同的环境变量

我有一个与 Celery 和很多不同的工作人员一起的项目如何避免每次将 PyCharm 中的环境变量复制粘贴到每个运行调试配置有什么方法可以在项目设置中设置它们吗找到解决方案here https stackoverflow com
使用 Python 中的 IAM 角色访问 AWS API Gateway

我有一个 AWS API 网关我想使用它来保护其安全IAM 角色 http docs aws amazon com apigateway latest developerguide permissions html 我正在寻找一个包来帮助
使用 Python 解析 XML，解析外部 ENTITY 引用

在我的 S1000D xml 中它指定了一个带有对公共 URL 的引用的 DOCTYPE 该 URL 包含对包含所有有效字符实体的许多其他文件的引用我使用 xml etree ElementTree 和 lxml 尝试解析它并得到解析错
熊猫记忆

我有冗长的计算我重复了很多次因此我想使用记忆诸如jug http packages python org Jug and joblib http packages python org joblib memory html 与Pan
如何检查包含 NaN 的列表 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案在我的 for 循环中我的代码生成一个如下所示的列表 list 0 0 0 0 sum 0 0 0 0 该循环生成所有其他数字向量但它也
如何缩放（标准化）每列内的 ggplot2 stat_bin2d 值（按 X 轴）

我有一个 ggplot stat bin2d 热图 library ggplot2 value lt rep 1 5 1000 df lt as data frame value df group lt rep 1 7 len 5000 d
如何获取 Matplotlib 生成的散点图的像素坐标？

我使用 Matplotlib 生成散点图的 PNG 文件现在对于每个散点图除了 PNG 文件之外我还会also就像生成散点图中各个点的像素坐标列表一样我用来生成散点图 PNG 文件的代码基本上是这样的 from matplotli
计算数据帧 R 中字符串的频率

我想计算数据框中某些字符串的频率 strings lt c pi pie piece pin pinned post df lt as data frame strings 然后我想计算字符串的频率 counts lt c pi in pi
Matplotlib 将颜色图 tab20 更改为三种颜色

Matplotlib 有一些新的且非常方便的颜色图选项卡颜色图 https matplotlib org examples color colormaps reference html 我错过的是生成像 tab20b 或 tab20c 这
如何将reportlab与Google应用程序引擎一起使用

我无法在谷歌应用程序引擎下正确导入reportlab 根据以下guide http blog notdot net 2010 04 Generating PDFs on App Engine Python and introducing M
如何使用to_sql将pandas数据帧写入oracle数据库？

我是一个新的oracle学习者我正在尝试将 pandas 数据帧写入 oracle 表中经过网上研究我发现代码本身很简单但我不知道为什么我的代码不起作用我已经从本地文件中读取了 pandas 数据框 import cx Oracl
Python：如何从文件中的一行读取字符并将它们转换为浮点数和字符串，具体取决于它们是数字还是字母？

我有一个如下所示的文件 1 1 C C 1 9873 2 347 3 88776 1 2 C Si 4 887 9 009 1 21 我想逐行读取文件的内容当我使用的行上只有数字时 for line in readlines file d
Scikit Learn - K-Means - 肘部 - 标准

今天我想学习一些关于 K means 的知识我已经了解该算法并且知道它是如何工作的现在我正在寻找正确的 k 我发现肘部准则作为检测正确的 k 的方法但我不明白如何将它与 scikit learn 一起使用在 scikit learn
DRF：以编程方式从 TextChoices 字段获取默认选择

我们的网站是 Vue 前端 DRF 后端在一个serializer validate 方法我需要以编程方式确定哪个选项TextChoices类已被指定为模型字段的默认值 TextChoices 类缩写示例 class PaymentM
获取运行云功能的运行时服务帐户

有没有办法以编程方式从云功能获取运行时服务帐户的电子邮件我知道我可以猜测默认的 App Engine 帐户因为它始终是 appspot gserviceaccount com 但这不是我想要的我本来期待有一些环境变量 https
Django - 缺少 1 个必需的位置参数：'request'

我收到错误 get indiceComercioVarejista 缺少 1 个必需的位置参数要求当尝试访问 get indiceComercioVarejista 方法时我不知道这是怎么回事 views from django ht
将数组从 .npy 文件读入 Fortran 90

我使用 Python 以二维数组例如 X 的形式生成一些初始数据然后使用 Fortran 对它们进行一些计算最初当数组大小约为 10 000 x 10 000 时 np savetxt 在速度方面表现良好但是一旦我开始增加数组的维
从 Flask 中的 S3 返回 PDF

我正在尝试在 Flask 应用程序的浏览器中返回 PDF 我使用 AWS S3 来存储文件并使用 boto3 作为与 S3 交互的 SDK 到目前为止我的代码是 s3 boto3 resource s3 aws access key id

随机推荐

向 ElasticSearch 术语聚合添加其他字段

索引文档如下 id 1 title Blah platform id 84 url http facebook com title Facebook 我想要的是按平台计数和输出统计数据为了计数我可以使用术语聚合platform id作为
Eclipse 3.7 的 JProbe 插件

如何将 jprobe 插件添加到 Eclipse 3 7 中我还下载了 Quest Eclipse Plug in 901 但不知道现在该怎么办 Maybe or JProbe Eclipse 插件安装 http www quest co
在网页上获取 POST 答案的 cUrl 替代方案

我想获取特定表单提交的结果网页此表单使用 POST 因此我当前的目标是能够将 POST 数据发送到 url 并在变量中获取结果的 HTML 内容我的问题是我无法使用 cUrl 未启用这就是为什么我要求您了解是否可以使用其他解决方案提
PyCharm - 如何自动将项目中的所有标识符重命名为snake_case？

我有一个相当大的 Python 项目略多于 3000 行不幸的是语法不尊重现在需要的 PEP8 我正在特别寻找重命名所有函数的方法camelCase风格为snake case style 到目前为止我只发现这个答案 https int
jquery div元素的索引

我有以下 html div class rows div class row div div
如何使用SqlAlchemy通过id查询数据库？

我需要通过其查询 SQLAlchemy 数据库id类似的东西 User query filter by username peter 但对于身份证我该怎么做呢通过 Google 和 SO 搜索没有帮助查询有一个获取函数 https d
将第 3 方库添加到 Eclipse 插件

在 Eclipse 插件中包含附加 JAR 文件的正确方法是什么我自己的插件需要 apache commons io 我将 JAR 复制到我的插件目录中并通过插件清单的依赖项选项卡添加它这对我有用但我的插件的其他用户将必须手动下
在 IE 中可以打开文件输入对话框并上传 onchange 吗？

这基本上是我现在所拥有的简化
诗农假服务器不自动响应

您好我正在使用 fetch 测试一个集合当我调用它时只有在调用 server response 后假服务器才没有应答我得到了所需的结果这是为什么 My code beforeEach function server sinon
无法在 Ubuntu 14.04 LTS 上的 wget 上建立 SSL 连接

我尝试通过 wget 下载图像但出现错误无法建立 SSL 连接 wget https www website com image jpg 2015 02 26 01 30 17 https www website com image j
如何修复 CI/CD 上的 SSH Webpack 构建超时 (Gitlab)

我已经创建了与 Gitlab 的 CI CD 集成并且在运行 CI CD 时一直拖延 webpack 和资产的最终编译这是针对 Linux 16 04 t2 small AWS 实例的我很好奇这是否是内存处理器问题尽管如果我通过
Spring Security @PreAuthorize 基于自定义布尔属性值[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个应用程序用户在其中输入自定义角色名称和权限例如用户可以创建一个名为 Human Resources 具有以下属性 sho
PHP - 检查命名空间内是否存在全局类

如果您位于另一个类的命名空间内如何通过 class exists 检查全局类是否存在例如
使用 Spark 结构化流进行实时数据标准化/归一化

在实现机器学习算法时标准化归一化数据即使不是关键也是至关重要的一点使用 Spark 结构化流以实时方式执行此操作是过去几周我一直试图解决的问题使用StandardScaler估计器 value i mean standard de
将地址转换为（id）有副作用吗？？？地址 0xbfffe8d0 很特殊吗？（已修复：问题与 _NSCallStackArray 相关）

下面的代码行导致我的程序以一种非常奇怪的方式中断 id foo id 0xbfffe8d0 然而这没有问题 int foo int id 0xbfffe8d0 即使这样也没有问题 int magicAddr 0xbfffe8d0 id f
PostgreSQL 9.3：数据透视表查询

我想显示下表的数据透视表交叉表 Table Employee CREATE TABLE Employee Employee Number varchar 10 Employee Role varchar 50 Group Name var
phonegap 文档中出现的 EDGE api 是什么？

我正在查看phonegap api 文档我碰到EDGE在版本下拉列表中我用谷歌搜索了常规phonegap版本api和EDGE 但却找不到什么强力的东西有人可以告诉我这件事吗 Edge 应该是最新版本下一个版本正在进行的工作
JQuery - 显示错误和正确的验证图标

我有一个表单和 JQuery 验证一切正常我不想显示消息而是想显示图标错误的图标可以正常工作但我在使用正确的图标时遇到了一些问题当输入格式正确时我看到class valid 在语法中
从 IntelliJ 调试 Grails 应用程序

我一直在努力从 IntelliJ 内部调试 Grails 2 5 0 应用程序具体来说我发现很难配置该应用程序以便功能测试可调试可以运行功能测试该应用程序可以调试该应用程序可以运行当 1 和 2 从 IntelliJ 版本
pandas 相当于 R dcast

我有一些这样的数据 import pandas as pd df pd DataFrame index range 1 13 columns school year metric values df school id1 6 id2 6 d

pandas 相当于 R dcast

pandas 相当于 R dcast 的相关文章

随机推荐

热门标签