Pandas 使用列作为后缀进行透视

2024-04-24

我有一个类似于以下示例的数据框：

Id	Type	Value_1	Value_2
1234	A	1	2
1234	B	1	2
789	A	1	2
789	B	1	2
567	A	1	2

我想转换以获得以下内容：

Id	Value_1_A	Value_1_B	Value_2_A	Value_2_B
1234	1	1	2	2
789	1	1	2	2
567	1		1

总之：使用“类型”列作为后缀复制值列并将数据帧转换为宽格式。

有没有任何干净、简单的方法可以在 pyspark 数据框或 pandas 上执行此操作？

In pandas我们会pivot https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.pivot.html然后折叠多索引Index.map https://pandas.pydata.org/docs/reference/api/pandas.Index.map.html:

new_df = df.pivot(index='Id', columns='Type')
new_df.columns = new_df.columns.map('_'.join)
# Or with an explicit format string like:
# new_df.columns = new_df.columns.map('{0[0]}_{0[1]}'.format)
new_df = new_df.reset_index()

new_df:

     Id  Value_1_A  Value_1_B  Value_2_A  Value_2_B
0   567        1.0        NaN        2.0        NaN
1   789        1.0        1.0        2.0        2.0
2  1234        1.0        1.0        2.0        2.0

数据框和导入：

import pandas as pd

df = pd.DataFrame({'Id': {0: 1234, 1: 1234, 2: 789, 3: 789, 4: 567},
                   'Type': {0: 'A', 1: 'B', 2: 'A', 3: 'B', 4: 'A'},
                   'Value_1': {0: 1, 1: 1, 2: 1, 3: 1, 4: 1},
                   'Value_2': {0: 2, 1: 2, 2: 2, 3: 2, 4: 2}})

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

PySpark

Pandas 使用列作为后缀进行透视的相关文章

Python Numpy Reshape错误[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我在尝试重塑 3D numpy 数组时遇到一个奇怪的错误数组 x 的形状为 6 10 300 我想将其重塑为 6 3000 我正
如何使用我自己的自定义表单覆盖 django-rest-auth 中的表单？

我正在使用 django rest auth 并尝试通过覆盖表单的方法之一来修复密码重置视图中的错误尽管我已经使用不同的 django rest auth 表单成功完成了类似的操作但我无法让它在这个表单上工作无论我做什么都会使用旧的
在 Jupyter Notebook 中设置环境变量的不同方法

在某些情况下我在 Windows 10 计算机上使用 Jupyter 笔记本我想通过设置环境变量 GOOGLE APPLICATION CREDENTIALS 来向 GCP 进行身份验证我想知道这两种设置环境变量的方式有什么区别当
计算熊猫数据帧几个月的总和

我有一个 pandas 数据框如下所示 ID Year R1 R1 f KAR1 20201001 1 5 KAR1 20201101 2 6 KAR1 20201201 3 7 KAR1 20210101 4 8 KAR1 202102
检查子字符串是否在字符串列表中？

我之前已经找到了这个问题的一些答案但它们对于当前的Python版本来说似乎已经过时了或者至少它们对我不起作用我想检查字符串列表中是否包含子字符串我只需要布尔结果我找到了这个解决方案 word to check or wordlis
Python函数组成

我尝试使用良好的语法来实现函数组合这就是我所得到的 from functools import partial class compfunc partial def lshift self y f lambda args kwargs s
将多索引转换为行式多维 NumPy 数组。

假设我有一个类似于以下示例的 MultiIndex DataFrame多索引文档 http pandas pydata org pandas docs stable advanced html gt gt gt df 0 1 2 3 fir
如果另一列中的值为空，则删除重复项 - Pandas

我拥有的 df Name Vehicle Dave Car Mark Bike Steve Car Dave Steve 我想从名称列中删除重复项但前提是车辆列中的相应值为空我知道我可以使用 df dropduplicates
获取 int() 参数必须是字符串或数字，而不是“Column”- Apache Spark

如果我使用以下代码我会收到此异常 int argument must be a string or a number not Column df df withColumn FY F when df ID substr 5 2 isin
dask apply：AttributeError：“DataFrame”对象没有属性“name”

我有一个参数数据框并对每一行应用一个函数该函数本质上是几个 sql queries 和对结果的简单计算我正在尝试利用 Dask 的多处理同时保持结构和界面下面的例子有效并且确实有显着的提升 def get metrics row
如何将 Pyspark Dataframe 标题设置到另一行？

我有一个如下所示的数据框 col1 col2 col3 id name val 1 a01 X 2 a02 Y 我需要从中创建一个新的数据框使用 row 1 作为新的列标题并忽略或删除 col1 col2 等行新表应如下所示 id na
预测测试图像时出现错误 - 无法重塑大小数组

我正在尝试使用 TensorFlow 和 Keras 在 Python 中进行图像识别并且我已经关注了下面的博客 https stackabuse com image recognition in python with tensorfl
异步异常处理程序：在事件循环线程停止之前不会被调用

我正在我的异步事件循环上设置异常处理程序但是在事件循环线程停止之前它似乎不会被调用例如考虑以下代码 def exception handler loop context print Exception handler called
在 for 循环中访问 itertools 产品的元素

我有一个列表列表是附加 itertools 产品的一些其他结果的结果我想要的是能够使用 for 循环访问列表列表中列表的每个元素但我无法访问所有元素我只能访问最后一个列表的元素结果是一个非常巨大的列表列表例如 1 2 4 3 6
使用 Sphinx 时，如何记录没有文档字符串的成员？

我正在为我发布的包编写文档我发现您的文档越全面人们就越容易找到您的包来使用废话实际上我在充满爱心地编写代码的所有功能和细节方面获得了很多乐趣然而我对如何为类级变量编写与 Sphinx 兼容的文档感到完全困惑特别是我有一些e
通过新数据更新绘图，而不是在 Jupyter 笔记本中制作新绘图

我有一些问题希望你能帮我解决我需要使用下拉小部件创建交互式绘图我可以在其中选择并绘制感兴趣的数据我通过以下方式做到这一点 import plotly graph objects as go import ipywidgets as
如何使用logging.conf文件使用RotatingFileHandler将所有内容记录到文件中？

我正在尝试使用RotatingHandler用于 Python 中的日志记录目的我将备份文件保留为 500 个这意味着我猜它将创建最多 500 个文件并且我设置的大小是 2000 字节不确定建议的大小限制是多少如果我运行下面的代码
使用 Numpy 进行多维批量图像卷积

在图像处理和分类网络中一个常见的任务是输入图像与一些固定滤波器的卷积或互相关例如在卷积神经网络 CNN 中这是一种极其常见的操作我已将通用版本任务减少为 Given 一批 N 个图像 N H W D 和一组 K 个滤镜 K H W
如何在supervisord中设置组？

因此我正在设置 Supervisord 并尝试控制多个进程并且一切正常现在我想设置一个组以便我可以启动停止不同的进程集而不是全部或全无这是我的配置文件的片段 group tapjoy programs tapjoy game1
用 Beautiful Soup 进行抓取：为什么 get_text 方法不返回该元素的文本？

最近我一直在用 python 开发一个项目其中涉及抓取一些网站的一些代理我遇到的问题是当我尝试抓取某个知名代理站点时当我要求 Beautiful Soup 查找 IP 在代理表中的位置时它并没有按照我的预期执行操作我将尝试查找每

随机推荐

如何从 PHP 中的 json 响应中按键提取值 [重复]

这个问题在这里已经有答案了我正在使用 getResponse api 来获取订阅者的最新信息这是之后打印的内容var dump result object stdClass 2 1 updated gt int 1 我如何提取解码编
在 bash 中使用正则表达式从字符串中提取信息

我在 bash 中有一个字符串变量如下所示 SOGoTimeFormat H M SOGoMailShowSubscribedFoldersOnly 0 SOGoMailSignaturePlacement below SOGoLangu
Swift Struct 不符合 Equatable 协议？

如何使结构符合 Equatable 协议我正在使用 Xcode 7 3 1 struct MyStruct var id Int var value String init id Int value String self id id s
列出可用于 gstreamer 1.0 中 ksvideosrc 视频捕获的设备名称

我正在尝试使用 c 中的 gstreamer 1 0 查询 Windows 上可用视频捕获设备网络摄像头的列表我使用 ksvideosrc 作为源我能够捕获视频输入但我无法查询可用设备及其上限的列表在 gstreamer 0
如何在静态方法或自定义类中注入HttpClient？

我想使用角度HttpClient在静态方法或类中在类中不能将其定义为构造函数参数我尝试过类似的东西 export class SomeNotInjectableService static doSomething const injec
Ruby on Rails 3：link_创建新的嵌套资源？

我试图在 Rails 3 应用程序中创建一个链接来创建新的嵌套资源但我无法弄清楚链接到新嵌套资源的语法是什么解决方案确保您的资源正确嵌套在您的路由文件中 resources books do resources chapters e
Amazon S3：授予来自 IP 的匿名访问权限（通过存储桶策略）

我有一个 Amazon S3 存储桶并且希望将其可供特定计算机上的脚本使用而无需部署登录凭证所以我的计划是只允许从该机器的 IP 进行匿名访问我对亚马逊云还很陌生存储桶策略看起来是不错的选择我将以下策略添加到我的存储桶中 Ver
如何解决“允许的最大密钥长度为 900 字节”。

我有以下表结构 CREATE TABLE dbo Signature caption id nvarchar 512 NOT NULL signature id int NOT NULL 我想使用以下 alter 命令添加主键 ALTER
C# 中 System.String[*] 和 System.String[] 的区别

Edit 我知道 C 相当于For Each server As String In servers is foreach var item in servers 但是由于GetOPCServers返回对象应该将其转换为可迭代类型我正在
页面抓取以从谷歌财经获取价格

我试图通过抓取谷歌金融页面来获取股票价格我在 python 中使用 urllib 包然后使用正则表达式来获取价格数据当我让 python 脚本运行时它最初会运行一段时间几分钟然后开始抛出异常 HTTP 错误 503 服务不可用
如何设置“如果对象存在”条件？

有没有办法检查对象是否存在我不断收到需要对象错误我知道该对象不存在如果是这种情况我想绕过我的代码的一部分我不知道什么是我没有尝试过的 var codeName document getElementById testCode
如何阻塞直到BlockingQueue为空？

我正在寻找一种方法来阻止直到BlockingQueue是空的我知道在多线程环境下只要有生产者将物品放入BlockingQueue 可能会出现队列变空几纳秒后又充满项目的情况但是如果只有one生产者那么它可能希望在停止将项目放入
为 iPhone 或 Android 开发？（作为 C# 开发人员）[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何使用 R 提取包含特定人名的句子

我正在使用 R 来提取包含特定人名的句子来自文本这是一个示例段落在蒂宾根他作为改革家遭到反对但在他的叔公约翰罗伊克林的推荐下他接受了马丁路德的召唤进入维滕贝格大学梅兰希顿 21 岁时成为维滕贝格的希腊语教授他研究圣经尤
根据 Python Pandas 中的描述场景和状态过滤产品

假设我在 Pandas DataFrame 中有以下产品描述我想保留满足以下条件的产品的所有产品描述对于每一个id in product descriptions 检查是否包含全部descriptions从至少 1 个场景scenar
DocumentDB IN 关键字与 Linq

您现在可以使用 DocumentDB 创建 IN 查询如下所示 SELECT FROM Families WHERE Families id IN AndersenFamily WakefieldFamily 但如果我使用 Linq 运行
Python GTTS 错误：AttributeError：“NoneType”对象没有属性“group”

我有一个项目正在进行文本到语音转换我的音频文件被存储为 mp3 但现在当我检查 Gtts api 时抛出错误我尝试搜索但找不到该错误的可行解决方案我的代码如下 def synth sent language en slow Fals
如何在 Raspberry Pi 上安装 PhantomJS 以便与 Python Selenium 一起使用？

我想使用运行 Python 脚本Selenium WebDriver with PhantomJS作为我的无头浏览器树莓派运行 Raspbian 我最初在 OS X 中编写了该脚本它运行良好但在尝试让它在树莓派上工作时我遇到了问题当
如何在 Palantir Foundry 中合并具有相同模式的多个数据集？

我有几个数据集想要在 Palantir Foundry 中合并我提前知道数据集是什么所有数据集的架构都是相同的即它们具有相同的列名称和列类型组合联合这些数据集的最佳方法是什么数据集A col1 col2 1 a 2 b 数据集
Pandas 使用列作为后缀进行透视

我有一个类似于以下示例的数据框 Id Type Value 1 Value 2 1234 A 1 2 1234 B 1 2 789 A 1 2 789 B 1 2 567 A 1 2 我想转换以获得以下内容 Id Value 1 A Val

Pandas 使用列作为后缀进行透视

Pandas 使用列作为后缀进行透视 的相关文章

随机推荐

热门标签

Pandas 使用列作为后缀进行透视的相关文章