具有重复组名称的长到宽转换[重复]

2024-03-09

我需要将以下数据从长格式转换为宽格式。问题是该组的名称可能重复。另外，重复条目的数量未知，因此我也需要考虑到这一点。

这是期望的结果：

desired_data = [[1,'Joe Tell','111-222-3333','Al Mead','222-333-4444','Ted Shaw','444-344-2323'],       
        [2,'Don Roads','555-222-5213','','','Ted Frank','222-444-2323']]


df_result = pd.DataFrame(desired_data, columns = ['ID', 'Primary 1 - Name','Primary 1 - Phone',
                                                  'Primary 2 - Name','Primary 2 - Phone',
                                                  'Secondary 1 - Name','Secondary 1 - Phone'])

我尝试过旋转数据，但在重复组问题上出错。我尝试手动向“序列”名称添加前缀，但它变得混乱。

data = [[1,'Joe Tell','Primary','111-222-3333'], 
        [1,'Al Mead','Primary','222-333-4444'], 
        [1,'Ted Shaw','Secondary','444-344-2323'],
        [2,'Don Roads','Primary','555-222-5213'],
        [2,'Ted Frank','Secondary','222-444-2323']]

df = pd.DataFrame(data, columns = ['ID', 'Name','Sequence','Phone']) 


df.pivot(index='ID', columns='Sequence', values=['Name','Phone'])

这是一个常见问题，您需要为列创建另一个索引级别cumcount. Then pivot_table并使用first用于聚合。我们可以折叠 MultiIndex 列。

df['idx'] = df.groupby(['ID', 'Sequence']).cumcount()+1

res = (df.pivot_table(index='ID', columns=['Sequence', 'idx'], values=['Name', 'Phone'],
                      aggfunc='first')
         .sort_index(level=[1, 2], axis=1))

res.columns = [f'{seq} {num} - {item}' for item,seq,num in res.columns]

   Primary 1 - Name Primary 1 - Phone Primary 2 - Name Primary 2 - Phone Secondary 1 - Name Secondary 1 - Phone
ID                                                                                                             
1          Joe Tell      111-222-3333          Al Mead      222-333-4444           Ted Shaw        444-344-2323
2         Don Roads      555-222-5213              NaN               NaN          Ted Frank        222-444-2323

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

pandas

具有重复组名称的长到宽转换[重复] 的相关文章

类型错误：此 COM 对象无法自动执行 makepy 过程 - 请为此对象手动运行 makepy

这是什么错误回溯错误 C Users DELL PycharmProjects MyNew venv Scripts python exe C Users DELL PycharmProjects MyNew agaaaaain py T
如何同时接受int和float类型的输入？

我正在制作一个货币转换器如何让 python 同时接受整数和浮点数我就是这样做的 def aud brl amount From to ER 0 42108 if amount int if From strip aud and to
重命名 python 子包，将旧名称标记为已弃用

我有一个 python 包它具有以下目录结构 package init py subpackage A init py moduleA py moduleB py 现在我想更改名称subpackage A to subpackage B同
Pandas v1.1.0：Groupby 滚动计数比滚动平均值和总和慢

我正在使用 Pandas v1 1 0 运行 groupby 滚动计数总和和平均值我注意到滚动计数比滚动平均值和总和慢得多这似乎违反直觉因为我们可以从平均值和总和中得出计数并节省时间这是一个错误还是我错过了什么感谢您的建议 im
我怎样才能更多地了解Python的内部原理？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我使用Python编程已经有半年多了我对Python内部更感兴趣而不是使用Python开发应用程序
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
Pandas 根据 diff 列形成簇

我正在尝试使用 Pandas 根据表示时间以秒为单位的列中的差异来消除数据框中的一些接近重复项例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
根据数据框中的内容从SQL Server删除行

我在 SQL Server 中有一个名为的库存表dbo inventory其中包含Year Month Material and Stock quantity 我每天都会收到 csv 文件形式的新库存计数需要将其加载到dbo invent
根据 pandas 列中的字符串值从 DataFrame 中选择行

如何根据pandas列中的字符串值从DataFrame中选择行我只想显示全部大写的状态各州拥有城市总数 import pandas as pd import matplotlib pyplot as plt pylab inline d
工作日重新订购 Pandas 系列

使用 Pandas 我提取了一个 CSV 文件然后创建了一系列数据来找出一周中哪几天崩溃最多 crashes by day bc DAY OF WEEK value counts 然后我将其绘制出来但当然它按照与该系列相同的排名顺序绘制
如何使用文本相似性删除 pandas 数据框中相似（不重复）的行？

我有数千个数据这些数据可能相似也可能不相似使用 python 的默认函数 drop duplicates 并没有真正的帮助因为它们只检测相似的数据例如如果我的数据包含类似以下内容怎么办嗨早上好嗨早上好 Python 不会将
小组芹菜链任务

shared task def process record x return 1 2 4 4 5 6 shared task def add pro id return pro id 10 shared task def dmap it
Python pip install pyarrow错误，无法执行'cmake'

我尝试在 EMR 集群的主实例上安装 pyarrow 但总是收到此错误 hadoop ip XXX XXX XXX XXX sudo usr bin pip 3 4 install pyarrow Collecting pyarrow Do
python中的[][]（双方括号运算符）运算符是什么？

我是 python 新手我一直在寻找分配变量时进行三元运算的正确方法我发现有人在堆栈溢出上发表了一个帖子提出了这样的建议 var smaller bigger 7 gt 1 其中左边的值为 False 右边的值为 True 我运行它并
SocketIO + Flask 检测断开连接

我在这里有一个不同的问题但意识到它可以简化为如何检测客户端何时从页面断开连接关闭其页面或单击链接换句话说套接字连接关闭我想制作一个带有更新用户列表的聊天应用程序并且我在 Python 上使用 Flask 当用户连接时浏览器发
从 pandas DataFrame 中删除少于 K 个连续 NaN

我正在处理时间序列数据我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题我尝试查看一些链接例如标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此

随机推荐

jQuery UI 调整大小，同时保持相同的整体宽度

我有两个水平放置的容器position absolute 我试图在中间制作一个调整大小栏这样拖动它就会增加一个元素的大小同时减小另一个元素的大小因此保持整体宽度相同 div class container left div div
更改 XTS 对象的时区

我有一个数据对象 index x 6217 2014 09 03 GMT 2014 09 04 GMT 2014 09 05 GMT 2014 09 08 GMT 2014 09 09 GMT 2014 09 10 GMT 2014 09
在 d3.js 中，在使用行转换导入 csv 文件时，如何“切片”数据以仅包含一系列行？

我正在 d3 中使用包含超过 39000 行的数据表并且我不想一次直观地表示所有项目这就是我目前所拥有的 var impt d3 csv Data prisoncsv8 csv function data i return more d
在 ScalaTest 中使用“不应该产生 [异常]”语法

我正在玩 Scala 中的 BDD 的 Specs2 和 ScalaTest 当我断言不应抛出给定异常时我在 Specs2 中写下了期望 do something in must not throwA MyException 我希望能够在
.NET 是否可以测试数组的等效性而不仅仅是相等的引用？

var a new double 1 2 3 var b new double 1 2 3 System Console WriteLine Equals a b Returns false 但是我正在寻找一种比较数组的方法该方法会比较
正则表达式：对 url 字符串的两个斜杠之间的倒数第二个值进行子串

我有一个像这样的字符串 http www example com value 1234 different value 我怎样才能提取1234 注意末尾可能有斜杠 http www example com value 1234 diffe
字符串数组转换

我有以下代码 char array1 3 hello world there struct locator t char t int len locator 2 array1 10 它可以使用 gcc Wall ansi pedantic
PHP：对数组进行排序

我有一个数组其中包含来自嵌套集模型中的 MySQL 表的数据我希望对其进行排序不仅按字母顺序排序而且还按父节点之后的子节点排序示例要排序的数组排序之前 Array 0 gt Array id gt 1 name gt Komp
SQL 连接同一文件中不同记录的文本字段

我们正在讨论使用 DB2 的 iSeries 上的文件中的数据文件结构如下 Item Textline Text 12755 1 this item 12755 2 is no longer 12755 3 for sale abc123
如何在 Android 中创建 GUI 而不是使用 XML？

我不喜欢管理XML and Java在一起我可以使用创建相同的 GUIJava语言我该怎么做你能告诉我简单的代码吗Button 我将不胜感激正确的答案是的你可以 public class MyActivity extends Act
Hive/SparkSQL：如何将 Unix 时间戳转换为时间戳（而不是字符串）？

我以为这很容易在 Hive SparkSQL 中如何将 unix 时间戳注 1 转换为timestamp数据类型注1 即自1970年1月1日起的秒毫秒数我想from unixtime 会这样做但它返回一个字符串而不是时间戳
如何使用新部署的网站版本（Firebase）从用户浏览器中删除在先前部署中注册的服务工作人员？

我已通过现有项目将网站的新版本之前在 Polymer 上现在在 Vue js 上部署到 Firebase 我正在使用带有 Webpack 的默认 Vue js 模板 vue init webpack my project 在新项目中
如何在 DRF 上获取 NUXT.JS 中的数据

我尝试了 NUXT 并尝试按照他网站上的手册进行操作但现在我遇到了从 DJANGO 获取数据的问题这是我的代码
gridview 中总计小计

我需要在我的项目中显示小计金额但我不知道如何在网格视图和小计金额中显示它有人能帮助我吗我需要这样展示教师姓名 A 班 B 班 C 班 Mia 23 32 24 35 35 20 Sub Total 58 67 44 Stephen
在 Objective C 中定义不可变类的最佳方法

我是 Objective C 的新手我想知道什么是在 Objective C 中定义不可变类的最佳方式例如 NSString 我想知道要使类不可变必须遵循哪些基本规则我觉得不应提供设置器如果使用属性它们应该是只读的要禁用
PHP：查找字符串中不同字母的数量

我想找出一个字符串包含多少个唯一字符例子 66615888 contains 4 digits 6 1 5 8 12333333345 contains 5 digits 1 2 3 4 5 echo count array unique
Grails openid 插件 2.0.0 RC1：获取“没有此类属性：用户异常”

已安装openid插件 http grails org plugin spring security openid2 0 0 RC1 到我的 grails 应用程序但我得到没有这样的属性用户异常有人可以建议应该做什么吗 Error
“幽灵”kubernetes pod 陷入终止状态

情况我有一个 kubernetes pod 处于终止状态无法删除 pod NAME READY STATUS RESTARTS AGE funny turtle myservice xxx yyy 1 1 Terminating 1
以编程方式批量创建 WooCommerce 产品

可以在 WooCommerce 上批量创建产品吗我正在使用 wp cli Product 命令但似乎我必须一一创建
具有重复组名称的长到宽转换[重复]

这个问题在这里已经有答案了我需要将以下数据从长格式转换为宽格式问题是该组的名称可能重复另外重复条目的数量未知因此我也需要考虑到这一点这是期望的结果 desired data 1 Joe Tell 111 222 3333 Al

具有重复组名称的长到宽转换[重复]

具有重复组名称的长到宽转换[重复] 的相关文章

随机推荐

热门标签