在 Python Pandas 中使用 groupby 按列连接行

2024-04-19

而不是例如使用 group_by 计算总和我想连接同一组中的所有行。下面的代码应该只组合/连接行，而不是 sum() 。如果每组有 5 行，则新数据框的列数将是 5 倍（每列 x 5）

例子：这是我现在拥有的数据框。

Index    Pool   B          C         D           E
70       Pool1  8.717402   7.873173  16.029238   8.533174   
71       Pool1  7.376365   6.228181  9.272679    7.498993   
72       Pool2  8.854857   10.340896 9.218947    8.670379   
73       Pool2  11.509130  8.571492  19.363829   14.605199   
74       Pool3  14.780578  7.405982  9.279374    13.551686   
75       Pool3  7.448860   11.952275 8.239564    12.264440

我想要这样的：

Index    Pool   B1         C1        D1          E1        B2         C2        D2          E2
70       Pool1  8.717402   7.873173  16.029238   8.533174  7.376365   6.228181  9.272679    7.498993  
71       Pool2  8.854857   10.340896 9.218947    8.670379  11.509130  8.571492  19.363829   14.605199  
72       Pool3  14.780578  7.405982  9.279374    13.551686 7.448860   11.952275 8.239564    12.264440

我会为您提供示例代码，但不知道。如果我只是对行进行求和，我会使用：

t.groupby(['pool']).sum()

但我不想合并行并保留列结构，我想将行与同一组连接起来。

你可以尝试：

import pandas as pd
import numpy as np

df1 = pd.DataFrame({'Pool': ['a', 'a', 'b', 'b', 'c'], 'B':[1, 2, 3, 4, 5], 'C':[1,2,3,4,5]})
gd = df1.groupby('Pool')

def comb2(x):
    rslt = dict()
    for col in x.columns:
        rslt[col]=x[col].tolist()
    return pd.Series(rslt)

rslt = gd.apply(comb2)
rslt = rslt.drop('Pool', axis=1)
finaldf = pd.DataFrame()
for col in rslt.columns:
    tempdf = rslt[col].apply(lambda x: pd.Series(x))
    tempdf.columns  = [col+str(i+1) for i in range(len(tempdf.columns))]
    finaldf = pd.concat([finaldf, tempdf],axis=1)

print(finaldf)

Output:
      B1  B2  C1  C2
Pool                
a      1   2   1   2
b      3   4   3   4
c      5 NaN   5 NaN

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

在 Python Pandas 中使用 groupby 按列连接行的相关文章

为什么 Dash 在上传文件时会出现解析错误？

上传 Excel 或 CSV 会导致错误我遵循了 Dash 演示但是当我尝试扩展它来执行绘图之类的操作时它就不起作用了我不想只显示一张桌子 Dash Table 函数已更新因此之前使用 Dash Table Experiments
为什么通过selenium切换到alert不稳定？

为什么通过selenium切换到alert不稳定例如 1 运行代码一切顺利一切都很顺利但如果这段代码在几分钟内运行那么可能会出现错误例如没有可以单击的元素等等 2 在一个站点上有一个警报窗口 alert driver swi
如何从 python 脚本更改 python 文件中的变量值

我目前有一个 python 文件其中包含一堆带有值的全局变量我想从一个单独的 python 脚本永久更改这些值我尝试过 setattr 等但似乎不起作用有没有办法做到这一点简短的回答是不不值得这么麻烦听起来您正在尝试创建一
Python - 如何将双引号附加到字符串并存储为新字符串？

我正在使用 Python 2 6 并且想将双引号附加到字符串并将其存储为新的字符串变量我不想打印它但稍后在我的 python 脚本中使用它例如 a apple b some function a gt b would be equal
多级QTreeView

我很难理解如何使用 QTreeView 和 QStandardItemModel 设置多级 QTree 这是我所拥有的 from PySide QtGui import import sys class MainFrame QWidget
scipy 的 curve_fit 函数的尺寸问题

我对 python 中的曲线拟合以及一般的 python 都很陌生目前我正在尝试使用 scipy 中的 curve fit 模块来拟合 4 个光谱峰简而言之我的文本文件中有两列数据所以我的第一步是将数据导入到两个数组中一个包含
如何在 PyCharm 中启用 flake8 的自动代码格式化

我使用 Tox 运行单元测试并使用 flake8 命令检查代码格式错误每次我在 PyCharm 中编码时我都会运行 tox 然后意识到我有一堆烦人的格式错误我必须返回并手动修复我希望 PyCharm 自动格式化代码根据 flak
在 Django 1.9 中使用信号

在 Django 1 8 中我能够使用信号执行以下操作一切顺利 init py from signals import 信号 py receiver pre save sender Comment def process hashtag
让垂直网格线出现在 matplotlib 的线图中

我想在绘图上同时获得水平和垂直网格线但默认情况下仅显示水平网格线我正在使用一个pandas DataFrame从 python 中的 sql 查询生成 x 轴上带有日期的线图我不知道为什么它们没有出现在日期上我试图寻找这个问题的答案
为什么删除 DataFrame 的列或部分会增加内存使用量，以及如何确保对未使用的 DataFrame 切片进行垃圾回收

处理大型 DataFrame 时您需要小心内存使用情况例如您可能想要分块下载大数据处理这些块然后从内存中删除所有不必要的部分我找不到任何有关处理垃圾收集的最佳程序的资源pandas 但我尝试了以下方法并得到了令人惊讶的结果 im
插入失败“OperationalError：没有这样的列”

我尝试使用我尝试修复的姓名和电话创建一个数据库但它会随时向我重播 File exm0 py line 14 in
numpy.polyfit 没有关键字“cov”

我试图使用 polyfit 来找到一组数据的最佳拟合直线但我还需要知道参数的不确定性所以我也想要协方差矩阵在线文档建议我写 polyfit x y 2 cov True 但这给出了错误类型错误 polyfit 得到了意外的关键字参数
了解 Tensorflow 中的 while 循环

我正在使用用于 Tensorflow 的 Python API https www tensorflow org api docs python 我正在努力实施罗森布罗克函数 https www sfu ca ssurjano rosen
来自字典列表列表的 Pandas DataFrame

我有一个数据结构它是字典列表的列表 Height 86 Left 1385 Top 215 Width 86 Height 87 Left 865 Top 266 Width 87 Height 103 Left 271 Top 506
如何使用Django模板作为组件？

我有 5 个模板 index html detail html tag html login html register html and a 基本 html 所有 5 个模板都会扩展基本 html 索引 html 详细信息 html 标签
Scrapy文件下载如何使用自定义文件名

For my scrapy http doc scrapy org index html我目前正在使用的项目文件管道 https doc scrapy org en latest topics media pipeline html scr
Python 中的“lambda”是什么意思，最简单的使用方法是什么？

您能否给出一个示例和其他示例来说明何时以及何时不使用 Lambda 我的书给了我一些例子但它们很令人困惑拉姆达起源于拉姆达演算 http en wikipedia org wiki Lambda calculus和 AFAIK 首先实
在 Seaborn 中的 distplot 或 kdeplot 的平均峰值处绘制一个点

我感兴趣的是自动绘制分布平均峰值上方的点由 kdeplot 或带有 kde 的 distplot 表示手动绘制点和线很简单但我很难推导出这个最大坐标点例如下面生成的 kdeplot 应该在大约 3 5 1 0 处绘制一个点 iri
Python list.extend() 是保序的吗？

我想知道扩展函数是否保留两个列表中的顺序 gt gt list 1 2 3 gt gt list extend 4 5 gt gt list 1 2 3 4 5 扩展总是这样工作吗 Yes list extend just extends给
预提交钩子 git 错误

我正在尝试在 python 中执行预提交 git hook 以检查文件的行长度是否小于 80 个字符但是我收到没有此类文件目录的错误我在 fedora 上并设置了 usr bin python help 将不胜感激 usr bin e

随机推荐

根据 pandas 中另一列的值创建新列

我有这个 pandas 数据框其代码列包含顺序分层代码我的目标是使用每个层次级别代码及其名称创建新列如下所示原始数据 Code Name 0 A USA 1 AM Massachusetts 2 AMB Boston 3 AMS
通过不加载主题和插件使 WordPress WP-API 更快

我想更快地向 WordPress API 发出请求我的API是在插件中实现的使用register rest route来注册我的路线然而由于这是一个插件所以所有内容都已加载子主题和主题并且基本上对该 API 的查询需要半秒因
SQLite 查询中的 JavaScript for 循环

我创建了一个函数它将从我的数据库返回字符串 path function getAudio mid cb mid is an array containing the id to some multimedia files for i 0
在 VSTS 托管代理上使用 PowerShellGet

我在构建过程中使用 Visual Studio Team Services VSTS 托管的构建代理我的构建主要依赖于 PowerShell 步骤该步骤调用我在 git 中的脚本在此脚本中我想使用 PowerShellGet 管理
关闭文件而不退出 VIM 应用程序？

我用 e and w用于编辑和写入文件的命令我不确定是否有 close 命令可以在不离开Vim的情况下关闭当前文件 I know that the q command can be used to close a file but if
如何在嵌入式 Jetty 上设置 SSL？

我已经嵌入了 jetty 7 x 基本上只是创建一个 SelectChannelConnector 来侦听端口 80 和 WebAppContext 来部署单个 WAR 目录我现在需要添加 SSL 所有密钥库内容都已完成我本想只添加一个
如何覆盖 SyliusCoreBundle 模型用户

我尝试在模型用户 SyliusCoreBundle Model User 中添加一个新字段电话避免接触SyliusCoreBundle 我创建了一个新的捆绑包 ShopBundle 它位于其他 sylius 捆绑包旁边以覆盖基本用户类
ASP.NET 中的 Twitter API 集成

目前我正在使用剃刀使用MVC4 5 我尝试将 Twitter API 集成到我的应用程序中但没有成功您能帮助我如何将 Twitter API 集成到我的应用程序中吗我已经创建了 twitter API 详细信息如下 OAuth 设置
Swift 4 JSON Codable - 返回的值有时是一个对象，其他是一个数组

我从 API 获取的数据返回单个对象但当有多个对象时它会返回同一键中的数组对于我正在使用的当前模型结构当数组出现时解码会失败这些结果是随机排序的这意味着我不知道何时会收到对象或数组有没有办法创建一个模型考虑到这一事实并可
数据库设计 - 是否应该避免一对一关系？ [复制]

这个问题在这里已经有答案了可能的重复是否存在使用数据库 1 1 关系有意义的时候 https stackoverflow com questions 517417 is there ever a time where using a d
SourceTree - 变基 - 合并期间的错误

我正在尝试做一些简单的事情例如编辑先前提交的提交消息检查git status I have nothing to commit working directory clean 然后我单击提交并执行 SourceTree gt Repo
iOS UIPageViewController 页面控制不同步

每当我滑动页面控制器并点击UIPageControl同时在底部向相反方向滑动当前显示的页面和pageControl中的页码会不同步有没有人遇到过这个奇怪的问题并解决了如果您需要任何其他信息请告诉我刚刚查看了文档UIPageCont
如何更新 Laravel 4 中现有的 Eloquent 关系？

我正在尝试更新 Laravel 中一对多关系的关系不幸的是我找不到任何相关文档谁能帮我这是我到目前为止所拥有的 class Account extends Eloquent public function users return t
scanf 的四边形和参数类型

我用
平均日期数组计算

我想得到以下日期的平均值我考虑过将所有数据转换为秒然后对它们进行平均但可能有更好的方法来做到这一点 date 2016 02 23 09 36 26 2016 02 24 10 00 32 2016 02 24 11 28 22 20
java.lang.NoSuchFieldException：使用反射时

public static
无法从 scm 存储库获取分支信息

我在构建 Maven 项目时遇到以下错误有解决这个问题的想法吗 ERROR Failed to execute goal org codehaus mojo buildnumber maven plugin 1 4 create defa
Symfony2，奏鸣曲：折叠组

我一直在尝试做一些相对简单的事情但这不起作用我希望能够折叠奏鸣曲中的组以增强用户的体验 gt with MyGroup array collapsed gt true add MyField gt end 这是根据奏鸣曲改编的文档 ht
python 列表理解 double for

vec 1 2 3 4 5 6 7 8 9 print num for elem in vec for num in elem lt this gt gt gt 1 2 3 4 5 6 7 8 9 这是在骗我我知道 elem 是列表中的列
在 Python Pandas 中使用 groupby 按列连接行

而不是例如使用 group by 计算总和我想连接同一组中的所有行下面的代码应该只组合连接行而不是 sum 如果每组有 5 行则新数据框的列数将是 5 倍每列 x 5 例子这是我现在拥有的数据框 Index Pool B C

在 Python Pandas 中使用 groupby 按列连接行

在 Python Pandas 中使用 groupby 按列连接行 的相关文章

随机推荐

热门标签

在 Python Pandas 中使用 groupby 按列连接行的相关文章