快速找到保留排序的 pandas DataFrame 的所有排列的方法？

2023-12-20

我有一个 DataFrame，我想找到它的所有排列，这些排列可以在其中一列上实现简单的升序排序。（有很多联系。）例如，在下面的 DataFrame 中

df = pd.DataFrame({'name': ["Abe", "Bob", "Chris", "David", "Evan"], 
                   'age': [28, 20, 21, 22, 21]})

我希望按年龄排序并获取订单["Bob", "Chris", "Evan", "David", "Abe"] and ["Bob", "Evan", "Chris", "David", "Abe"].

我是 python （和 pandas）的新手，很好奇是否有一种我看不到的简单方法可以做到这一点。

Thanks!

由于您是按年龄分组，因此让我们返回每个组的所有排列，然后求乘积（使用 itertools 的乘积和排列函数）：

In [11]: age = df.groupby("age")

如果我们看一下单个组的排列：

In [12]: age.get_group(21)
Out[12]:
   age   name
2   21  Chris
4   21   Evan

In [13]: list(permutations(age.get_group(21).index))
Out[13]: [(2, 4), (4, 2)]

In [14]: [df.loc[list(p)] for p in permutations(age.get_group(21).index)]
Out[14]:
[   age   name
 2   21  Chris
 4   21   Evan,    age   name
 4   21   Evan
 2   21  Chris]

我们可以通过仅返回每个组的索引来在整个 DataFrame 上执行此操作（这假设索引是唯一的，如果不是）reset_index在这样做之前...你may能够做一些稍微低级的事情）：

In [21]: [list(permutations(grp.index)) for (name, grp) in age]
Out[21]: [[(1,)], [(2, 4), (4, 2)], [(3,)], [(0,)]]

In [22]: list(product(*[(permutations(grp.index)) for (name, grp) in age]))
Out[22]: [((1,), (2, 4), (3,), (0,)), ((1,), (4, 2), (3,), (0,))]

我们可以用 sum 将它们粘合起来：

In [23]: [sum(tups, ()) for tups in product(*[(permutations(grp.index)) for (name, grp) in age])]
Out[23]: [(1, 2, 4, 3, 0), (1, 4, 2, 3, 0)]

如果你将这些作为一个列表，你可以应用 loc （这会得到你想要的结果）：

In [24]: [df.loc[list(sum(tups, ()))] for tups in product(*[list(permutations(grp.index)) for (name, grp) in age])]
Out[24]:
[   age   name
 1   20    Bob
 2   21  Chris
 4   21   Evan
 3   22  David
 0   28    Abe,    age   name
 1   20    Bob
 4   21   Evan
 2   21  Chris
 3   22  David
 0   28    Abe]

以及名称列（列表）：

In [25]: [list(df.loc[list(sum(tups, ())), "name"]) for tups in product(*[(permutations(grp.index)) for (name, grp) in age])]
Out[25]:
[['Bob', 'Chris', 'Evan', 'David', 'Abe'],
 ['Bob', 'Evan', 'Chris', 'David', 'Abe']]

注：它may更快地使用numpy 置换矩阵 https://stackoverflow.com/q/27323448/1240268 and pd.tools.util.cartesian_product。我怀疑这是一个很大的问题，并且不会对此进行探索，除非速度慢得无法使用（无论如何它都可能会很慢，因为可能有很多排列）......

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Sorting

pandas

permutation

快速找到保留排序的 pandas DataFrame 的所有排列的方法？的相关文章

通过另一个指标数据框评估一个数据框

我有一个源数据框input df PatientID KPI Key1 KPI Key2 KPI Key3 0 1 C602 C603 C601 NaN 1 2 C605 C606 C602 NaN 2 3 75 L239 C602 NaN
如何将多项式拟合到带有误差线的数据

我目前正在使用 numpy polyfit x y deg 将多项式拟合到实验数据然而我想拟合一个基于点误差使用加权的多项式我已经发现scipy curve fit http docs scipy org doc scipy refe
Python int和float在64位系统中的内存消耗

我正在 Python 3 4 的 64 位系统中尝试以下代码以了解不同原始数据类型的内存消耗 import sys print sys getsizeof 45 prints 28 print sys getsizeof 45 2 pri
ImportError：无法导入名称 GstRtspServer，未找到内省类型库

我目前正在尝试让一个简单的 GstRtspServer 程序在外部亚马逊 Linux EC2 服务器上运行但在让它实际运行时遇到了严重的问题无论我做什么当我尝试运行它时即使程序仅减少到 import gi gi require ve
Netmiko OSError：在 send_command 中从未检测到搜索模式：

我被这个错误困住了任何人都可以帮助摆脱这个错误 import netmiko Device host xxxxxxxxxx device type cisco nxos username admin password xxxxxxxx c
argparse add_argument 别名

有没有办法使用 argparse 创建别名例如我想做这样的事情 parser add argument foo parser add argument alias bar foo 也就是说使用 bar应该相当于使用 foo 您可以简单
python中终止进程的跨平台方法

当我尝试使用 subprocess Popen terminate 或 Kill 命令终止 Windows 中的进程时出现访问被拒绝错误如果文件不再存在我真的需要一种跨平台的方式来终止进程是的我知道这不是做我正在做的事情的最优雅的
PyGTK TreeView 中的自动换行

如何在 PyGTK TreeView 中自动换行文本 gtk TreeView 中的文本是使用 gtk CellRendererText 渲染的文本换行归结为在单元格渲染器上设置正确的属性为了让文本换行您需要设置wrap width单
Pandas 对 HDFStore 中的大数据进行“分组”查询？

我有大约 700 万行HDFStore有60多个柱子数据超出了我的记忆能力我希望根据 A 列的值将数据聚合到组中 pandas 的文档分割聚合组合 http pandas pydata org pandas docs stable
Python、Oracle DB、列中的 XML 数据，获取 cx_Oracle.Object

我正在使用 python 从 Oracle DB 获取数据所有行都有一个包含 XML 数据的列当我使用 python 打印从 Oracle DB 获取的数据时包含 XML 数据的列将打印为 0x7fffe373b960 处的 cx O
深度学习——一些关于caffe的幼稚问题

我试图了解 caffe 的基础知识特别是与 python 一起使用我的理解是模型定义比如给定的神经网络架构必须包含在 prototxt file 当您使用数据训练模型时 prototxt 您将权重模型参数保存到 caffemode
如何为基于服务的数据库设置自动增量

我在这里开始构建我的第一个本地数据库基于服务的数据库使用文本框将行写入基于服务的数据库 https stackoverflow com questions 39152801 write line to service based dat
Django populate() 不可重入

当我尝试在生产环境中加载 Django 应用程序时我不断收到此消息我尝试了所有的 stackoverflow 答案但没有任何解决办法任何其他想法我使用的是 Django 1 5 2 和 Apache Traceback most
在IPython笔记本中自动播放声音

我经常在 IPython 笔记本中运行长时间运行的单元我希望笔记本在单元完成执行时自动发出蜂鸣声或播放声音有没有办法在 iPython 笔记本中执行此操作或者我可以在单元格末尾放置一些命令来自动播放声音我正在使用 Chrome 如果
为什么我只能在异步函数中使用await关键字？

假设我有这样的代码 async def fetch text gt str return text async def show something something await fetch text print something 这很
使用 python pyad 访问对象 [] 时出现问题

我在尝试使用 pyad 访问活动目录用户属性时遇到问题这是我的代码 user pyad aduser ADUser from cn tuser print user get attribute lastLogonTimestamp 这些是
将 PySpark RDD 作为新列添加到 pyspark.sql.dataframe

我有一个 pyspark sql dataframe 其中每一行都是一篇新闻文章然后我有一个 RDD 来表示每篇文章中包含的单词我想将单词的 RDD 作为名为单词的列添加到我的新文章数据框中我试过 df withColumn wo
python生成器太慢，无法使用它。我为什么要使用它？什么时候？

最近我收到一个问题哪一个是最快的 iterator list comprehension iter list comprehension and generator 然后编写简单的代码如下 n 1000000 iter a iter ra
使用自定义层运行 Keras 模型时出现问题

我目前正在攻读学士学位论文FIIT STU https www fiit stuba sk en html page id 749 其主要目标是尝试复制和验证以下结果study http arxiv org abs 2006 00885 这
Python tkinter：在组合框中使用“文本变量”似乎没用

使用textvariable在 tkinter 中创建组合框时的属性似乎完全没用有人可以解释一下目的是什么吗我查看了 Tcl 文档它说textvariable用于设置默认值但看起来在 tkinter 中您只需使用 set方法来做到这

随机推荐

如何使用layoutIfNeeded？

何时以及如何layoutIfNeeded用过的我知道当我们改变视图的布局时我们可以调用setNeedsLayout更新布局但不确定何时layoutIfNeeded应该使用注意我有layoutIfNeeded在实际代码中使用但忘记了它
无法在iOS中将统一的CNContact添加到CNGroup中

这就是我正在做的 void doCreateGroup self contentView endEditing true NSString newString self contentView groupNameField text str
检索 SQLite 中所有项目的最快方法是什么？

我在 Windows 上编程我将信息存储在 sqlite 中然而我发现获取所有物品有点慢我正在使用以下方式 select from XXX 检索 1 7MB SQLite DB 中的所有项目大约需要 200 400 毫秒太慢了有人
在 NodeJS 中可靠地读取 FIFO

我正在编写一个与第三方应用程序交互的 NodeJS 脚本第三方应用程序将在文件打开期间将数据写入文件我希望我的 NodeJS 应用程序能够实时接收这些数据我的脚本创建一个 fifo child process spawnSync mk
在 C++ 中从 WMI（Win32_LogicalDisk 类）调用 Chkdsk ->“参数无效”

我正在尝试从 C 中的 WMI 运行 Chkdsk 我正在使用 Qt Framework ExecMethod 返回参数无效我已经根据设置参数http msdn microsoft com en us library cc250766
如何获取隐藏父元素的大小？

1 4 4 返回隐藏元素的大小但是另一个隐藏元素中的元素呢除了 getWidth 还有更好的解决方案吗
SqlAlchemy：如何实现 DROP TABLE ... CASCADE？

我需要删除 PostgreSQL 数据库中具有外键约束并且需要的表DROP TABLE CASCADE 我可以执行原始 SQL engine execute DROP TABLE s CASCADE table name 但是我想实现这种
尝试在 r 中运行 glmer 时出现警告消息

目前我正在尝试在最新版本的 R 和 lme4 上重新运行旧的数据分析二项式 glmer 模型从 2013 年初开始因为我不再有旧版本的 R 和 lme4 但是我遇到了与 dmartin 和 carine 之前的线程第一条警告消息
Bundle.main.path(forResource... 查找 xml 文件时总是返回 nil

我正在尝试从我的包中读取文件我知道以前有人问过这个问题但我已经阅读了其他解决方案但其中似乎不符合我的情况我有一个 XML 文件我可以在项目导航器中看到它我还可以通过转到项目构建阶段复制捆绑资源来检查它是否包含在捆绑包中我尝
从 Azure ACS 下载登录页面后，如何使返回 URL 再次正常工作？

Azure 培训工具包包括一个名为 IntroToACS2 的实验室在其中创建一个 WebRole 并启用 ACS 以便您可以使用 Google Live 或 Yahoo ID 登录本实验的第二部分将引导您完成从 ACS 下载示例登录页
gcc/ld：动态链接中的 -Wl、-rpath 是什么？静态链接中的 -l 是什么？

对于 my dir path foo a 和 my dir path bar a 要使用 gcc g 静态链接可以使用 L指定包含静态库的目录和 l指定库的名称在这种情况下人们会写gcc L my dir path lfoo lbar
将新对等点添加到超级账本结构组织中需要采取哪些步骤？

我正在学习使用 Hyperlegder Fabric 构建网络因为我已经使用 Hyperledger Composer 开发了一个网络下一步是构建生产网络我已经开始构建第一个网络示例并开始工作我已经添加了 Org3 和 2 个对等点
Windows：从区域设置字符串获取 LCID？

我有代表语言环境的字符串数据例如 fr 或 en 我需要将其转换为适当的 LCID 值例如0x80c or 0x409 有没有函数或宏可以做到这一点我在 Windows 7 上使用 C 这些是 LCID 值不确定 LID 是什么意思
如何声明循环变量的类型

我想做一些整数算术并且正在检查如果我提供有关 SBCL 的明确信息 SBCL 是否可以获得更快的速度type我使用的价值观虽然我可以轻松使用declare in a defun or let直接这样做我不明白将该语句放在何处loop构
Play框架-在mySql中上传文件

在 play 2 0 中上传 mySql db 文件的最简单方法是什么上传数据库或上传文件夹中的文件然后在数据库中保存链接我会去将参考保存在数据库中并将图像上传到网络服务器上的某个位置或者如果您坚持将图像保存在数据库中请将其另存
SQL Server 2005 计算列被持久化

我的表中有一些计算列需要知道是否应该将 Is Persisted 设置为 true 有什么优点有什么缺点吗持续是什么意思在此上下文中持久是指物理存储这意味着计算值在插入和更新时计算一次并存储在磁盘上因此不必在每次选择
光滑的旋转木马。想要自动播放幻灯片一次并停止

我正在将 Slick 插入网站我有主页除了我无法弄清楚的一件事之外正在使用流畅的幻灯片放映我有 2 张幻灯片他们从图像的幻影版本发展而来一张一张地淡入图像的全分辨率细节那时我希望最后一个图像停止并停留在那里滑块的标记是 div
使用 TextFormatted 删除未在 EditText 中呈现的 html 标签

我正在尝试在 EditText 控件中呈现 html 字符串粗体斜体和下划线 html 可以正确呈现但删除线会被忽略这是 EditText 控件没什么花哨的
为什么 python VM 有 co_names 而不是仅仅使用 co_consts？

Python 编译器生成的代码对象包含指令中使用的常量元组名为co consts 以及一个包含名称的元组名为co names 为什么有两个不同的列表仅使用不会更简单co consts也为了名字考虑以下函数 def f x x n r
快速找到保留排序的 pandas DataFrame 的所有排列的方法？

我有一个 DataFrame 我想找到它的所有排列这些排列可以在其中一列上实现简单的升序排序有很多联系例如在下面的 DataFrame 中 df pd DataFrame name Abe Bob Chris David Evan

快速找到保留排序的 pandas DataFrame 的所有排列的方法？

快速找到保留排序的 pandas DataFrame 的所有排列的方法？ 的相关文章

随机推荐

热门标签

快速找到保留排序的 pandas DataFrame 的所有排列的方法？的相关文章