Pandas MultiIndex 按分类顺序自定义排序级别，而不是按字母顺序

2024-05-06

我是 Pandas (0.16.1) 的新手，并且希望在多索引中进行自定义排序，因此我使用分类。我的多重索引的一部分：

Part  Defect Own
Кузов 504    ИП
Кузов 504    Итого
Кузов 504    ПС
Кузов 505    ПС
Кузов 506    ПС
Кузов 507    ПС
Кузов 530    ИП
Кузов 530    Итого
Кузов 530    ПС

我创建了具有多索引级别 [Defect, Own] 的数据透视表。然后我进行“自己的”分类（参见问题的 p.s. 部分）将其排序为 [ИП、ПС、Итого]。但是，当我在级别前面加上“部分”（这也是基于“缺陷”级别的分类）并对索引进行排序时

pvt.sortlevel(0, inplace=True)

“自己”级别按字母顺序排序：[ИП、Итого、ПС]。如何在多索引中对两个级别进行自定义排序？

P.S.我使用以下代码将“自己”级别转换为分类：创建新列，用它替换索引级别。可以吗？

def makeLevelCategorical(pdf, pname, cats):
    names = pdf.index.names
    namei = names.index(pname)
    pdf["tmp"] = pd.Categorical(pdf.index.get_level_values(pname), categories=cats) #New temp column
    pdf.set_index("tmp", append=True, inplace=True) #Append column to index
    pdf = pdf.reset_index(pname, drop=True) #Remove /pname/ level
    names2 = list(names)
    names2[namei] = "tmp"
    pdf.reorder_levels(names2)  #Put "tmp" level to /pname/'s position
    pdf.index.names = names     #Rename "tmp" level to /pname/
    return pdf

对多索引进行排序可以使用Dataframe.sort_index http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.sort_index.html功能。

这是一个小例子：

df = pd.DataFrame(
    {"i1":[1,1,1,1,2,4,4,2,3,3,3,3],
     "i2":[1,3,2,2,1,1,2,2,1,1,3,2],
     "d1":['a','b','c','d','e','f','g','h','i','j','k','l']}
)
df.set_index(['i1', 'i2'], inplace=True)
df.sort_index()

Outputs:

如果您想更改基于列的排序顺序，Dataframe.sort_index http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.sort_index.html函数接受一个参数ascending=可以给出一个列表[True, False]语句按顺序对应于列。

Categorical 是 pandas 中的一种新的闪亮数据类型，应该使用它，但此操作本身不需要它。

由于评论而编辑：

排序将始终按字母顺序或相反顺序排序。如果您想要自定义排序，那么您需要创建一个新列，该列可以按字母顺序排序，但它是可以确定排序的列的结果。使用以下方法执行此操作系列图 http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.map.html，就像这个例子一样，首先用元音对数据集进行排序：

mappings = {'a': 0, 'b':1, 'c':1, 'd':1,
            'e':0, 'f':1, 'g':1, 'h':1,
            'i':0, 'j':1, 'k': 1, 'l': 1}
df['sortby'] = df['d1'].map(mappings)
df.sort('sortby')

        d1  sortby
i1  i2      
1   1   a   0
2   1   e   0
3   1   i   0
1   3   b   1
    2   c   1
    2   d   1
4   1   f   1
    2   g   1
2   2   h   1
3   1   j   1
    3   k   1
    2   l   1

如果您不想要之后的排序列，您可以简单地将其删除，如下所示：

del df['sortby']

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas MultiIndex 按分类顺序自定义排序级别，而不是按字母顺序的相关文章

键入的完整命令行

我想获得输入时的完整命令行 This join sys argv 在这里不起作用删除双引号另外我不想重新加入已解析和拆分的内容有任何想法吗你太迟了当键入的命令到达 Python 时您的 shell 已经发挥了它的魔力例如引
雅虎财务请求功能出现 404 客户端错误

yahoo Financials的请求功能出现404 Client Error 直接点击以下网址没有问题 https finance yahoo com quote AAPL financials p AAPL https finance
类型错误：“datetime.datetime”和“str”的实例之间不支持“>”

我是 python 日期和时间类型的新手我有一个日期值 date 2018 11 10 10 55 31 00 00 我需要检查该日期值是否超过 90 天我试过 from datetime import datetime from da
用 Python 绘制直方图

我有两个列表 x 和 y x 包含字母表 A Z Y 包含它们在文件中的频率我尝试研究如何在直方图中绘制这些值但在理解如何绘制它方面没有成功 n bins patches plt hist x 26 normed 1 facecolor
Python - Unicode 到 ASCII 的转换

我无法在不丢失数据的情况下将以下 Unicode 转换为 ASCII u ABRA xc3O JOS xc9 I tried encode and decode他们不会这么做有人有建议吗 Unicode 字符u xce0 and u xc
Py2exe - Pmw WindowsError：[错误 3]

我正在尝试使用 Py2exe 构建独立的可执行文件我已经导入了 Pmw 类当我运行独立可执行文件时出现以下错误 Traceback most recent call last File py line 9 in
在请求中设置端口

我正在尝试利用cgminer使用 Python 的 API 我对利用requests图书馆我了解如何做基本的事情requests but cgminer想要更具体一点我想缩小 import socket import json sock
将 window.location 传递给 Flask url_for

我正在使用 python 在我的页面上当匿名用户转到登录页面时我想将一个变量传递到后端以便它指示用户来自哪里发送 URL 因此当用户单击此锚链接时 a href Sign in a 我想发送用户当前所在页面的当前 URL
Python-验证我的文档 xls 中是否存在工作表

我正在尝试在空闲时间设计一个小程序加载 xls 文件然后在要扫描的文档中选择一张纸步骤1 用户导入 xls文件导入程序后检查文件是否存在我能做到的第 2 步我要求用户提供要分析的文档表 xls 的名称这就是它停止的地方该程
python Recipe：列出最接近等于值的项[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案考虑像这样的列表 0 3 7 10 12 15 19 21 我想获得最接近任何值的最近的最小数字所以如果我通过4 我会得到3 如果我
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
从 wxPython 事件处理程序中调用函数

我正在努力寻找一种在 wxPython 事件处理函数中使用函数的方法假设我有一个按钮单击该按钮时它会使用事件处理程序运行一个名为 OnRun 的函数但是用户忘记单击 OnRun 按钮之前的 RadionButton 我想弹出一个
如何创建用于霍夫曼编码和解码的树？

对于我的作业我将对霍夫曼树进行编码和解码我在创建树时遇到问题并且陷入困境不要介意打印语句它们只是让我测试并查看函数运行时的输出是什么对于第一个 for 循环我从主块中用于测试的文本文件中获取了所有值和索引在第二个 for 循
是否可以使用 Anaconda 包作为 Google Cloud Functions 的依赖项？

我正在使用 Python 运行时编写 Google Cloud Function 我需要包含一些无法使用的依赖项pip 如文档中所述here https cloud google com functions docs writing spe
Python：如何在不先创建整个列表的情况下计算列表的总和？

通常我们必须 1 声明一个列表 2 使用以下方法计算该列表的总和sum 但现在我希望指定一个以 1 开头间隔为 4 100 个元素的列表如下所示 1 5 9 13 17 21 25 29 33 37 我不想涉及数学公式所以 1 如何在
python中有没有一种方法可以将存储在列表中的正则表达式模式列表应用到单个字符串？

我有一个正则表达式模式列表存储在列表类型中我想将其应用于字符串有谁知道一个好方法将列表中的每个正则表达式模式应用于字符串和如果匹配则调用与列表中该模式关联的不同函数如果可能的话我想用 python 来做这件事提前致谢 im
使用 MPI 的 Allreduce 对 Python 对象求和

我正在使用使用 Python 中的字典和计数器构建的稀疏张量数组操作我想让并行使用这个数组操作成为可能最重要的是我最终在每个节点上都有计数器我想使用 MPI Allreduce 或另一个不错的解决方案将其添加在一起例如使用计数
使用 pandas 单元格中列表的长度选择行[重复]

这个问题在这里已经有答案了我有一张表 df a b c 1 x y x 2 x z c d 3 x t e f g 只是想知道如何使用 c 列的长度选择行 such as df loc len df c gt 1 我知道这是不对的正确的
为boost python编译的.so找不到模块

我正在尝试将 C 代码包装到 python 中只需一个类即可导出两个函数我编译为map so 当我尝试时import map得到像噪音一样的错误 Traceback most recent call last File
如何使用 Python/Django 在 Facebook 中获取（和使用）扩展权限

我正在尝试编写一个简单的应用程序让用户授予我的代码写入其页面的 Facebook 流的权限据我了解它应该很简单让用户单击一个按钮启动一个弹出窗口其中包含我的 Facebook 应用程序中的页面在该页面中他们单击授予的内容流发

随机推荐

Google Sheets - 如何将过滤功能与过滤视图结合起来

我一直在处理一个包含 100 多行的电子表格并发现了一种巧妙的方法来合并隐藏复选框该复选框将隐藏 C 列与框旁边指定的特定值建筑类型匹配的任何行为此我首先创建了一个如下函数 FILTER Data A1 OR Data C1
IE 中的表格布局错误(7)

下面是一个带有表格布局的简单 html 代码在 FF 中它看起来就像我认为的那样在 IE7 中则不然我究竟做错了什么我该如何解决它 table cellspacing 0 cellpadding 0 border 1 tbody
Android - 如何通过检查已发送的项目来确定电子邮件是否已发送

我有一个应用程序我使用意图发送电子邮件如下所示 TODO attach and send here try Log i getClass getSimpleName send task start String address emai
如果字符串中的第一个字符是逗号，则删除它

我需要在 javascript 中设置一个函数来删除字符串的第一个字符但前提是它是逗号我找到了substr函数但这将删除任何内容无论它是什么我当前的代码是 text value newvalue substr 1 text val
我可以将 UIScrollView 放入另一个 UIScrollView 中吗

我有一个UIScrollView仅在垂直方向滚动我需要放置UIScrollView它可以水平移动就像苹果设备中的AppStore应用程序一样我不想我们UICollectionView因为我有静态数据并且我只需 3 个水平UIScrol
Window.AllowsTransparent 设置为 true 时 wpf 中的运行时错误

当我设置时我在运行时抛出异常AllowsTransparency True 我得到一个例外说WindowStyle不能设置为None if AllowsTransparency设置为 true 即使我明确地说WindowStyle被设定
LINQ：根据列值选择重复行

我试图在我的 DataGrid 中显示那些共享相同列值的行例如对于具有相同姓氏的人我尝试了以下方法 dataGrid ItemsSource dataContext Addresses GroupBy a gt a SurName W
将 fill_ Between() 与 Pandas 数据系列一起使用

我已经绘制了使用 matplotlib 时间序列及其相关的置信区间上限和下限我在 Stata 中计算的我使用 Pandas 读取 stata csv 输出文件因此该系列的类型为 pandas core series Series M
我们如何读取给定时间范围内的Kafka主题？

我需要读取 Kafka 主题中给定时间范围内的消息我能想到的解决方案是首先找出时间范围开始的最大偏移量然后继续消费消息直到所有分区上的偏移量超过时间范围的末尾有没有更好的方法来解决这个问题谢谢好吧您肯定必须首先搜索适合时间范围
PyCharm matplotlib 交互式图形而不阻塞执行

我阅读了很多有关该主题的堆栈溢出问题但经过大量实验后我无法弄清楚我的问题我在 Windows 7 上使用 PyCharm 2016 3 2 但在 OSX 上也有同样的问题我的解释器是带有 Python 3 6 和 matplotlib
如何在IOS中自定义键盘[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我想在我的应用程序中为 IOS 创建
阻止 WKWebView 中加载的 url 中的广告

我正在 webView 中加载 url 现在我想阻止 webView 中的 url 中的广告我怎样才能实现这个目标 webVw loadRequest NSURLRequest requestWithURL NSURL URLWithSt
查找数组中元素之间的平均差异的有效方法

希望标题不会让人困惑通过例子来展示很简单我有一个像这样的行向量 1 5 6 我想找到每个元素之间的平均差异此示例中的差异为 4 和 1 因此平均值为 2 5 这是一个小例子我的行向量可能非常大我是 MatLab 新手那么有没有一
将 android-sdk 和 sdk 文件夹移动到另一个驱动器

我的 Windows 位于 128GB SSD 硬盘上但空间不足文件夹C Users User AppData Local Android有 2 个文件夹android sdk and sdk使用约 30GB 空间的文件夹是否可以将这
Java 类路径和相对路径

如果java类路径中有相对路径那么这是否只是搜索当前工作目录对于清单文件中声明的类路径也是如此在清单文件中它是相对于 jar 所在的目录吗前任命令行 java cp somejar jar Or Manifest Class P
如何向 Visual Studio Intellisense 添加按钮

我想在 Visual Studio 的 IntelliSense 返回的选项列表的顶部添加一个按钮单击该按钮时将执行我的自定义代码这将导致出现弹出窗口我将其称为按钮因为当用户单击该项目时我希望出现一个弹出窗口而不是完成用户输
如何从解析迅速检索音频文件

我已成功将音频文件保存到 Parse 但很难再次下载它我无法弄清楚 getDataInBackgroundWithBlock 的块应该是什么以及如何实际保存文件非常感谢任何帮助 let query PFQuery className
__init__ 的正确类型注释

什么是正确的类型注释 init python 中的函数 class MyClass 以下哪一项更有意义 def init self type None gt None def init self type MyClass gt MyClas
添加一个新列，其中标签附加到新月形数字

我想添加一个新列给出一个常量标签并逐行附加新月数字逻辑我的输入 position work chr1 jil2001 chr4 jil2001 chr3 kou2009 chr9 nai2012 chr7 fandis2005 我的预
Pandas MultiIndex 按分类顺序自定义排序级别，而不是按字母顺序

我是 Pandas 0 16 1 的新手并且希望在多索引中进行自定义排序因此我使用分类我的多重索引的一部分 Part Defect Own 504 504 504 505 506 507 530 530 530 我创建了具有多索引级别

Pandas MultiIndex 按分类顺序自定义排序级别，而不是按字母顺序

Pandas MultiIndex 按分类顺序自定义排序级别，而不是按字母顺序 的相关文章

随机推荐

热门标签

Pandas MultiIndex 按分类顺序自定义排序级别，而不是按字母顺序的相关文章