pandas 数据透视表 - 有序类别导致意外的边距

2024-01-04

使用 python 3.7 和 pandas 0.23.4。我正在尝试使用有序分类数据制作数据透视表。如果我包括边距，则小计的顺序似乎不正确。

import pandas as pd
m='male'
f='female'

data = {'num': [0,1,2,3,4,5,6,7,8,9],
        'age': [1,2,2,3,3,3,3,1,2,3],
        'sex': [f,f,f,f,f,f,f,m,m,m]}
df = pd.DataFrame(data=data)

df['age1'] = pd.Categorical(df['age'],categories=[3,2,1],ordered=True)
df['sex1'] = pd.Categorical(df['sex'],categories=[m,f],ordered=True)
pd.pivot_table(df,values='num',index='age1',columns='sex1',aggfunc='count',margins=True)

输出（边距顺序不正确，“所有”总和不在正确的行或列中）：

sex1  male  female  All
age1                   
3        1       4    2
2        1       2    3
1        1       1    5
All      7       3   10

预期输出（正确的保证金顺序）：

sex1  male  female  All
age1                   
3        1       4    5
2        1       2    3
1        1       1    2
All      3       7   10

在此示例中，最好使用ordered=False 创建类别。然而，我的大部分数据都是自动排序的（使用 pd.cut），所以我想知道这是否是预期行为，如果是，是否有办法删除使用订单创建的类别的排序？

Edit- 这是使用 pd.cut 的示例。我更改了“年龄”列值，使其与剪切顺序相反。

import pandas as pd
m='male'
f='female'
data = {'num': [0,1,2,3,4,5,6,7,8,9],
        'age': [3,3,3,3,2,2,1,1,2,3],
        'sex': [f,f,f,f,f,f,f,m,m,m]}
df = pd.DataFrame(data=data)
df['cut'] = pd.cut(df['age'],[1,2,3,4],labels=['<2','2','>2'],right=False)
pd.pivot_table(df,values='num',index='cut',columns='sex',aggfunc='count',margins=True)

输出，同样具有不正确的行边距（对应于 pd.cut 中的有序类别）。

sex  female  male  All
cut                   
<2        1     1    5
2         2     1    3
>2        4     1    2
All       7     3   10

预期输出将是正确的行边距顺序。

sex  female  male  All
cut                   
<2        1     1    2
2         2     1    3
>2        4     1    5
All       7     3   10

这是一个修复对于你原来的问题。从中删除有序参数df['age1'] and df['sex1']

我的改变：

import pandas as pd
m = 'male'
f = 'female'

data = {'num': [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
        'age': [1, 2, 2, 3, 3, 3, 3, 1, 2, 3],
        'sex': [f, f, f, f, f, f, f, m, m, m]}
df = pd.DataFrame(data=data)

df['age1'] = pd.Categorical(df['age'], categories=[3, 2, 1])
df['sex1'] = pd.Categorical(df['sex'], categories=[m, f])
pd.pivot_table(df, values='num', index='age1',
               columns='sex1', aggfunc='count', margins=True)

Output:

sex  male   female  All
age1            
3     1     4        5
2     1     2        3
1     1     1        2
All   3     7       10

来自docs https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Categorical.html#pandas.Categorical: 该分类是否被视为有序分类。如果为 True，则结果分类将被排序。有序分类在排序时遵循其类别属性的顺序

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

pivottable

pandas 数据透视表 - 有序类别导致意外的边距的相关文章

反转 Python 整数的位

给定一个十进制整数例如 65 如何反转 Python 中的底层位即以下操作 65 01000001 10000010 130 看来这个任务可以分为三步将十进制整数转换为二进制表示形式反转位转换回十进制第 2 步和第 3 步看起来
字符串在内部存储为单独的字符，内存中的每个字符都由其他类似的字符串共享吗？

例如是字符串var1 ROB 存储为 3 个内存位置 R O 和 B 每个位置都有自己的地址和变量var1指向内存位置R 那它怎么指向O和B呢并执行其他字符串例如 var2 BOB 指向内存中相同的 B 和 Ovar1指的是字符串如
扭曲的日志记录到屏幕（标准输出）不起作用

我有这个小程序取自这里 https twistedmatrix com documents 16 3 0 core howto logger html usage for emitting applications from twisted
代码终止后保持 matplotlib / pyplot 窗口打开

我希望 python 绘制一个图在不阻塞控制流的情况下显示它并在代码退出后使图保持打开状态这可能吗这个以及相关的主题存在于许多其他线程中见下文但我无法让情节保持开放且非阻塞例如如果我使用pyplot ion before p
Python 中 Matlab 'fscanf' 的等价物是什么？

Matlab函数fscanf 似乎很强大 python 或numpy 中是否有相同的等效项具体来说我想从文件中读取矩阵但我不想迭代每一行来读取矩阵类似的东西来自 matlab 用于读取 2D 1000x1000 矩阵 matrix
使用 python3 查找表情符号的宽度

我尝试使用 python 中的模式打印字母 A def printA length height symbol a for i in range length for i in range height for i in range hei
使用unittest时如何知道每次测试花费的时间？

Unittest 仅显示运行所有测试所花费的总时间但不单独显示每个测试所花费的时间使用unittest时如何添加每个测试的计时我想目前不可能 http bugs python org issue4080 http bugs pyth
如何在Python Selenium中获取WebElement的类名？

我使用 Selenium WebDriver 来抓取从网页中获取的用 JavaScript 编写的表格我正在迭代表行列表每行可能属于不同的类别我想获取此类的名称以便我可以为每一行选择适当的操作 table body table f
Spyder 内联绘图

设置 Anaconda 2 0 0 Win 64 Spyder Anaconda 附带的 2 3 0rc 我配置图形工具 gt 首选项 gt iPython 控制台 gt 图形 gt 图形后端 gt 内联但无论我做什么图形总是在单独的
禁用或限制 /o/applications（django rest 框架、oauth2）

我目前正在使用 Django Rest 框架编写 REST API 并使用 oauth2 进行身份验证使用 django oauth toolkit 我对他们俩都很满意他们做的正是我想要的然而我有一个担忧我正在将我的应用程序传递到
Django 自定义文件存储系统

我有一个自定义存储 import os from django core files storage import Storage class AlwaysOverwriteFileSystemStorage Storage def get
2D 矩阵上的 Numpy where()

我有一个像这样的矩阵 t np array 1 2 3 foo 2 3 4 bar 5 6 7 hello 8 9 1 bar 我想获取行包含字符串 bar 的索引在一维数组中 rows np where t bar 应该给我索引 0 3
将连续行与相同的列值合并

我有一个看起来像这样的东西我该如何处理 0 d 0 The DT 1 Skoll ORGANIZATION 2 Foundation ORGANIZATION 3 4 based VBN 5 in IN 6 Silicon LOCATIO
DataFrame 对象没有属性“sort_values”

dataset pd read csv dataset csv fillna 100 dataset Id 0 dataset i 0 dataset j 0 entries dataset dataset Id 0 print type
仅将唯一行插入 SQLite (python)

我在用着cursor executemany将 CSV 文件中的批量行插入到 SQLite 表中根据主键字段其中一些行预计会重复当我执行该命令时可以预见的是我会收到完整性错误并且不会插入任何内容如何有选择地仅插入非重复行而无
如何在我的 heroku 应用程序上安装软件包？

我有一个使用 Shortuuid 的应用程序 https pypi python org pypi shortuuid 0 1 https pypi python org pypi shortuuid 0 1 当我使用 runapp py
对象对于所需数组来说太深 - scipy.integrate.odeint

我昨天刚开始使用Python 使用时遇到错误scipy integrate odeint 我定义了一个函数 def SIR x t beta gamma mu M 这需要numpy array物体x t and M 标量浮动beta gam
子进程调用，它们是并行完成的吗？

我一直在谷歌搜索这个问题的答案但似乎没有一个答案谁能告诉我如果subprocess模块是否并行调用 Python 文档建议它可用于生成新进程但没有提及它们是否并行如果它们可以并行完成您能否给我举一个例子或将我链接到一个例子这取决
pyodbc 无法正确处理 unicode 数据

我确实使用 pyodbc 成功连接了 MySQL 数据库并且它可以很好地处理 ascii 编码的数据但是当我打印使用 unicode utf8 编码的数据时它引发了错误 UnicodeEncodeError ascii codec c
评估 df 每行中的日期时间函数是否落在另一个 df 中的日期时间范围内

我是 python 新手需要一些帮助来解决有关日期时间函数的问题 I have df a其中有一列标题为time 我正在尝试创建一个新专栏id在这个df a 我想要id根据时间是否包含在某个时间范围内来确定的列df b date 和 da

随机推荐

如何设置 MPNowPlayingInfoCenter 的图稿图像

我一直在尝试更新以下项目中显示的艺术品MPNowPlayingInfoCenter using MPMediaItemPropertyArtwork如以下代码所示取自苹果的文档 https developer apple com docu
MySQL week() 函数以星期六开始

在 MySQL 中是否有可能或者如何修改 week 以便一周从星期六开始我在用WEEK CURDATE 0 获取开始日期为星期日的周数但是我想获取起始日为星期六的周数我想我找到了一种方法只需将日期移 1 天即可 WEEK CUR
jQuery-mobile 1.3 面板始终可见

在新的 jQuery mobile 1 3 版本中如何添加一个从一开始就始终可见的左侧面板该面板将充当导航菜单 Thanks 您可以像这样以编程方式打开它 document on pagebeforeshow index functio
无法更改 Unity 中 Inspector 变量中的数组大小？

根据我读到的内容这就是矢量大小的设置方式 public Color teamAColors new Color 4 But when the code is run it looks like this 我为 4 设置的数字似乎并不重
为什么 Rails 命令强制显示“new”命令的帮助消息？

奇怪的是在某些情况下我无法执行典型的 Rails 命令例如rails s and rails c 我发现这种情况发生在某个功能分支上过去也偶尔发生过但目前适用于我的develop branch 我逆转了任何 rb可以加载并产生任何效
具有多个数据库的 Rails RSpec

我运行一个 Rails 应用程序我们正在将注册流程拆分为一个单独的应用程序注册应用程序有自己独立的数据库用于 CMS 和收集潜在客户但它还需要访问主数据库使用这个效果非常好ActiveRecord Base establish c
gob 恐慌解码接口

我有一个带有未导出字段的结构应该对其进行 gob 编码和解码 Say type A struct s int func a A Inc a s 显然在这种情况下我需要实施gob GobEncoder and gob GobDecoder接
动画 gif 无法播放 - 鼠标侦听器 - 鼠标输入事件

我有一个按钮我已将其替换为图像悬停时我希望该图像播放动画 gif 我添加了一个鼠标监听器并输入了将图像更改为 gif 的代码图像变为gif 然而 gif 并没有动画我在这个网站上查找过以前的答案很少但没有一个能够提供帮助 Over
如何在 VS Code 中禁用 C++ 错误检查？

我正在生成 C 示例代码文件因此它们有很多固有错误例如虚构的函数名称我正在尝试删除文件中的所有错误消息和与错误相关的语法突出显示我想 C 有一些设置但我找不到它打开命令面板 CTRL SHIFT P gt C Cpp 切换错误曲
有没有办法在MonoTouch中制作原生的cocoa类库？

我知道 MonoTouch 将代码编译为本机机器代码有没有办法使用 MonoTouch 制作一个本机 a 类库需要明确的是我不想在两者之间共享代码因为我知道这是不可能的我相信这是可能的但这将是一项艰苦的工作而且离收缩包装的开箱
FragmentStatePagerAdapter 从 API 27 开始已弃用

FragmentStatePagerAdapter从 API 27 开始已弃用替代方案是什么FragmentStatePagerAdapter private class MainPagerAdapter extends Fragment
“在上下文或道具中找不到“store””我在尝试简单的react-redux代码时收到此错误

这是我的书单容器 import React Component from react import connect from react redux class BookList extends Component renderList r
在哪里放置 Windows 窗体项目的中央错误处理程序

在 ASP NET 中我可以使用Application Error在 global asax 中以便处理任何未处理的错误 Windows 窗体中有等效的吗是的它的 AppDomain UnhandledException using
将 Web 服务添加到已有的 Java 项目中

我是 Java 新手我有一个Java项目它在我的 Windows 7 机器上完美运行我想将该项目的一些功能用作 Web 服务以便能够在我的 Silverlight 应用程序中使用它们 Silverlight 应用程序和这个 Java
Swift 从 NSDictionary 读取数据

我正在使用这段代码来读取数据NSDictionary let itemsArray NSArray response objectForKey items as NSArray let nextPageToken String respon
如何对多列进行逆透视 SQL Server

在我的应用程序中我使用了商店产品描述值如下所示 ID BILLNO CUS NAME DATE TOT BAL S1 S2 S3 S4 D1 D2 D3 D4 Q1 Q2 Q3 Q4 U1 U2 U3 U4 T1 T2 T3 T4 TO
DFT 频率组件 Opencv

我使用以下链接来了解如何在Opencv中使用DFT http docs opencv org doc tutorials core discrete fourier transform discrete fourier transform
Node Express 发送图像文件作为 API 响应

我用谷歌搜索了这个但找不到答案但这一定是一个常见问题这是同样的问题节点请求读取图像流通过管道返回响应 https stackoverflow com questions 17004990 node request read imag
Python“if X == Y and Z”语法

做这个 if key name and item 意思和这个一样 if key name and if key item 如果是这样我完全困惑了深入 Python 中的示例 5 14 http diveintopython net obj
pandas 数据透视表 - 有序类别导致意外的边距

使用 python 3 7 和 pandas 0 23 4 我正在尝试使用有序分类数据制作数据透视表如果我包括边距则小计的顺序似乎不正确 import pandas as pd m male f female data num 0 1

pandas 数据透视表 - 有序类别导致意外的边距

pandas 数据透视表 - 有序类别导致意外的边距 的相关文章

随机推荐

热门标签

pandas 数据透视表 - 有序类别导致意外的边距的相关文章