Pandas Pivot_Table ：非数字值的行计算百分比

2024-05-09

这是我在数据框“df”中的数据：

Document    Name    Time
SPS2315511  A   1 HOUR
SPS2315512  B   1 - 2 HOUR
SPS2315513  C   2 - 3 HOUR
SPS2315514  C   1 HOUR
SPS2315515  B   1 HOUR
SPS2315516  A   2 - 3 HOUR
SPS2315517  A   1 - 2 HOUR

我使用下面的代码，它为我提供了数据透视表中的计数摘要，

table = pivot_table(df, values=["Document"],
                    index=["Name"], columns=["Time"],
                    aggfunc=lambda x: len(x),
                    margins=True, dropna=True)

但我想要的是当您右键单击数据透视表并选择“将值显示为 -> 行总计的百分比”时，行计算的百分比，如 Excel 数据透视表中所示。由于我的文档是非数字值，我无法获取它。

预期结果：

Count of Document   Column Labels

Name    1 HOUR  1 - 2 HOUR  2 - 3 HOUR  Grand Total
A   33.33%  33.33%  33.33%  100.00%
B   50.00%  50.00%  0.00%   100.00%
C   50.00%  0.00%   50.00%  100.00%
Grand Total 42.86%  28.57%  28.57%  100.00%

任何人都可以帮我找出一种方法来获得这个结果吗？

我正在尝试操作枢轴数据，这将为我提供行总数，而不是数据帧中的数据，我想要的是“行总数的％”。而且最重要的是我的所有数据都是非数字值......

@maxymoo 指出的可能重复内容非常接近解决方案，但我将继续将其写为答案，因为存在一些并不完全简单的差异。

table = pd.pivot_table(df, values=["Document"],
                       index=["Name"], columns=["Time"], 
                       aggfunc=len, margins=True, 
                       dropna=True, fill_value=0)

       Document                      
Time 1 - 2 HOUR 1 HOUR 2 - 3 HOUR All
Name                                 
A             1      1          1   3
B             1      1          0   2
C             0      1          1   2
All           2      3          2   7

主要的调整是添加fill_value=0因为你真正想要的是计数值为零，而不是 NaN。

然后你基本上可以使用链接到的解决方案@maxymoo，但是你需要使用iloc或类似的 b/c 表列现在有点复杂（作为数据透视表的多索引结果）。

table2 = table.div( table.iloc[:,-1], axis=0 )

       Document                         
Time 1 - 2 HOUR    1 HOUR 2 - 3 HOUR All
Name                                    
A      0.333333  0.333333   0.333333   1
B      0.500000  0.500000   0.000000   1
C      0.000000  0.500000   0.500000   1
All    0.285714  0.428571   0.285714   1

您仍然需要做一些小的格式化工作（翻转第一列和第二列并转换为％），但这些是您正在寻找的数字。

顺便说一句，这里没有必要，但您可能想考虑将“时间”转换为有序分类变量，这将是解决列排序问题的一种方法（我认为），但可能值得也可能不值得麻烦，具体取决于关于您对数据还做了什么。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas Pivot_Table ：非数字值的行计算百分比的相关文章

嵌套函数中的变量作用域

有人可以解释为什么以下程序失败 def g f for in range 10 f def main x 10 def f print x x x 1 g f if name main main 带有消息 Traceback most re
使用 keras 澄清 Yolo v3 模型输出

我将 yolo v3 模型与 keras 一起使用该网络为我提供了形状如下的输出容器 1 13 13 255 1 26 26 255 1 52 52 255 所以我找到了这个link https www cyberailab com ho
使用python编辑html，但是lxml将漂亮的html实体转换为奇怪的编码

我正在尝试使用 python 带有 pyquery 和 lxml 来更改和清理一些 html Eg html div p It 146 s a spicy meatball p div lxml html clean 函数 clean ht
如何使用 Pycharm 运行 fast-api 服务器？

我有一个简单的 API 函数如下所示 from fastapi import FastAPI app FastAPI app get async def read root return Hello World 我正在使用启动服务器uvi
导入 SciPy 或 scikit-image，“from scipy.linalg import _fblas：导入错误：DLL 失败”

我正在导入 from scipy import misc io 但我收到这些错误 Traceback most recent call last File C work asaaki code generateProposals py li
如何用pygame画一条虚线？

我需要在坐标系上绘制正弦波和余弦波就像在this https i stack imgur com DGI8g png图片除了没能代表以外我所有的工作都做得很好虚线和曲线与 pygame 一致我有与我需要的类似的东西但我怎样才能让它
在Python中，如何通过去掉括号和大括号来打印Json

我想以一种很好的方式打印 Json 我想去掉方括号引号和大括号只使用缩进和行尾来显示 json 的结构例如如果我有一个像这样的 Json A A1 1 A2 2 B B1 B11 B111 1 B112 2 B12 B121 1
matplotlib - 将文本包装在图例中

我目前正在尝试绘制一些pandas数据通过matplotlib seaborn 然而我的一个专栏标题特别长拉长了情节考虑以下示例 import random import pandas as pd import matplotlib p
Python SQLite3 SQL注入漏洞代码

我知道下面的代码片段由于 format 的原因很容易受到 SQL 注入的攻击但我不知道为什么有谁明白为什么这段代码容易受到攻击以及我从哪里开始修复它我知道这些代码片段使输入字段保持打开状态以便通过 SQL 注入执行其他恶意命令但不
Python正则表达式替换引号中的文本（引号本身除外）

例如我有一个测试字符串 content I opened my mouth Good morning I said cheerfully 我想使用正则表达式删除双语音标记之间的文本但不删除语音标记本身所以它会返回 I opened m
python 硒按名称查找元素

查找电子邮件输入的正确代码是什么https accounts google com ServiceLogin html 是
使用 Popen 打开进程并获取 PID

我正在开发一个漂亮的小功能 def startProcess name path Starts a process in the background and writes a PID file returns integer pid Ch
使用张量流导出神经网络的权重

我使用张量流工具编写了神经网络一切正常现在我想导出神经网络的最终权重以制定单一的预测方法我怎样才能做到这一点您需要在训练结束时使用以下命令保存模型tf train Saver https www tensorflow org ver
类型错误：无法连接“str”和“int”对象有人可以帮助新手使用他们的代码吗？

感谢任何帮助还有任何重大缺陷或您在格式或基本方面看到的任何重大缺陷请指出谢谢 day raw input How many days locations raw input Where to days str day location
PySpark DataFrame 上分组数据的 Pandas 式转换

如果我们有一个由一列类别和一列值组成的 Pandas 数据框我们可以通过执行以下操作来删除每个类别中的平均值 df DemeanedValues df groupby Category Values transform lambda g
配置 Django 和 Google 云存储？

I am not使用应用引擎我有一个在虚拟机上运行的普通 Django 应用程序我想使用 Google Cloud Storage 来提供静态文件以及上传提供媒体文件我有一个水桶如何将 Django 应用程序链接到我的存储桶我
如何通过 API Gateway 使用事件调用类型调用 Lambda 函数？

文件说默认情况下 Invoke API 采用 RequestResponse 调用类型您可以选择通过将 Event 指定为 InitationType 来请求异步执行因此我可以发送到我的函数 python 的就是到处都是 Inspi
Python 中的可逆 STFT 和 ISTFT

有没有通用的形式短时傅立叶变换 https en wikipedia org wiki Short time Fourier transform与内置于 SciPy 或 NumPy 或其他什么中的相应逆变换这是pyplotspecgram
从 HDF5 文件中删除信息

我意识到 SO 用户以前曾问过这个问题question https stackoverflow com questions 1124994 removing data from a hdf5 file rq 1但它是在 2009 年被问到的
python：日志记录：我们可以向记录器添加多个过滤器吗？考虑哪一个

我试图了解 Python 日志记录中的多个过滤器一个在配置中定义另一个在代码中定义如何工作我正在开发一个 Django 项目下面是我在 settings py 中的记录器配置我的目标是switch on and switch o

随机推荐

一个文本区域中的文本应复制到另一个文本区域，并且应使用 JavaScript 单击按钮清除原始文本区域

我已经完成了以下代码它显示两个文本区域其中一个文本区域中的文本通过使用 javascript 单击按钮复制到另一个文本区域
键盘加速器在 UWP 应用中停止工作

我正在尝试将键盘加速器添加到 UWP 应用程序中的 CommandBar 菜单项当应用程序启动时这工作正常但在我第一次打开溢出菜单后加速器停止工作这似乎不会发生在主要命令菜单之外上只有溢出菜单内的辅助命令才会发生此外单击
无法为新的 Rails 安装安装 bcrypt-ruby

我在新安装 Rails 时遇到以下错误我跑bundle install安装了一堆 gems 后我在尝试安装 bcrypt ruby 时遇到错误我使用的是配备 OS X 10 8 2 最新 Ruby v1 9 3 p194 新 Rail
git 无法暂存文件，将所有文件显示为重复，但字符大小写不是问题

就我而言我对我的文件之一进行了简单的一项更改并想提交我的更改但注意到 commit am 没有添加提交该文件发出 git 后ls files stage 我看到项目中的所有文件可能都显示为重复项这是其中一个文件的示例 10064
PHP 静态变量用双引号引起来

如何让 PHP 计算双引号中的静态变量我想做这样的事情 log self CLASS METHOD entering 我尝试过各种组合来获取变量值self CLASS 但没有任何效果我目前已经解决了字符串连接问题但输入起来很痛苦 l
在 EXISTS 查询中使用 LIMIT 有什么意义吗？

添加一个是否有任何性能优势LIMIT to an EXISTS查询或者 MySQL 会自行应用限制吗 Example IF EXISTS SELECT 1 FROM my table LIMIT 1 can this improve pe
Tailwind CSS：在图像悬停时显示文本

如何使用 Tailwind CSS 在图像悬停时显示文本在图像悬停时显示文本这是我的头像吗我希望当用户将鼠标悬停在图像上时显示文本哺乳动物 img src img cat categories mammals png alt mam
使用API隐藏程序标题栏

它可以使用 c 和 windows api 删除窗口控制台标题栏如果是的话如何请这个简单的应用程序隐藏并显示其所在控制台的标题栏它会立即将控制台标题更改为 guid 以查找窗口句柄然后它使用 ToggleTitleBar 使用找
PHP 是否有与 Java 的 RequestDispatcher.forward 等效的功能？

在 Java 中我可以编写一个非常基本的 JSPindex jsp像这样这样做的效果是用户请求index jsp 或者只是包含目录假设index jsp是目录的默认文档将会看到home action没有浏览器重定向即 forward
即使 is_dir 是一个目录，它也会返回 false 吗？

为什么 is dir 即使是一个目录也会返回 false 没有返回错误 path mysql var lib mysql if is dir path mysql echo error 返回错误 path mysql var lib mys
如何使用 scala 宏打印变量名称和值？

我确信有一种更优雅的方式来编写以下宏来打印变量的名称和值 def mprintx c Context linecode c Expr Any c Expr Unit import c universe val namez c enclosi
是否允许将类模板类型参数键入相同的名称？

这似乎可以在 MSVC 中按预期编译甚至工作但它是合法的 C 代码吗它是否能保证执行此处所期望的操作即将模板类型导出到结构体的同名用户 template
如何从类外部更改公共 R6 类方法？

我希望能够在我的 R6 类中重新定义公共方法以便它根据该类保存的数据类型进行更改如下所示 library R6 Simple lt R6Class Simple public list dt mtcars my print functi
使用 Python 的文本中的词频但忽略停用词

这给了我文本中单词的频率 fullWords re findall r w allText d defaultdict int for word in fullWords d word 1 finalFreq sorted d iterit
将日期转换为 UTC 的正确方法

如果这个问题没有多大意义我很抱歉但我是 Actionscript 的新手并且想知道您是否可以帮助我解决这个问题我正在构建一个给定时区的应用程序告诉您该位置的时间当我使用时区为 GMT UTC 的位置时它效果很好但如果主机上的
使用 OpenGL 着色器进行数学计算 (C++)

我有一个矩阵例如 100x100 尺寸我需要对每个元素进行计算 matrix i j tt 8 5例如我有一个巨大的矩阵我想使用 OpenGL 着色器来实现该算法我想使用着色器例如 uniform float val unifo
理解@property装饰器和继承[重复]

这个问题在这里已经有答案了这里是 Python 3 以防万一它很重要我试图正确理解如何实现继承 property使用我已经搜索了 StackOverflow 并阅读了大约 20 个类似的问题但无济于事因为他们试图解决的问题略有不同
在Application_AquireRequestState事件中用POST数据重写Url

我有一个在其中注册路线的代码Application AcquireRequestState应用程序的事件注册路由后我会在 Http 运行时缓存中设置一个标志这样我就不会再次执行路由注册代码在此事件中注册路线有特定原因Applicat
Selenium Webdriver - Python - leboncoin - pb 选择带重音的按钮

我正在尝试在以下网站上自动填写表格 https www leboncoin fr https www leboncoin fr 我用 Selenium IDE 录制了一个脚本我有一个通过单击 Se 连接器按钮并填写我的密码和用户名来自动
Pandas Pivot_Table ：非数字值的行计算百分比

这是我在数据框 df 中的数据 Document Name Time SPS2315511 A 1 HOUR SPS2315512 B 1 2 HOUR SPS2315513 C 2 3 HOUR SPS2315514 C 1 HOUR S

Pandas Pivot_Table ：非数字值的行计算百分比

预期结果 ：

Pandas Pivot_Table ：非数字值的行计算百分比 的相关文章

随机推荐

热门标签

预期结果：

Pandas Pivot_Table ：非数字值的行计算百分比的相关文章