Pandas：制作带有百分比的数据透视表

2023-12-07

我有数据框

ID,url,used_at,active_seconds,domain
61a77f9e5fd52a50c10cd2d4d886ec68,mazdaspb.ru,2015-01,6,mazdaspb.ru
61a77f9e5fd52a50c10cd2d4d886ec68,mazdaspb.ru/cars/mazda-cx-5/crossover/overview,2015-01,12,mazdaspb.ru
61a77f9e5fd52a50c10cd2d4d886ec68,mazdaspb.ru/cars/mazda-cx-5/crossover/overview,2015-01,19,mazdaspb.ru
61a77f9e5fd52a50c10cd2d4d886ec68,vw-stat.ru,2015-01,40,vw-stat.ru
61a77f9e5fd52a50c10cd2d4d886ec68,vw-stat.ru/models/new_tiguan,2015-01,12,vw-stat.ru
61a77f9e5fd52a50c10cd2d4d886ec68,vw-stat.ru/models/new_tiguan/comps,2015-01,48,vw-stat.ru
61a77f9e5fd52a50c10cd2d4d886ec68,vw-stat.ru/models/new_tiguan/comps/new_tiguan_track_field,2015-01,4,vw-stat.ru
61a77f9e5fd52a50c10cd2d4d886ec68,vw-stat.ru/models/new_tiguan/comps/new_tiguan_track_field?engine_type=DIESEL&DIESEL=engines_4e53a3c8e986d,2015-01,78,vw-stat.ru
41c2fd7a372729dfe336e44730169f28,avito.ru/saratov/avtomobili_s_probegom/volkswagen/golf?f=188_886b887,2015-01,8,avito.ru
41c2fd7a372729dfe336e44730169f28,avito.ru/saratov/avtomobili_s_probegom/volkswagen/golf?f=188_886b887,2015-01,1,avito.ru
41c2fd7a372729dfe336e44730169f28,avito.ru/saratov/avtomobili_s_probegom/volkswagen/golf?f=188_886b887,2015-01,2,avito.ru

我需要制作数据透视表，并且应该有所有唯一 ID 的百分比值。我可以得到

group = pd.pivot_table(df, index='used_at', columns='domain', values='ID', aggfunc=(lambda x: x.count()))

但它每个月都会返回每个域的唯一 ID 数量。我怎样才能将其转换为百分比？

IIUC 你可以使用参数margins对于总和值pivot_table然后除最后一行的所有值All by div:

group = pd.pivot_table(df, 
                       index='used_at', 
                       columns='domain', 
                       values='ID', 
                       aggfunc=len, 
                       margins=True)
print (group)
domain   avito.ru  mazdaspb.ru  vw-stat.ru   All
used_at                                         
2015-01       3.0          3.0         5.0  11.0
All           3.0          3.0         5.0  11.0

print (group.iloc[:-1])
domain   avito.ru  mazdaspb.ru  vw-stat.ru   All
used_at                                         
2015-01       3.0          3.0         5.0  11.0

print (group.iloc[-1])
domain
avito.ru        3.0
mazdaspb.ru     3.0
vw-stat.ru      5.0
All            11.0
Name: All, dtype: float64

print (group.iloc[:-1].div(group.iloc[-1], axis=1) * 100)
domain   avito.ru  mazdaspb.ru  vw-stat.ru    All
used_at                                          
2015-01     100.0        100.0       100.0  100.0

除以个体计数的解决方案div and mul:

group = pd.pivot_table(df, 
                       index='used_at',
                       columns='domain', 
                       values='ID', 
                       aggfunc=len)
          .div(len(df.index))
          .mul(100)
print (group)

domain    avito.ru  mazdaspb.ru  vw-stat.ru
used_at                                    
2015-01  27.272727    27.272727   45.454545

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

unique

pivottable

percentage

Pandas：制作带有百分比的数据透视表的相关文章

virtualenvwrapper 函数在 shell 脚本中不可用

所以我再一次制作了一个很棒的 python 程序它让我的生活变得更加轻松并节省了大量时间当然这涉及到一个 virtualenv 用mkvirtualenvvirtualenvwrapper 的功能该项目有一个requiremen
有什么好的适用于 Google App Engine 应用程序的 AJAX 框架吗？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在尝试在我的 Google App Engine 应用程序中实现 AJAX 因此我正在寻找一个好的
pandas read_csv 之前预处理数据文件

我使用 SAP 的数据输出但它既不是 CSV 因为它不引用包含其分隔符的字符串也不是固定宽度因为它具有多字节字符它是一种固定宽度字符为了将其放入 pandas 我当前读取文件获取分隔符位置对分隔符周围的每一行进行切片然后
我可以在 matplotlib 中的绘图左侧放置一个垂直颜色条吗？

来自颜色条方法的 matplotlib 命令摘要 http matplotlib org api pyplot api html highlight colorbar matplotlib pyplot colorbar我知道关键字参数or
删除 tkinter 文本默认绑定

我正在制作一个简单的 tkinter 文本编辑器但我想要所有默认绑定文本小部件如果可能的话删除例如当我按Ctrl i它默认插入一个制表符我制作了一个事件绑定来打印文本框中有多少行我将事件绑定设置为Ctrl i以及当我运行它时它会
在多核上运行 python 线程

我知道Python 2 7不允许在不同的内核上运行多个线程你需要使用multiprocessing模块以实现某种程度的并发性我正在看concurrent futuresPython 3 4 中的模块是否使用ThreadPoolExec
无法使用Python请求会话模块登录网站

我刚刚开始进行网络抓取对于我的第一个项目我尝试使用 requests Session 登录 artofproblemsolving com 并访问另一个用户的帐户这是我的代码 import requests LOGIN URL htt
Python Apache Beam 端输入断言错误

我对 Apache Beam Cloud Dataflow 还很陌生所以如果我的理解不正确我深表歉意我正在尝试通过管道读取大约 30 000 行长的数据文件我的简单管道首先从 GCS 打开 csv 从数据中提取标题通过 ParDo
lmfit模型拟合然后预测

我正在领养lmfit进行曲线拟合并使用拟合模型进行预测然而下面的代码并没有达到我想要的效果能否请你帮忙谢谢 import numpy as np from lmfit import Model def linearModel x a0
当元组列表中相同项目的值是字符串时，对它们的值求和

如果我有这样的元组列表 my list books 5 books 10 ink 20 paper 15 paper 20 paper 15 我怎样才能把列表变成这样 books 15 ink 20 paper 50 即添加同一项目的费用
“KMeans”对象没有属性“k”

我使用 Yellowbrick 包绘制数据集的肘部曲线以使用 KMeans 作为模型找到数据集的最佳簇数我正在使用 Scikit learn KMeans 和 Yellowbrick kelbowvisualizer 函数生成了肘部曲
将 str.contains 映射到 pandas DataFrame

python 初学者我正在寻找创建字符串的字典映射以及关联的值我有一个数据框想要创建一个新列如果字符串匹配则会将该列标记为 x df pd DataFrame comp dell notebook dell notebook S3
为什么我无法杀死 k8s pod 中的 python 进程？

我试图杀死一个 python 进程 ps aux grep python root 1 12 6 2 1 2234740 1332316 Ssl 20 04 19 36 usr bin python3 batch run py root 4
如何在类型提示中定义元组或列表的大小

有没有办法在参数的类型提示中定义元组或列表的大小目前我正在使用这样的东西 from typing import List Optional Tuple def function name self list1 List Class1 if
为什么我会在 Python 字符串格式中使用除 %r 之外的其他内容？

我偶尔会使用 Python 字符串格式这可以像这样完成 print int i Float f String s 54 34 434 some text 但是这也可以这样做 print int r Float r String r 54
将二进制数据视为文件对象？

在此代码片段由另一个人编写中 self archive是一个大文件的路径并且raw file是以二进制数据形式读取的文件内容 with open self archive rb as f f seek offset raw file s
JSONDecodeError：额外数据：Python [重复]

这个问题在这里已经有答案了我使用以下代码从文件加载 json file file name obj list with open file as f for json obj in f obj list append loads json
如何使用 keras.backend.gradients() 获取梯度值

我试图获得 Keras 模型的输出相对于模型输入 x 而不是权重的导数似乎最简单的方法是使用 keras backend 中的梯度它返回梯度张量 https keras io backend https keras io backe
将二进制数转换为包含每个二进制数的数组

我试图将二进制值转换为每个 1 0 的列表但我得到默认的二进制值而不是列表我有一个字符串我将每个字符转换为二进制它给了我一个列表其中每个字符都有一个字符串现在我试图将每个字符串拆分为值为 0 1 的整数但我什么也得不到 if
在Python中使用os.makedirs创建目录时出现权限问题

我只是想处理上传的文件并将其写入工作目录中该目录的名称是系统时间戳问题是我想以完全权限创建该目录 777 但我不能使用以下代码创建的目录755权限 def handle uploaded file upfile cTimeStamp

随机推荐

导入 .ics 文件时出现 Google 日历错误

我很难让我的订阅日历与 Google 日历配合使用以下 URL 可在 Outlook 和 Apple 日历 iCal 中正常工作但我收到来自 Google 的错误您提供的地址不包含有效 iCal 或 GData 格式的日历我的 UR
调试 python 多处理中的错误

我正在使用Pool的功能multiprocessing模块以便在不同数据上并行运行相同的代码事实证明我的代码在某些数据上引发了异常但没有给出发生这种情况的精确行 Traceback most recent call last File
使用 Apache Spark (Java) 将 CSV 数据加载到 Dataframe 并转换为数组

我有一个包含以下数据的 CSV 文件 1 2 5 2 4 2 3 我想将它们加载到具有数组字符串模式的数据框中输出应如下所示 1 2 5 2 4 2 3 这里已经使用 scala 回答了这个问题 Spark 将字符串列转换为数组我想在
Excel VBA 更改 HTML 选择标记中的选项

最近我发布了一个问题vbscript 捕获 HTML 选择选项标记中的文本这对我在 Internet Explorer 平台上的帮助很大但是我有一个新项目其网站稍微复杂一些该网站有多个嵌套表格这些表格的格式可容纳form元素
对流并集进行排序以识别 Apache Flink 中的用户会话

我有两个事件流 L l1 l3 l8 比较稀疏表示用户登录某个 IP E e2 e4 e5 e9 是特定IP的日志流较低的索引代表时间戳如果我们将两个流连接在一起并按时间排序我们会得到 l1 e2 l3 e4 e5 l8 e9 是否可
在 WPF 中使用 ViewModel 创建 UserControl

您认为使用 ViewModel 创建 UserControl 并将两者部署在一起是一个很好的做法吗这样 UserControl 将绑定到现有的 ViewModel 对我来说似乎是个好主意但我从未见过这样的事情 Thanks 使用此方法时
Java - 如何在JNLP文件中自动获取IP地址？

在JNLP文件中如何自动获取IP地址例子
如何切换到使用 Homebrew 安装的 ruby 1.9.3？

我已经使用安装了 ruby 1 9 3hombrew 酿造安装红宝石但仍然使用默认的1 8 7 如何将 osx 切换为使用 1 9 3 作为默认 ruby 简短回答通过自制程序安装 ruby 后只需执行以下操作 brew link o
如何将 AWS API Gateway 查询字符串映射到 C# AWS Lambda 函数？

我有一个使用 GET 请求从 API 网关调用的 C lambda 函数 LambdaSerializer typeof Amazon Lambda Serialization Json JsonSerializer public Resp
模态视图中的导航视图

我是模态视图的新手似乎无法在模态视图中显示导航视图如何在模态视图中构建导航视图正如沙所说 MyViewController myViewController MyViewController alloc init UINavigati
asp.net core app.UseExceptionHandler() 处理某些端点的异常？

我正在向现有 ASP NET Core Web 应用程序添加一些 Web API 方法这意味着我的新 Web API 控制器将具有该属性 ApiController 调用客户端将期望返回输出为 JSON 而不是常规 HTML 在另一个项目
Android 显示日期从一周到另一周（周四到周四）

这两天我一直被这个问题困扰我的问题是如何显示一周到另一周周四到周四的日期例如 1 30 2014 to 2 6 2014 or 30 jan 2014 to 6 feb 2014 当一周结束时它会发生变化例如 2 6 2014
git windows 拉取后

我最近从 svn 转换过来我的服务器在 Windows 下别怪我这不是我的选择我创建了一个具有两个分支 master 和 stable 的存储库在我的服务器上我想从稳定分支获取文件我已经做好了 git clone git ur
如何将 JQuery Datatable.net 与 ASP.Net 4 Razor 和 Twitter Bootstrap 结合使用

我想将 jQuery Datatable 与 ASP net MVC 和 Twitter bootstrap 一起使用有人已经这样做了吗这可能是一篇旧文章但我只是想补充一下我是如何设置的看起来比codea上面的做法要简单一些 1 在
C++11 及更高版本中是否存在 FENV_ACCESS 编译指示？

阅读错误报告clang 不支持 FENV ACCESS pragma我遇到过一个comment 设置舍入模式而不使用 pragma STDC FENV ACCESS ON调用未定义的行为参见 C11 7 6 1 2 这个编译指示在 C 中
如何在 Flutter Camera Plugin 中实现 Tap To Focus？

一个非常简单的问题如何为 Flutter 相机插件实现点击对焦功能我在整个万维网上搜索了解决方案但一无所获有人有想法吗您必须使用相机控制器方法手动设置焦点 controller setFocusPoint offset 查看官方A
Java 导入中的通配符如何工作？

我注意到我的一些意想不到的结果imports 我希望了解到底发生了什么我从以下几点开始 import java util import java io import java nio import java nio file Path i
当光标悬停在 Flex 应用程序上时禁用鼠标滚轮滚动？

当光标位于 Flex 应用程序上时是否可以在网页上禁用鼠标滚轮滚动我的 Flex 应用程序是一个地图允许用户使用鼠标滚轮放大和缩小但是当我将 Flex 应用程序放到网页上时滚轮会导致页面滚动而不是放大和缩小 Edit 我已经向我
使用 Linq 和 C#，是否可以连接两个列表，但每个项目都交错？

有两个相同对象类型的列表我想使用交错模式加入他们其中i第一个列表的项目由j第二个列表中的项目在本质上第一份清单 a b c d e f g h 第二个清单 0 1 2 3 4 其中第一个列表的分组计数为 3 第二个列表的分组计数为
Pandas：制作带有百分比的数据透视表

我有数据框 ID url used at active seconds domain 61a77f9e5fd52a50c10cd2d4d886ec68 mazdaspb ru 2015 01 6 mazdaspb ru 61a77f9e5f

Pandas：制作带有百分比的数据透视表

Pandas：制作带有百分比的数据透视表 的相关文章

随机推荐

热门标签

Pandas：制作带有百分比的数据透视表的相关文章