Pandas 非常简单分组总大小的百分比

2023-12-03

我在看似极其简单的操作中遇到了麻烦。通过诸如此类的操作从组中获取总数百分比的最简洁方法是什么df.groupby['col1'].size()。分组后我的 DF 看起来像这样，我只想要总数的百分比。我记得过去使用过此语句的变体，但现在无法使其工作：percent = totals.div(totals.sum(1), axis=0)

原始DF：

       A   B   C
    0  77   3  98
    1  77  52  99
    2  77  58  61
    3  77   3  93
    4  77  31  99
    5  77  53  51
    6  77   2   9
    7  72  25  78
    8  34  41  34
    9  44  95  27

Result:

df1.groupby('A').size() / df1.groupby('A').size().sum()

    A
    34    0.1
    44    0.1
    72    0.1
    77    0.7

到目前为止，这是我想到的，这似乎是相当合理的方法：

df.groupby('col1').size().apply(lambda x: float(x) / df.groupby('col1').size().sum()*100)

我不知道我是否遗漏了一些东西，但看起来你可以做这样的事情：

df.groupby('A').size() * 100 / len(df)

df.groupby('A').size() * 100 / df.shape[0]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas 非常简单分组总大小的百分比的相关文章

Virtualenv 在 OS X Yosemite 上失败并出现 OSError

我最近更新到 OSX Yosemite 现在无法使用virtualenv pip 每当我执行 virtualenv env 它抛出一个 OSError Command Users administrator ux env bin pytho
在python中将数据库表写入文件的最快方法

我正在尝试从数据库中提取大量数据并将其写入 csv 文件我正在尝试找出最快的方法来做到这一点我发现在 fetchall 的结果上运行 writerows 比下面的代码慢 40 with open filename a as f writ
多处理中的动态池大小？

有没有办法动态调整multiprocessing Pool尺寸我正在编写一个简单的服务器进程它会产生工作人员来处理新任务使用multiprocessing Process对于这种情况可能更适合因为工作人员的数量不应该是固定的但我需
反编译Python 3.9.2的PYC文件[重复]

这个问题在这里已经有答案了目前我有一个 3 9 2 版本的 python 的 PYC 文件 P S 这适用于所有 3 9 及更高版本我正在尝试反编译 PYC 文件但它显示错误因为 uncompyle6 或者更确切地说新版本 de
使用 Django 将文件异步上传到 Amazon S3

我使用此文件存储引擎在上传文件时将文件存储到 Amazon S3 http code welldev org django storages wiki Home http code welldev org django storages w
无法在 selenium 和 requests 之间传递 cookie，以便使用后者进行抓取

我用 python 结合 selenium 编写了一个脚本来登录网站然后从driver to requests这样我就可以继续使用requests进行进一步的活动 I used item soup select one div class
如何过滤 Pandas GroupBy 对象并获取 GroupBy 对象？

当对 Pandas groupby 操作的结果执行过滤时它返回一个数据帧但假设我想执行进一步的分组计算我必须再次调用 groupby 这似乎有点绕有更惯用的方法吗 EDIT 为了说明我在说什么我们无耻地从 Pandas 文档中窃取
创建上下文后将 jar 文件添加到 pyspark

我正在笔记本上使用 pyspark 并且不处理 SparkSession 的创建我需要加载一个包含一些我想在处理 rdd 时使用的函数的 jar 您可以使用 jars 轻松完成此操作但在我的特定情况下我无法做到这一点有没有办法访问sp
使用 Paramiko 进行 DSA 密钥转发？

我正在使用 Paramiko 在远程服务器上执行 bash 脚本在其中一些脚本中存在与其他服务器的 ssh 连接如果我只使用 bash 不使用 Python 我的 DSA 密钥将被第一个远程服务器上的 bash 脚本转发并使用以连接
在 python pandas 中，如何保存“网格图”？

我对 pandas 绘图工具很陌生在文档中以下命令非常方便 myplot rts ret hist bins 50 by rts primary mic 然而当我尝试从图中获取图形参考并保存它时问题就出现了 myfigure myp
python 中的 <> 运算符有什么作用？

我刚刚遇到这个here http www feedparser org feedparser py 总是这样使用 if string1 find string2 lt gt 1 pass 什么是 lt gt 运算符这样做为什么不使用通常的
两个不同长度的数据帧的列之间的余弦相似度？

我在 df1 中有文本列在 df2 中有文本列 df2 的长度将与 df1 的长度不同我想计算 df1 text 中每个条目与 df2 text 中每个条目的余弦相似度并为每场比赛给出分数输入样本 df1 mahesh suresh
是否需要关闭没有引用它们的文件？

作为一个完全的编程初学者我试图理解打开和关闭文件的基本概念我正在做的一项练习是创建一个脚本允许我将内容从一个文件复制到另一个文件 in file open from file indata in file read out file
使用另一个数据帧在数据帧中创建子列

我对 python 和 pandas 很陌生在这里我有一个以下数据框 did features offset word JAPE feature manual feature 0 200 0 aa 200 200 0 200 11 bf
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
Python bug - 或者我的愚蠢 - 扫描字符串文字时 EOL

我看不出以下两行之间有显着差异然而第一个解析而后者则不解析 In 5 n Axis of Awesome In 6 n Axis of Awesome File
如何给URL添加变量？

我正在尝试从网站收集数据我有一个 Excel 文件其中包含该网站的所有不同扩展名 F i www example com example2 我有一个脚本可以成功从网站中提取 HTML 但现在我想为所有扩展自动执行此操作然而当我说 s
rpy2 无法加载外部库

希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包该包以 rJava 作为依赖项 venneuler 和 rJa
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome
如何（安全）将 Python 对象发送到我的 Flask API？

我目前正在尝试构建一个 Flask Web API 它能够在 POST 请求中接收 python 对象我使用 Python 3 7 1 创建请求使用 Python 2 7 运行 API 该 API 设置为在我的本地计算机上运行我试图发

随机推荐

PHP mySQL - 你能返回一个带有数字索引的关联数组吗？

我的数据库类中有这个方法 public function query queryString if this gt connected this gt connectToDb connect to database results mysq
PS4 控制器 - 当值为 1 时光标不移动

我试图编写程序来使用 PS4 控制器控制鼠标一切正常我获取数据并且可以相应地移动鼠标然而当我将操纵杆固定在任何轴上时鼠标不会移动这不仅在我握住它时发生而且在操纵杆值没有改变时也会发生有什么办法可以解决这个问题吗 import
为可变参数模板函数中的每个模板类型调用 void 函数？

我的目标是编写一个简单的通用函数来注册任意 C 类型的转换器为了简单起见我将只打印 C 类型名称我希望能够调用我的通用函数print type name适用于任何类型的函数包括同时使用多种类型可变参数 template
如何使用 C# 读取/加载 datagridview 中的文本 (*.txt) 文件值？

谁能帮我在这里我需要在我的 datagridview 中读取加载文本 txt 文件值这是我需要加载的示例文本文件 S NO Data1 Data2 Data3 Data4 Data5 Data6 Data7 Data8 Data9
Sphinx 中类链接的缩写名称

seealso Class class apps business models Department Explanation goes here GNU tar manual Basic Tar Format
如何使用 TXMLDocument 将名称空间前缀添加到每个节点

我使用 XML 绑定向导创建了 TXMLDocument 的后代此类生成的文件将在根节点中声明名称空间并为文档的其余部分创建简单的未经修饰的节点
带有外语数字字段的 MS Access 数据库

我有一个 MS Access 2007 数据库我在哥伦比亚和厄瓜多尔的一些客户遇到了一个问题我相信还会出现更多问题他们的编号格式与美国不同他们使用小数点或句点字符作为百万和千位分隔符并使用逗号字符作为小数位这要么导致类型
从嵌套对象数组中删除对象 mongodb

我收集了包含志愿者信息的集合并将志愿者列为对象数组我可以显示每个志愿者的所有班次但从数组中删除一个对我来说很困难样本数据 id ObjectId 59180305c19dbaa4ecd9ee59 where Merchandise
如何使用具有相应别名的java代码在密钥库中仅存储公钥？

我已经创建了密钥库我只想在密钥库中存储公钥并且不想存储私钥因为私钥将位于客户端设备中并且他将使用rest API共享公钥另外我应该如何在一个密钥库中保留多个公钥具有不同的别名如果有人有示例代码或示例链接那将对我很有帮助这
Java 中可靠且快速的 FFT [关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案因为我不想自己做所以我正在寻找一个好的 Java 的 FFT 实现首先我在这里使用这个FFT普林斯顿但它使用对象我的分析器告诉我由于这个事实它并不是很快于是我又用谷歌搜索
使用VSTO读取Excel中的ActiveCell内容

我正在尝试从 Excel 加载项中读取 ActiveCell 但没有走得太远有人有什么想法吗 Excel Window W this Application ActiveWindow as Excel Window Excel Range
上传图片MVC始终为空

大家好我正在尝试上传一个简单的图像但 HttpPostedFileBase 始终保持为空这是我的代码我不知道我做错了什么这是我在设计视图中的代码 fieldset legend PictureModel legend div cl
常量和 Matlab Coder

在 Matlab Coder 中运行时某些函数要求输入为常量我希望找到一种方法在输入之前将输入声明为常量作为有问题的情况的示例 function foo subsubfunction x y B A butter 1 x y 这将返回错
将地图图钉添加到 Google 地图 Android 的最佳方法

我已成功添加图钉但当用户单击地图并提供新位置时需要刷新图钉我收到错误请记住我需要在后台发生此操作以便它不会影响地图交互我的问题是当用户单击地图时地图图钉列表已经更新我得到一个ConcurrentModificationEx
使用 HTML5 设置视频播放时长

我有一个使用 TimeJump js 的简单 HTML5 视频播放器 http davatron5000 github io TimeJump 以允许直接跳转到特定时间代码 IE 跳转到视频的第 25 分钟我想添加对视频播放时长的限制因
上传文件[重复]

这个问题在这里已经有答案了可能的重复如何在网页上实现文件上传进度条 Hello 我见过很多网页用户可以上传文件并且会得到某种进度作为视觉反馈水平条百分比等我的 html 表单是
通过连接传播 pandas 系列元数据

我希望能够将元数据附加到一系列数据帧特别是原始文件名以便在加入两个数据帧后我可以看到有关每个系列来自何处的元数据我看到 github 问题有关 metadata here here 包括一些与当前相关的 metadata属性 here
从 .odt 文件填充 QTextDocument

我正在使用 C 和 Qt 编写一个富文本编辑器目前我希望它支持至少 odt 格式我发现 QTextDocumentWriter 用于将 QTextDocument 的内容写入文件但我似乎找不到任何东西可以将其读回到 QTextDo
从类外部访问类属性

假设我有以下课程 class MyClass public function Talk Say Something return Say 然后我启动了该类的一个实例 Inst new MyClass 现在我如何在 MyClass 之外调用
Pandas 非常简单分组总大小的百分比

我在看似极其简单的操作中遇到了麻烦通过诸如此类的操作从组中获取总数百分比的最简洁方法是什么df groupby col1 size 分组后我的 DF 看起来像这样我只想要总数的百分比我记得过去使用过此语句的变体但现在无法使其工作 p

Pandas 非常简单 分组总大小的百分比

Pandas 非常简单 分组总大小的百分比 的相关文章

随机推荐

热门标签

Pandas 非常简单分组总大小的百分比

Pandas 非常简单分组总大小的百分比的相关文章