pandas 计算多列

2023-12-24

我有一个看起来像这样的数据框

Measure1 Measure2 Measure3 ...
0        1         3
1        3         2
3        0

我想计算列中值的出现次数以产生：

Measure Count Percentage
0       2     0.25
1       2     0.25
2       1     0.125
3       3     0.373

With

outcome_measure_count = cdss_data.groupby(key_columns=['Measure1'],operations={'count': agg.COUNT()}).sort('count', ascending=True)

我只得到第一列（实际上使用 graphlab 包，但我更喜欢 pandas）

有人可以帮助我吗？

您可以通过使用展平 df 来生成计数ravel and value_counts，由此您可以构建最终的 df：

In [230]:
import io
import pandas as pd

t="""Measure1 Measure2 Measure3
0        1         3
1        3         2
3        0        0"""

df = pd.read_csv(io.StringIO(t), sep='\s+')
df

Out[230]:
   Measure1  Measure2  Measure3
0         0         1         3
1         1         3         2
2         3         0         0

In [240]:    
count = pd.Series(df.squeeze().values.ravel()).value_counts()
pd.DataFrame({'Measure': count.index, 'Count':count.values, 'Percentage':(count/count.sum()).values})

Out[240]:
   Count  Measure  Percentage
0      3        3    0.333333
1      3        0    0.333333
2      2        1    0.222222
3      1        2    0.111111

我插入了一个0只是为了使 df 形状正确，但你应该明白这一点

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

graphlab

pandas 计算多列的相关文章

Flask 中“缺少 CSRF 令牌”，但它在模板中呈现

问题当我尝试登录使用 Flask login 时我得到Bad Request The CSRF session token is missing但令牌正在呈现在模板中 secret key 已设置并且我在本地运行localhost
为什么在访问 Python 对象属性时使用 getattr() 而不是 __dict__ ？

在具有一定程度的 Python 对象自省的源代码示例和 SO 答案中常见的模式是 getattr some object attribute name string 是否有理由优先选择这种模式 some object dict attri
如何计算数据框中按另一列的列值分组的一列的连续字符串值？

我有以下数据框 Levels Labels Confidence 0 Hands 0 8 0 Leg 0 7 0 Eye 0 9 1 Ear 0 9 1 Eye 0 8 2 Hands 0 9 2 Eye 0 8 3 Eye 0 8 我想检
将 Python Pandas DataFrame 写入 Word 文档

我正在努力创建一个使用 Pandas DataFrames 的 Python 生成的报告目前我正在使用DataFrame to string 方法但是这会作为字符串写入文件有没有办法让我实现这一目标同时将其保留为表格以便我可以使
Flask 失败并显示“错误：导入‘X’时，引发了 ImportError”，但不显示错误。如何找到错误的根源？

当使用以下命令启动 Flask 应用程序时 flask run 我收到错误 Error While importing wsgi an ImportError was raised Usage flask OPTIONS COMMAND A
查找正在导入哪些 python 模块

从应用程序中使用的特定包中查找所有 python 模块的简单方法是什么 sys modules是将模块名称映射到模块的字典您可以检查其键以查看导入的模块 See http docs python org library sys html
使用pathlib获取主目录

翻看新的pathlib在 Python 3 4 中我注意到没有任何简单的方法来获取用户的主目录我能想到的获取用户主目录的唯一方法是使用旧的os path像这样的库 import pathlib from os import path p
在linux上安装python ssl模块，无需重新编译

是否可以在已经安装了 OpenSSL 的 Linux 机器上安装 python 的 SSL 模块而无需重新编译 python 我希望它就像复制几个文件并将它们包含在库路径中一样简单 Python版本是2 4 3 谢谢是否可以在已经安装了
为什么 re.findall 在查找字符串中的三元组项时不具体。 Python

所以我有四行代码 seq ATGGAAGTTGGATGAAAGTGGAGGTAAAGAGAAGACGTTTGA OR 0 re findall r ATG 9 TAA TAG TGA seq 首先让我解释一下我正在尝试做什么如果这令人困惑
在 Linux 上使用多处理时，TKinter 窗口不会出现

我想生成另一个进程来异步显示错误消息同时应用程序的其余部分继续我正在使用multiprocessingPython 2 6 中的模块来创建进程我试图用以下命令显示窗口TKinter 这段代码在Windows上运行良好但在Linux上
通过 Python 循环浏览网络上的目录并显示其内容（文件和其他目录）

同样的道理在Python中处理从源目录到目标目录的一组文件 https stackoverflow com questions 2593399 process a set of files from a source directory t
为什么将模块级代码放入函数中然后调用该函数在Python中速度更快？

在亚历克斯马尔泰利的回应中使 Python 脚本面向对象 https stackoverflow com questions 1813117 making a python script object oriented 他提到在 Pyth
是否可以在Python中将日+月（不是年）与当前日+月进行比较？

我正在获取 5 月 10 日格式的数据我试图弄清楚它是今年还是明年该日期仅一年因此 5 月 10 日表示 2015 年 5 月 10 日而 5 月 20 日表示 2014 年 5 月 20 日为此我想将字符串转换为日期格式并进
无法导入QUERY_TERMS

我正在运行一个网站Python and Django Django filters 2 1 installed Django 2 1 installed 当我运行时我收到以下错误 importError Could not import
如何展平解析树并存储在字符串中以进行进一步的字符串操作 python nltk

我正在尝试从树结构中获取扁平树如下所示我想将整个树放在一个字符串中就像没有检测到坏树错误一样 S NP SBJ NP DT The JJ high JJ seven day PP IN of NP DT the CD 400 NNS
是否可以使用 Anaconda 包作为 Google Cloud Functions 的依赖项？

我正在使用 Python 运行时编写 Google Cloud Function 我需要包含一些无法使用的依赖项pip 如文档中所述here https cloud google com functions docs writing spe
Python 相当于 Scala 案例类

Python 中是否有与 Scala 的 Case Class 等效的东西就像自动生成分配给字段而无需编写样板的构造函数一样当前执行此操作的现代方法从 Python 3 7 开始是使用数据类 https www python org
没有名为“turtle”的模块

我正在学习并尝试用Python3制作贪吃蛇游戏我正在进口海龟我正在使用 Linux mint 19 PyCharm python37 python3 tk Traceback most recent call last File hom
如何同时接受int和float类型的输入？

我正在制作一个货币转换器如何让 python 同时接受整数和浮点数我就是这样做的 def aud brl amount From to ER 0 42108 if amount int if From strip aud and to
在Python中停止ThreadPool中的进程

我一直在尝试为控制某些硬件的库编写一个交互式包装器用于 ipython 有些调用对 IO 的影响很大因此并行执行任务是有意义的使用 ThreadPool 几乎效果很好 from multiprocessing pool import

随机推荐

错误：ggplot2 中的 stat_count()

在我的许多程序中我一直使用 ggplot2 来渲染图表我已将它们加载到shinyapps io 上并且它们工作得非常好但是当我尝试在我的机器上运行该程序时出现以下错误 Error stat count must not be u
如何使用 apache-POI 将 Excel 中的单元格设置为只读

我有一个下拉列表包含一些选项例如两个单元格我需要的是关于所选选项将其中一个单元格设置为可编辑将另一个单元格设置为只读反之亦然 FileOutputStream fos try fos new FileOutputStream D
只要互联网连接可用，就将数据发送到服务器 iOS

我正在开发一个 iOS 应用程序我想做的是每当用户通过设置应用程序打开关闭互联网时我想向设备设置一些通知简而言之我想在互联网连接可用时向服务器发送一些数据存储在 NSUserDefaults 中假设互联网连接在 2 3 天后
R Shiny rCharts https 服务器无法加载 fonts.googleapis.com

我运行了一个闪亮的 https 服务器我尝试使用 rCharts 绘制 dTable 以便我可以从数据表中进行多列排序请参阅https stackoverflow com a 20956772 719016 https stackove
Rails控制台测试加载开发环境

我有一个问题在哪里 rails console test 结果是 Loading development environment Rails 3 1 0 我怀疑这是一个RAILS ENV问题是因为做 RAILS ENV test rails
Django - 使用多个 GET 参数在模板中分页

我正在使用 Django Paginator 并且希望有多个可用的获取参数例如页 1 排序依据价格但是在我的模板标签中我有 Showing items sorted by SORT PARAM Showing ITEMS PER
如何自动化 Flutter Integration 测试命令？

我已经阅读并尝试过使用 flutter 进行集成测试我在这里遵循了本指南 https flutter io docs cookbook testing integration https flutter io docs cookbook
如何在Spring中使用单个@Bean注释方法（或类似方法）注册多个bean？

我有一个类似于以下内容的课程 Configuration public class ApplicationConfiguration private
Android - 约束拖放到边界框

Android 上拖放的默认行为显然允许将 DragShadow 拖动到屏幕上的任何位置我想限制它可以拖动的区域要么到指定的边界框要么到特定视图的边界我看到我可以使用 onInterceptTouchEvent 监视拖动位置但我没
java.lang.NullPointerException：尝试调用虚拟方法'android.app.ActivityThread$ApplicationThread

我知道这可能是重复的但我的情况不同需要对这个具体问题进行一些解释我收到错误 java lang NullPointerException Attempt to invoke virtual method android app Act
具有多对多表的数据透视表

我的 SQL Fiddle 在这里 http sqlfiddle com 3 d5c60 http sqlfiddle com 3 d5c60 CREATE TABLE customer id int identity primary ke
在 VS code 编辑器或 Sublime 编辑器中打开文件夹时，点和下划线与文件名一起显示

我正在使用 MacBook Air 我从以下位置下载了可视化代码编辑器here https code visualstudio com 我测试了该页面并且它可以工作我遇到文件名问题我得到文件名两次第一个文件名从我的第二个文件名是正确
开玩笑：测试套件运行失败，SyntaxError：意外的令牌导入

这是我的玩笑配置 https facebook github io jest docs configuration html从 package json 文件 jest automock false browser true moduleN
pyinstaller EXE OSError：无法找到或加载spatialindex_c-64.dll

我正在使用 Window 10 64 位来创建 exe 但是 exe 出现以下错误文件 rtree core py 第 126 行位于 OSError 无法找到或加载spatialindex c 64 dll 23324 无法执行脚本微
如何在asp.net core中使用websocket

我正在尝试开发一个游戏其中我将记分板存储在存储在服务器上当前在本地主机上的文本文件中我正在使用 http get 和 post 调用来与服务器通信并获取和发送我想要的数据现在我想实现 websockets 以便将通知从服务器发送到
对列表中每个元组的第二个值求和

给定结构化数据例如 a 1 b 3 c 2 我怎样才能对整数求和这里 sum1 3 2 to get 6 使用sum内置在单个表达式中 sum n for n in structure 会工作
spring中如何使用SimpleJDBCCall获取存储过程的多表结果？

我正在实施一个Spring MSSQL Server 2008应用我用SimpleJDBCCall用于执行存储过程并检索结果的 API 对于具有单表结果的存储过程它工作正常但我不知道如何将其用于具有多表结果的过程程序主体示例多表
从下拉菜单中调用 javascript 函数

我现在有这个 HTML 代码 Theme ul li Choose theme ul li a href Default a li li a href Theme 1 a li li a href Theme 2 a li li a hre
Objective C 中使用 alloc 的目的

有什么区别 NSNumber number NSNumber alloc initWithInt 13 and NSNumber number NSNumber initWithInt 13 当两者解决相同的目的时为什么要分配 NSNumb
pandas 计算多列

我有一个看起来像这样的数据框 Measure1 Measure2 Measure3 0 1 3 1 3 2 3 0 我想计算列中值的出现次数以产生 Measure Count Percentage 0 2 0 25 1 2 0 25 2 1

pandas 计算多列

pandas 计算多列 的相关文章

随机推荐

热门标签

pandas 计算多列的相关文章