Pandas：使用 groupby 获取每个数据类别的平均值

2024-02-24

我有一个如下所示的数据框：

>>> df[['data','category']]
Out[47]: 
          data     category
  0       4610            2
 15       4610            2
 22       5307            7
 23       5307            7
 25       5307            7
...        ...          ...

数据和类别都是数字，所以我可以这样做：

>>> df[['data','category']].mean()
Out[48]: 
data        5894.677985
category      13.805886
dtype: float64

我正在尝试获取每个类别的平均值。它看起来很简单，但是当我这样做时：

>>> df[['data','category']].groupby('category').mean()

>>> df.groupby('category')['data'].mean()

它返回这样的错误：

DataError: No numeric types to aggregate

如果我将上面的两个函数替换为.count().

我做错了什么？获取每个类别的平均值的正确方法是什么？

你能做一个 df.dtypes 吗？在下面的示例中，类型是 Int，因为它工作正常。

    import pandas as pd

    ##group by 1 columns
    df = pd.DataFrame({' data': [4610, 4611, 4612, 4613], 'Category': [2, 2,    7, 7]})
    print df.groupby('Category'). mean()


    ##Mutiple columns to group by
    df1 = pd.DataFrame({' data': [4610, 4611, 4612, 4613], 'Category': [2,    2, 7, 7], 'Category2' : ['A','B','A','B']})
    key=['Category','Category2']
    print df1.groupby( key).mean()

 Category Category2       
 2        A           4610
          B           4611
 7        A           4612
          B           4613

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Aggregate

mean

Pandas：使用 groupby 获取每个数据类别的平均值的相关文章

“NoneType”对象不可订阅？

list1 name1 info1 10 list2 name2 info2 30 list3 name3 info3 50 MASTERLIST list1 list2 list3 def printer lst print Availa
是否可以将名为“None”的值添加到枚举类型？

我可以将名为 None 的值添加到枚举中吗例如 from enum import Enum class Color Enum None 0 represent no color at all red 1 green 2 blue 3 co
隐藏控制台并执行 python 脚本

我正在尝试使用 pyinstaller 在 Windows 10 上使用 pyqt5 模块编译在 python 3 中构建的 python 脚本该脚本在运行时隐藏窗口为了编译我的脚本我执行了以下命令 pyinstaller onefi
MySQL 的 read_sql() 非常慢

我将 MySQL 与 pandas 和 sqlalchemy 一起使用然而它的速度非常慢对于一个包含 1100 万行的表一个简单的查询需要 11 分钟以上才能完成哪些行动可以改善这种表现提到的表没有主键并且仅由一列索引 fro
使用 asyncore 读取网站

我想异步阅读一个网站据我所知这是不可能的 urllib 现在我尝试使用普通套接字进行阅读但是 HTTP 给我带来了麻烦我遇到了各种时髦的编码例如传输编码分块必须手动解析所有这些东西我现在想编码 C 而不是 python 难道
使用 Pandas 滚动差异

您好我正在尝试使用 Pandas 滚动函数来计算下表中的滚动差异我正在尝试生成每月可用项目列中的值但没有得到任何结果请帮忙 Item Adds Subtracts Month Monthly Available items A
将带有非字符串关键字的 dict 传递给 kwargs 中的函数

我使用具有签名功能的库f args kwargs 我需要在 kwargs 参数中传递 python dict 但 dict 不包含关键字中的字符串 f 1 2 3 4 Traceback most recent call last File
无法将 python 数据框中的列类型从 object 转换为 str

我已经下载了一个csv文件然后将其读取到python dataframe 现在所有4列都有对象类型我想将它们转换为str类型现在dtypes的结果如下 Name object Position Title object Departm
Python 中 Goto 标签的替代方案？

我知道我不能使用 Goto 我也知道 Goto 不是答案我读过类似的问题但我只是想不出解决我的问题的方法所以我正在编写一个程序你必须在其中猜测一个数字这是我遇到问题的部分的摘录 x random randint 0 100 I
“分页文件太小，无法完成此操作”尝试训练 YOLOv5 对象检测模型时出错

我有大约 50000 个图像和注释文件用于训练 YOLOv5 对象检测模型我在另一台计算机上仅使用 CPU 训练模型没有问题但需要太长时间因此我需要 GPU 训练我的问题是当我尝试使用 GPU 进行训练时我不断收到此错误 OSE
Python 对象属性 - 访问方法

假设我有一个具有某些属性的类在 Pythonic OOP 中如何访问这些属性是最好的就像obj attr 或者也许编写 get 访问器此类事物可接受的命名风格是什么 Edit 您能否详细说明使用单下划线或双前导下划线命名属性的最佳实
使用 Beautifulsoup 解析时保持 XML 文件的缩进

我正在使用 BS4 解析 XML 文件并尝试将其写回新的 XML 文件输入文件
在 Python 中将 int 转换为 ASCII 并返回

我正在为我的网站制作一个 URL 缩短器我当前的计划我愿意接受建议是使用节点 ID 来生成缩短的 URL 因此理论上节点 26 可能是short com z 节点 1 可能是short com a 节点 52 可能是short c
NumPy 数组不可 JSON 序列化

创建 NumPy 数组并将其保存为 Django 上下文变量后加载网页时收到以下错误 array 0 239 479 717 952 1192 1432 1667 dtype int64 is not JSON serializable
使用 PIL 合并图像时模式不匹配

我正在传递 jpg 文件的名称 def split image into bands filename img Image open filename data img getdata red d 0 0 0 for d in data L
使用 JSON 可序列化枚举自动生成棉花糖模式

创建与我的模型相同的棉花糖模式的日子已经一去不复返了我发现这个优秀的答案 https stackoverflow com a 42892443 4097322这解释了我如何使用简单的装饰器从 SQA 模型自动生成模式因此我实现了它并替换
Python中如何实现相对导入

考虑 stuff init py mylib py Foo init py main py foo init py script py script py想要进口mylib py 这只是一个示例但实际上我只想在父目录中进行模块的相对导入
矩阵求逆 (3,3) python - 硬编码与 numpy.linalg.inv

对于大量矩阵我需要计算定义为的距离度量尽管我确实知道强烈建议不要使用矩阵求逆但我没有找到解决方法因此我尝试通过对矩阵求逆进行硬编码来提高性能因为所有矩阵的大小均为 3 3 我预计这至少会是一个微小的改进但事实并非如此为什么
每行中最后一次出现 True 的索引

我有一个二维数组 a False False False False False True True True True True True True True True True True True True True True True
如何访问模板缓存？ - 姜戈

I am 缓存 HTML在几个模板内例如 cache 900 stats stats endcache 我可以使用以下方式访问缓存吗低级图书馆例如 html cache get stats 我确实需要对模板缓存进行一些细粒度的控制有任

随机推荐

嵌入式领域“软复位”和“硬复位”有什么区别？

在我看来软复位从复位向量启动硬重置拉cpu的电平硬复位当然意味着整个CPU芯片及其所有外设都被复位造成这种情况的原因可能有很多复位引脚被外部拉动时钟故障片上低电压检测看门狗非法指令陷阱等软复位可能意味着返回复位向量的
只要父文件夹中尚不存在任何文件，就将所有文件从“旧”文件夹移至父文件夹中

只要父文件夹中尚不存在文件我的代码就应将所有文件从旧文件夹移至父文件夹中 Folder 1 old somefiles 2 old somefiles 3 old somefiles Folder 1 somefiles old 2
在elasticsearch中创建TransportClient时限制ThreadPool中的线程数

我正在 elasticsearch 中创建一个 TransportClient 实例下面是相同的代码问题是我试图减少 TransportClient 启动的线程池生成的线程数但无论我使用什么设置我的elasticsearch总是用1
Delphi 按钮在 Aero 玻璃上显示白色边框

我一直在尝试在 Delphi 2010 中使用 Aero 来找到一个好看的设计人们看到的一个明显的用途是玻璃框架被扩展以包括屏幕底部的确定取消按钮我注意到这在 Delphi 2010 中看起来不太正确每个按钮周围都有一个白色边
将字符串转换为 TextView

String data tv 另外在我的 xml 文件中我有一个名为 tv1 的 TextView 我已经在 Activity 中投射了 textView TextView tv1 TextView findViewById R id
Windows 中的 msync 等效项

Windows 中的 rsync unix 系统调用相当于什么我正在寻找 C C 空间中的 MSDN api 有关 msync 的更多信息请访问http opengroup org onlinepubs 007908799 xsh m
如何在 Android 的 SQLite 查询中使用 LIMIT 参数

我正在尝试使用以下查询来获取按日期列出的最新结果 Cursor cursor mDb query DATABASE TABLE new String KEY DATE KEY REPS KEY WEIGHT null null null n
从 ZIP 字符串中提取文件

我有一个 BASE64 字符串的 zip 文件其中包含一个 XML 文件关于如何获取 XML 文件的内容而无需处理磁盘上的文件有什么想法吗我非常希望将整个过程保留在内存中因为 XML 只有 1 5k 必须编写 zip 提取 XML
查询优化——花费太长时间并停止服务器

我的查询生成一些有关超速上次时间和平均速度的报告这是我的查询 Select r1 r2 name r2 notes r2 serial From SELECT k idgps unit MIN k dt AS DT Start MIN
计算未排序数据中唯一对和非唯一对实例的数量

我有以下形式的数据 ID ATTR 3 10 1 20 1 20 4 30 其中 ID 和 Attr 未排序并且可能包含重复项 ID的范围是1 20 000左右 ATTR是unsigned int 我可能需要一次处理 100 000 到 5
IE 的 toLocaleString 结果中有奇怪的字符

我遇到了一个超级奇怪的事情显然是 IE 特定的toLocaleString关于日期在 IE 控制台窗口中 new Date 2014 08 28T20 51 09 9190106Z toLocaleString 8 28 2014 1
无法重写prefersHomeIndicatorAutoHidden()方法

我在 XCode 10 的应用程序中使用这行代码以便调暗 iPhone X 和相关无边苹果设备上的主页指示灯 override func prefersHomeIndicatorAutoHidden gt Bool return true
计算 Pandas 数据框中的不同单词数

我有一个 Pandas 数据框其中一列包含文本我想获得整个列中出现的唯一单词的列表空格是唯一的分割 import pandas as pd r1 My nickname is ft jgt Someone is going to my
使用 JQuery 访问 ASP.net Web 服务时出错 - JSONP

请查看下面的代码并帮助我找出我的网络服务代码中做错了什么我想设置一个可以使用 JSONP 来使用的 asp net Web 服务我在客户端使用 Jquery 来访问该网站即使在设置了正确的属性之后我的 Web 服务仍然会发出 xml
PHPExcel 字符串到时间

我创建了一个 Excel 电子表格在第二列中我有类似的值0 11 23 and 2 03 33 价值数千行我使用 PHP 将格式设置为 sheet gt getStyle colRange gt getNumberFormat gt s
bash脚本中的mvn if语句

我想在 bash 脚本中运行命令 mvn clean 但我想把它放在 if 语句中如果 clean 无法正常运行我想使用 echo 语句退出 bash 脚本这是导致问题的代码如果 mvn clean 然后我尝试将 mvn clea
取消内联剑道网格中的更新删除行

我正在使用两个剑道内联网格父级和子级子网格包含产品列表当用户从子网格中选择产品多项选择并单击保存按钮时它将插入到父网格中子网格 var selectedIds var ctlGrid KendoWebDataGrid3 ctlG
如何将精确短语与文本索引 Mongodb 中的动态字符串匹配？

我有这个查询 db words find text search cake sale gives expected answer in robo3T Now my text搜索是动态的 const text cake sale db wor
资源中的大图像出现异常

我按照此链接中的示例操作 Android 中的 Viewpager 示例 http androidtrainningcenter blogspot com 2012 10 viewpager example in android html
Pandas：使用 groupby 获取每个数据类别的平均值

我有一个如下所示的数据框 gt gt gt df data category Out 47 data category 0 4610 2 15 4610 2 22 5307 7 23 5307 7 25 5307 7 数据和类别都是数字所

Pandas：使用 groupby 获取每个数据类别的平均值

Pandas：使用 groupby 获取每个数据类别的平均值 的相关文章

随机推荐

热门标签

Pandas：使用 groupby 获取每个数据类别的平均值的相关文章