Pandas 数据框列总和并收集结果

2024-05-06

给定以下数据框：

import pandas as pd
p1 = {'name': 'willy', 'age': 11, 'interest': "Lego"}
p2 = {'name': 'willy', 'age': 11, 'interest': "games"}
p3 = {'name': 'zoe', 'age': 9, 'interest': "cars"}
df = pd.DataFrame([p1, p2, p3])
df

    age interest    name
0   11  Lego        willy
1   11  games       willy
2   9   cars        zoe

我想知道每个人的兴趣总和，并让每个人只在列表中显示一次。我执行以下操作：

Interests = df[['age', 'name', 'interest']].groupby(['age' , 'name']).count()
Interests.reset_index(inplace=True)
Interests.sort('interest', ascending=False, inplace=True)
Interests

    age name    interest
1   11  willy   2
0   9   zoe     1

这可行，但我感觉我做错了。现在我使用“兴趣”列来显示我的总和值，这没关系，但就像我说的那样，我希望有一种更好的方法来做到这一点。

我在 Pandas 中看到了很多关于计数/求和的问题，但对我来说，省略“重复项”的部分是关键。

您可以使用大小（每个组的长度），而不是计算组中每列中的非 NaN 实体。

In [11]: df[['age', 'name', 'interest']].groupby(['age' , 'name']).size()
Out[11]:
age  name
9    zoe      1
11   willy    2
dtype: int64

In [12]: df[['age', 'name', 'interest']].groupby(['age' , 'name']).size().reset_index(name='count')
Out[12]:
   age   name  count
0    9    zoe      1
1   11  willy      2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas 数据框列总和并收集结果的相关文章

Python - 对象 MagicMock 不能在“await”表达式中使用

当我尝试使用 MagicMock 在单元测试中模拟异步函数时出现以下异常类型错误对象 MagicMock 不能在 await 表达式中使用示例代码如下 source code class Service async def comp
使用输入按钮处理网站上的分页

试图使用硒抓取这个网站我的代码可以工作但目前它只抓取第一页该页面使用输入按钮作为浏览页面的一种方式因此我想逐个单击每个按钮但它不起作用有没有人有任何其他方法来处理此类分页的导航 import requests from sele
特定代码行的类似装饰器的语法

链接主题但不重复装饰器对代码的特定行而不是整个方法进行计时 https stackoverflow com questions 30433910 decorator to time specific lines of the code
在 Windows 7 上安装 Python Fabric 时出现问题

我正在尝试使用以下指南在 Windows 7 上安装 Python Fabric在 Windows 上安装 Python 和 Fabric http www jonnyreeves co uk 2011 08 getting python
在 Linux 上创建线程与进程的开销

我试图回答在 python 中创建线程与进程有多少开销的问题我修改了类似问题的代码该问题基本上运行一个带有两个线程的函数然后运行带有两个进程的相同函数并报告时间 import time sys NUM RANGE 100000000
PyPDF2 复制后返回空白 PDF

def EncryptPDFFiles password directory pdfFiles success 0 Get all PDF files from a directory for folderName subFolders f
使用 Click 在 python 中创建命令行应用程序

我正在使用 Python 创建一个命令行应用程序Click http click pocoo org 接受名称作为输入的库但如果未输入名称则返回默认值这是我到目前为止的代码 hello py import click click ve
如何在 Pandas 中将多列乘以一列

我想拥有 df income 1 income 2 df mtaz proportion 返回这些列乘以df mtaz proportion 这样我就可以设置 df mtaz income 1 mtaz income 2 df income
Django 视图中的原始 SQL 查询

我将如何使用原始 SQL 执行以下操作views py from app models import Picture def results request all Picture objects all yes Picture objec
如何从 google place api for python 中的地点 id 获取地点详细信息

我正在使用 Google Places API 和 Python 来构建一个食品集体智能应用程序例如周围有哪些餐馆他们的评级如何营业时间是什么等等我正在Python中执行以下操作 from googleplaces import
如何根据python中的文件名检索每个文件的datemodtime？

我当前的流程涉及循环遍历源目录并将每个文件的名称添加到 python 中的数据帧中我也想获取每个文件的修改日期 import datetime import os import pandas as pd set src directory
如何在Python中将字符串转换为包含一个元素的列表[重复]

这个问题在这里已经有答案了我有一个字符串我想将其转换为其中只有一个元素的列表 a abc print list a output a b c Expected o p abc 正确的做法是什么只需使用 a abc b a print
Python 的最佳实践：assert command() == False [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
树莓派上的 /dev/mem 访问被拒绝

我正在使用我的 Raspberry Pi 并且正在编写一个 cgi python 脚本该脚本创建一个网页来控制我的 gpio 输出引脚当我尝试将 RPi GPIO 作为 GPIO 导入时我的脚本崩溃了这是我收到的错误 File co
哪些 2to3 修复程序输出有效的 Python 2 代码？

2to3 是一个 Python 程序它读取 Python 2 x 源代码并应用一系列修复程序将其转换为有效的 Python 3 x 代码考虑一下列出的四十个修复者https docs python org 3 library 2to3
采用迭代器而不是可迭代的方法[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案关于迭代器和可迭代对象仅是我的观察如果我错了请纠正我大多数构造函数数组类型将迭代器作为质量构造函数迭代器是显式创建的或
API 调用时出现 UnicodeEncodeError (json)

我正在尝试打印此 API 调用的结果但收到 UnicodeEncodeError 可能是超级菜鸟问题但非常感谢任何帮助 import http client import json api key hidden connection h
Python记录多个模块记录器在主程序之外不起作用

我的目标是从多个模块进行日志记录同时仅在一个位置主程序中配置记录器如图所示这个答案 https stackoverflow com questions 15727420 using python logging in multipl
Python 和 Visual Studio Code - 如何在编辑器中运行特定文件？

我正在使用 Visual Studio Code 和 Python 编写一个小型应用程序我的应用程序有两个文件 Main py and MyCustomClass py Main py是应用程序的入口点 MyCustomClass py包
在python中读取证书（.crt）和密钥（.key）文件

因此我使用 JIRA Python 模块连接到我公司的 JIRA 实例它要求我为此传递证书和密钥但是使用 OpenSSL 模块我无法读取本地证书和密钥来将其传递给请求阅读代码如下 import OpenSSL crypto c

随机推荐

@iPhone：如何在我们的应用程序中创建 twitter + OAuth 自定义登录

我正在制作iphone应用程序我正在使用 OAuth 集成 Twiiter 我的问题是我想要自己的登录页面而不是像 twitter 提供的新 OAuth 集成那样由 twitter 提供通过在新的 OAuth 中创建自定义登录页面是
来自 RAZOR 中不同文件夹的 RenderPartial

我一直在尝试将我的 aspx 页面转换为 cshtml 并且在从另一个文件夹渲染部分页面时遇到问题我以前做过的事我认为等价的是 Html RenderPartial Views Inquiry InquiryList cshtml Mo
Django 1.7.1 需要字段的默认值 - 但数据库中没有条目。为什么？

我遇到了一个奇怪的问题我在 Mac OS X Yosemite 上使用 Django 1 7 1 并且配置了本地 MySQL 数据库通常我创建一个模型如果我想添加另一个字段我只需做一个 manage py migrateDjang
asp:GridView 控件的 EditTemplate 属性

我有一个 asp GridView 其中有两列在一列中我想显示标签但是当我单击 sdit 按钮时我想在该特定列中显示一个下拉列表我创建了如下网格视图
使用与后期步骤中的 Shell 脚本中的克隆相同的 http git 凭据

我想要自动化我们的发布过程并且我有一个 Maven 项目的以下 Jenkins 构建作业使用配置的 Jenkins 凭证用户名密码克隆 Git 存储库执行一些 Maven 命令以进行构建配置一个后步骤来执行一些额外的 Git
Flask 无法识别两个 URL 参数

我正在尝试将两个参数发送到使用 Flask 路由的 URL If I do curl i http 127 0 0 1 5000 api journeys count startStationName Hansard 20Mews 20Sh
为什么我无法将子窗格 plist 文件添加到项目的 Settings.bundle 中？

我正在运行 Xcode 4 1 并且一直在关注有关应用程序设置的教程一切都进展顺利直到我准备好为我想要添加的子窗格添加 plist 我正在观看的视频教程也使用 Xcode 4 1 显示该人右键单击 settings bundle 并选
在pycharm中使用多处理时如何调试

我正在 pycharm 社区版中使用 anaconda2 调试多进程程序它有几个后台工作进程工作进程将检查输入队列以检索任务而不会休眠直到收到任务事实上我只对主要流程感兴趣但是pycharm调试器总是单步进入子进程看起来主进
如何在JavaFX中获得一个小的ProgressBar

我正在尝试获得一个类似 iTunes 的进度条该进度条非常小高度约为 5 像素但我似乎无法低于 19 或 20 像素我尝试在周围的窗格上设置 fx max height 但没有效果请注意这个值确实会改变高度我只是不能让它小于大
curl 在命令行中工作正常，但在 php 中不行

我使用curl 从 PHP 中检索 url 的内容它适用于大多数 url 但对于某些 url 它只返回一个空字符串从命令行卷曲此类 url 效果很好这是我运行curl的方式 curl session curl init site
ActiveX 无法在客户端计算机上运行

我正在尝试为一个简单的 hello world 消息框运行 activex 控件首先我创建了类库现在有了 dll 然后我创建了 HTML 页面并调用了 activeX 控件
db2：使用不同表上的选择更新多行和字段

对于 A 的所有行其中 A x B z 是否可以使用不同表 B c B d 的值 c 和 d 来增加表 A a 和 A b 的字段 a 和 b 我对这个查询感到疯狂 DB2 和 SQL 标准在 UPDATE 语句中没有 FROM 子句所
如何使用 InstallShield 限量版创建单个 setup.exe？

我正在尝试创建一个 exe 文件安装程序我设法将所有依赖项放入 exe 文件中通过设置从 Setup exe 属性中提取如何在 setup exe 文件中获取 msi 这就是现在的样子我也有这个烦恼在我看来它的做法非常不直观突
单机Octave并行计算——包和示例

我想在单台机器而不是集群上并行化 Octave 中的 for 循环前段时间我问了一个关于Octave并行版本的问题Octave并行计算 https stackoverflow com questions 7047840 paralle
可以使用多个数据库连接

tSQLt 世界的新手很棒的工具集在我正在为其设置测试的存储过程中遇到了一个小问题如果由于某种原因我有一个连接到多个数据库甚至多个 SQL 服务器链接服务器的存储过程在这种情况下是否可以使用 tSQLt 进行单元测试我已经评论
PHPQuery WebBrowser 插件 - 使用 cookies

我正在尝试使用 PHPQuery 的 WebBrowser 插件登录网站我能够成功登录但我不确定如何重用上一次调用中的 cookie 到下一次调用 client phpQuery browserGet https website com
能够存储微秒的 Date 对象

我正在寻找一个能够存储到微秒粒度的 Date 对象有人知道吗标准Date对象仅存储到毫秒我知道这是平台限制我可以通过包装来解决这个问题Date加上自定义类别中的小数数量然而我希望避免编写一个带有适当计算等的内容我需要解析一个b
Mysql Workbench 无法选择外键

首先我检查了很多问题并用谷歌搜索了很多但没有一个解决我的问题我正在使用 Mysql Workbench 6 3 创建表我仅使用 gui 而不是单个查询来创建它们之后我尝试创建一些外键int 11 列但 GUI 不允许我这样做这
如何最高效地更新MongoDB中的大量文档？

我想要最有效地更新大量 gt 100 000 文档我的第一个天真的方法是在 JS 级别上进行编写脚本首先获取 ids 然后循环 ids 并通过 id 调用更新完整文档或 set 补丁我遇到了内存问题还将数据分成了最大块 500
Pandas 数据框列总和并收集结果

给定以下数据框 import pandas as pd p1 name willy age 11 interest Lego p2 name willy age 11 interest games p3 name zoe age 9 int

Pandas 数据框列总和并收集结果

Pandas 数据框列总和并收集结果 的相关文章

随机推荐

热门标签

Pandas 数据框列总和并收集结果的相关文章