如何将 pandas value_counts() 合并到数据帧或使用它来子集数据帧

2024-04-03

我使用 pandas df.value_counts() 来查找特定品牌出现的次数。我想将这些价值计数与初始数据框中的各个品牌合并。

 df has many columns including one named 'brands'
 brands = df.brands.value_counts()

 brand1   143
 brand2   21
 brand3   101
 etc.

如何将值计数与原始数据框合并，以便每个品牌的相应计数位于新列中，例如“brand_count”？

是否可以为这些列分配标题；名称函数不适用于系列，我无法将其转换为数据框以可能以这种方式合并数据。但是， value_counts 输出一系列 dtype int64 （品牌名称应该是字符串类型），这意味着我无法执行以下操作：

 df2 = pd.DataFrame({'brands': list(brands_all[0]), "brand_count":
 list(brands_all[1])})
 (merge with df)

最终，我想获得这个：

 col1  col2  col3  brands  brand_count ... col150
                   A        30
                   C        140
                   A        30
                   B        111

那是你要的吗：

import numpy as np
import pandas as pd

# generating random DataFrame
brands_list = ['brand{}'.format(i) for i in range(10)]
a = pd.DataFrame({'brands': np.random.choice(brands_list, 100)})
b = pd.DataFrame(np.random.randint(0,10,size=(100, 3)), columns=list('ABC'))
df = pd.concat([a, b], axis=1)
print(df.head())

# generate 'brands' DF
brands = pd.DataFrame(df.brands.value_counts().reset_index())
brands.columns = ['brands', 'count']
print(brands)

# merge 'df' & 'brands_count'
merged = pd.merge(df, brands, on='brands')
print(merged)

PS 第一个重要部分只是数据帧生成。

您感兴趣的部分从# generate 'brands'DF评论

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

如何将 pandas value_counts() 合并到数据帧或使用它来子集数据帧的相关文章

scipy.optimize on pandas dataframe

我试图搜索它但结果很差有人可以向我解释一下如何在 Pandas DataFrame 上执行 optimize minimize 以便最小化 DataFrame 中的类别和结果列之间的错误考虑这个例子 import pandas as
Python 转换矩阵

我有一个如下所示的列表 2 1 3 1 2 3 1 2 2 2 我想要的是一个转换矩阵它向我显示如下序列 1 后跟 1 的频率是多少 1 后面跟着 2 的频率是多少 1 后跟 3 的频率是多少 2 后跟 1 的频率是多少 2 后跟 2 的
如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th
为什么在访问 Python 对象属性时使用 getattr() 而不是 __dict__ ？

在具有一定程度的 Python 对象自省的源代码示例和 SO 答案中常见的模式是 getattr some object attribute name string 是否有理由优先选择这种模式 some object dict attri
雅虎财务请求功能出现 404 客户端错误

yahoo Financials的请求功能出现404 Client Error 直接点击以下网址没有问题 https finance yahoo com quote AAPL financials p AAPL https finance
使用 NumPy 编写一个函数来计算具有特定公差的积分

我想编写一个自定义函数来以特定容差对表达式 python 或 lambda 函数进行数字积分我知道与scipy integrate quad人们可以简单地改变epsabs但我想使用 numpy 自己编写该函数 From 这篇博文 htt
在请求中设置端口

我正在尝试利用cgminer使用 Python 的 API 我对利用requests图书馆我了解如何做基本的事情requests but cgminer想要更具体一点我想缩小 import socket import json sock
高级描述熊猫

有没有像 pandas 那样更高级的功能通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结就像这样 A count 1000 000
数据框中 .map(str) 和 .astype(str) 有什么区别

我有一个数据框其列名为 col1 和 col2 的整数类型条目我想将 col1 和 col2 的条目以及其间的点连接起来我搜索并发现添加两个列条目 df col df col1 map str df col2 map str 并添
通过 Python 循环浏览网络上的目录并显示其内容（文件和其他目录）

同样的道理在Python中处理从源目录到目标目录的一组文件 https stackoverflow com questions 2593399 process a set of files from a source directory t
更改 Matplotlib 投影轴的背景颜色

我正在尝试使用 Cartopy 创建一个图形该图形需要在未投影的轴上绘制投影轴这是一个尽可能简单的代码版本它将轴上的内容替换为背景颜色 import matplotlib pyplot as plt import cartopy cr
Python：在字典中查找具有唯一值的键？

我收到一个字典作为输入并且想要返回一个键列表其中字典值在该字典的范围内是唯一的我将用一个例子来澄清假设我的输入是字典 a 构造如下 a dict a cat 1 a fish 1 a dog 2 lt unique a bat 3
如何按 pandas 中的值对系列进行分组？

我现在有一只熊猫Series与数据类型Timestamp 我想按日期对其进行分组并且每组中有许多行具有不同的时间看似显而易见的方法类似于 grouped s groupby lambda x x date 然而熊猫的groupby按索
如何通过 Python Requests 库使用基本 HTTP 身份验证？

我正在尝试在 Python 中使用基本的 HTTP 身份验证我正在使用Requests https docs python requests org 图书馆 auth requests post http hostname auth HT
从迭代器外部将 StopIteration 发送到 for 循环

有几种方法可以打破一些嵌套循环他们是 1 使用中断继续 for x in xrange 10 for y in xrange 10 print x y if x y gt 50 break else continue only exec
Python：如何在不先创建整个列表的情况下计算列表的总和？

通常我们必须 1 声明一个列表 2 使用以下方法计算该列表的总和sum 但现在我希望指定一个以 1 开头间隔为 4 100 个元素的列表如下所示 1 5 9 13 17 21 25 29 33 37 我不想涉及数学公式所以 1 如何在
python中有没有一种方法可以将存储在列表中的正则表达式模式列表应用到单个字符串？

我有一个正则表达式模式列表存储在列表类型中我想将其应用于字符串有谁知道一个好方法将列表中的每个正则表达式模式应用于字符串和如果匹配则调用与列表中该模式关联的不同函数如果可能的话我想用 python 来做这件事提前致谢 im
pandas.read_fwf 忽略提供的数据类型

我正在从文本文件导入数据框我想指定列的数据类型但 pandas 似乎忽略了dtype input 一个工作示例 from io import StringIO import pandas as pd string USAF WBAN S
使用 MPI 的 Allreduce 对 Python 对象求和

我正在使用使用 Python 中的字典和计数器构建的稀疏张量数组操作我想让并行使用这个数组操作成为可能最重要的是我最终在每个节点上都有计数器我想使用 MPI Allreduce 或另一个不错的解决方案将其添加在一起例如使用计数
如何使用 Python/Django 在 Facebook 中获取（和使用）扩展权限

我正在尝试编写一个简单的应用程序让用户授予我的代码写入其页面的 Facebook 流的权限据我了解它应该很简单让用户单击一个按钮启动一个弹出窗口其中包含我的 Facebook 应用程序中的页面在该页面中他们单击授予的内容流发

随机推荐

使用 ML Kit 扫描条形码时出现黑屏而不是 QR 扫描仪

在 Android 中创建条形码扫描仪的最简单方法可能是使用 Google Code Scanner APIhttps developers google com ml kit vision barcode scanning code sc
如何使 T-SQL 游标更快？

我在 SQL Server 2000 下的存储过程中有一个游标现在无法更新它更新所有表但通常需要几分钟才能完成我需要让它更快而 GDEPO 入口仓库 CDEPO 出口仓库 Adet 数量 E CIKAN 已使用的数量记录说明 2
mySQL 获取某些行的所有可能组合

我在 mySQL 中有一个奇怪的请求我发现了很多方法可以通过添加更多连接来对组合对或某个其他数字执行此操作但我想知道是否有一种动态方法可以对任意数量的组合执行此操作解释一下我是否有一个表 table 有 1 列 column id 和
无法返回json数据，WCF Restful Service .NET 4.0

我最近使用 Entity Framework 4 0 设置了 WCF Restful 服务它与 XML 完美配合但是当我尝试以 json 格式返回它时我得到了 HTTP 1 1 504 Fiddler Receive Failure
精确肤色 HSV 范围

我已经看到关于皮肤 HSV 颜色空间范围的所有问题但我只能弄清楚这个 Code CvScalar hsv min cvScalar 0 30 60 0 CvScalar hsv max cvScalar 20 150 255 0 range
如何从 WC_Subscription 实例对象获取订单详细信息

这用于完成初始订阅付款和订阅续订 function payment made subscription How do I get the order details add action woocommerce subscription p
使用另一个按钮切换引导按钮下拉菜单

当单击另一个按钮时获取 Bootstrap 按钮下拉菜单进行切换使列表项和下拉 ul 元素可见时遇到一些问题这是我到目前为止似乎不起作用的内容 v3 3 7 我想要测试按钮另外切换测试按钮下拉列表 div class btn
rdd后面的数字是什么意思

rdd后面括号里的数字是什么意思 RDD后面的数字是它的标识符 Welcome to version 2 3 0 Using Scala version 2 11 8 OpenJDK 64 Bit Server VM Java 1 8 0
无法使用python列出谷歌驱动器中的文件

不确定这是否与我的代码或 Google 方面的某些内容有关但是我可以将文件推送到驱动器但由于某种原因我无法列出文件夹内的文件文件夹元数据这是我正在使用的代码 SCOPES https www googleapis com auth
Spring Boot - @Value 注释不起作用

我尝试使用 SmtpAuthenticator 创建邮件服务组件已正确启动但用户名和密码字段中存在空值为什么 Component public class SmtpAuthenticator extends Authenticator
m2e 连接器 buildhelper 与 Eclipse Juno SR1 m2e 1.2 不兼容

Update 将解决方案移至答案 Eclipse Juno SR1 安装 m2e 插件版本 1 2 m2e 连接器buildhelperEclipse 市场提供的与此版本的 m2e 插件不兼容我一直在浏览各种邮件列表但找不到更新的构建帮
Angular2：如何操作 url 查询字符串？

在角 1 中有一个 location search 可以操作 URL 查询字符串的函数 Angular2 等价于什么 I tried import Location from angular2 angular2 and import UR
使用 numpy 拟合数据

我有以下数据 gt gt gt x array 3 08 3 1 3 12 3 14 3 16 3 18 3 2 3 22 3 24 3 26 3 28 3 3 3 32 3 34 3 36 3 38 3 4 3 42 3 44 3 46
未接听电话的通话计费 - Twilio

我正在使用此代码进行传出浏览器调用link https www twilio com docs quickstart php client outgoing calls 我使用的代码与链接中所示的代码相同也使用 twiML 应用程序我正
使用经典 ASP 发送“application/soap+xml”SOAP 请求

如有任何帮助我们将不胜感激我已经做了几天了下面是我到目前为止得到的代码不幸的是当我运行它时我收到 HTTP 415 错误无法处理消息因为内容类型为 text xml charset UTF 8 不是预期的类型 applica
填充图中水平线上方和下方的区域

我想填充两条水平线上方和下方的区域这就是我想出的 par mfrow c 1 2 x lt seq 1 24 1 y lt rnorm 24 10 2 for i in 1 2 plot x y ylim c 4 16 lines x y
如何从数据流中的PCollection读取bigQuery

我有一个从 pubsub 获得的对象 PCollection 比如说 PCollection
如何根据第 i 个字段的值对 numpy 数组进行切片？

我有一个 2D numpy 数组有 4 列和很多行 gt 10000 这个数字不固定我需要创建n按其中一列的值划分子数组我发现的最接近的问题是如何按列值对 Numpy 数组进行切片 https stackoverflow com qu
无法根据中心原点旋转齿轮

我正在尝试制作一个悬停效果它将三个不同的 cog svg 图标旋转到其受尊重的中心原点我尝试使用transform origin作为中心但没有运气任何帮助将不胜感激下面是我的代码 cog middle transform rota
如何将 pandas value_counts() 合并到数据帧或使用它来子集数据帧

我使用 pandas df value counts 来查找特定品牌出现的次数我想将这些价值计数与初始数据框中的各个品牌合并 df has many columns including one named brands brands df

如何将 pandas value_counts() 合并到数据帧或使用它来子集数据帧

如何将 pandas value_counts() 合并到数据帧或使用它来子集数据帧 的相关文章

随机推荐

热门标签

如何将 pandas value_counts() 合并到数据帧或使用它来子集数据帧的相关文章