如何计算 pandas 列（字符串列表）中的值？

2024-01-09

我有一个数据框列，它是字符串列表：

df['colors']

0              ['blue','green','brown']
1              []
2              ['green','red','blue']
3              ['purple']
4              ['brown']

我想要得到的是：

'blue' 2
'green' 2
'brown' 2
'red' 1
'purple' 1
[] 1

在不知道自己在做什么的情况下，我什至设法数出了整列中的字符数

b 5
[ 5
] 5

etc.

我认为这很酷，但我不知道解决方案

Solution

最佳选择: df.colors.explode().dropna().value_counts().

但是，如果您还想对空列表进行计数（[]), use Method-1.B/C类似于所建议的光黄 https://stackoverflow.com/users/4238408/quang-hoang在评论中。

您可以使用以下两种方法中的任何一种。

Method-1：单独使用pandas方法⭐⭐⭐

explode --> dropna --> value_counts
Method-2: Use list.extend --> pd.Series.value_counts

## Method-1
# A. If you don't want counts for empty []
df.colors.explode().dropna().value_counts() 

# B. If you want counts for empty [] (classified as NaN)
df.colors.explode().value_counts(dropna=False) # returns [] as Nan

# C. If you want counts for empty [] (classified as [])
df.colors.explode().fillna('[]').value_counts() # returns [] as []

## Method-2
colors = []
_ = [colors.extend(e) for e in df.colors if len(e)>0]
pd.Series(colors).value_counts()

Output:

green     2
blue      2
brown     2
red       1
purple    1
# NaN     1  ## For Method-1.B
# []      1  ## For Method-1.C
dtype: int64

虚拟数据

import pandas as pd

df = pd.DataFrame({'colors':[['blue','green','brown'],
                             [],
                             ['green','red','blue'],
                             ['purple'],
                             ['brown']]})

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

如何计算 pandas 列（字符串列表）中的值？的相关文章

如何为 PyYAML 编写代表程序？

我想要一个自定义函数来序列化任意 python 对象就像 json dump 函数有一个名为 default 的可选参数如果对象不是 json 可序列化的它应该是 json 转储器将调用的函数我只是想从 json 包中执行相当于此操
将 postgres 连接到 django 时遇到问题

以下文档来自Django Postgres 文档 https docs djangoproject com en 4 1 ref databases postgresql notes我添加到我的settings py 在我设置的设置中 DA
如何在 Google App Engine (Python) 中定义配置变量/常量？

我是 python GAE 的新手想知道如何快速定义和使用全局设置变量所以说你 git 克隆我的 GAE 应用程序然后打开config yaml 添加更改设置应用程序就全部连接起来如下所示 config yaml or whate
在Python中将月份和年份的列合并为季度和年份的列

我有一个数据框 df Month 1 8 Year 2015 2020 df pd DataFrame data df df 想要将其转变为新列期望的输出 df Month 1 8 Year 2015 2020 Quarter Q1201
识别文本中的多个类别和相关情感

如果您有一个文本语料库如何识别所有类别来自预定义类别列表以及与之相关的情绪正面负面写作我将在 Python 中执行此操作但现阶段我不一定要寻找特定于语言的解决方案让我们用一个例子来看看这个问题试图澄清我的问题如果我有一整
Python - 从一定范围内随机采样，同时避免某些值

我一直在阅读有关random sample 函数在random模块但没有看到任何可以解决我的问题的东西我知道使用random sample range 1 100 5 会给我来自人群的 5 个独特样本我想得到一个随机数range
从Python列表中挑选出具有特定索引的项目

我确信在 Python 中有一种很好的方法可以做到这一点但我对这门语言还很陌生所以如果这是一个简单的方法请原谅我我有一个列表我想从该列表中挑选某些值我想要挑选的值是列表中索引在另一个列表中指定的值例如 indexes 2 4
tkinter 库 treectrl 转换为 exe 安装程序时出现 cx_freeze 错误

我使用的是 python 版本 3 7 我使用了这个名为 treectrl 的外部库当我运行 py 文件时它工作得很好但是当我使用 cx freeze 转换为 exe 文件时它给了我错误 NomodulleFound 名为 tkint
Python - 将列表作为参数传递给 SQL，以及更多变量

我试图在 python 3 6 中将未知数量的参数传递给 SQL Server 这是我使用 pypyodbc 的代码 cursor cnxn cursor theargs 1033286869 1053474957 1063654630 1
无法将类型的对象转换为张量

我正在编写一个使用 Flask 框架的客户端 python 文件并在 docker 机器中运行它因此这需要一个输入文件并生成它的输出但它会抛出无法转换为张量的错误 tf app flags DEFINE string server
确定对角线周围的边界矩形

用户将在屏幕上定义一条线绘制时该线将具有给定的粗细 or width I now need to be able to determine the coordinates of a bounding rectangle around th
将表抓取到列表中

我正在尝试从网页中提取表格我已经设法将表中的所有数据放入列表中然而所有表数据都被放入一个列表元素中我需要帮助将干净数据即字符串没有所有 HTML 包装从表的行获取到它们自己的列表元素中所以而不是 list tr th a
限制 Python 上每秒的 HTTP 请求数

我编写了一个脚本用于从文件中获取 URL 并同时向所有 URL 发送 HTTP 请求我现在想限制每秒 HTTP 请求数和每个接口的带宽 eth0 eth1等在会话中有什么办法可以在Python上实现这一点吗您可以使用 Semaph
如何在 pandas 数据框中创建包含现有行字符串中的单词的新行？

我有一个DataFrame in pandas有一个名为df strings与文本字符串我想将这些字符串的各个单词放在自己的行上并在其他列中使用相同的值例如如果我有 3 个字符串以及一个不相关的列时间 Strings Time
ModuleNotFoundError：尽管已安装，但没有名为“PyDIP”的模块

尝试使用图像识别我安装了带有 OpenCV 的 Python 如下本教程 https www pyimagesearch com 2018 08 15 how to install opencv 4 on ubuntu 后来我决定尝试一
SIGINT 后保存工作

我有一个需要很长时间才能完成的程序我想它能够抓住SIGINT ctrl c 并调用self save work method 就目前情况而言我的signal hander 不起作用因为self不是由程序到达的时间定义的signal
实施科赫曲线？

我正在查看科赫雪花的维基百科页面 here http en wikipedia org wiki Koch snowflake 并且对所有示例都采用徽标海龟风格感到困扰所以我开始制作自己的返回列表或坐标的组件我的实现是用Python编
如何将 pandas DataFrame 与 sklearn 结合使用？

我的项目的目标是预测一些文本描述的准确性水平我用 FASTTEXT 制作了向量硅通孔输出 0 1 0 0033524514 2 0 021896651 3 0 05087798 4 0 0072637126 1 1 0 00311814
非英语语言（CJK 等）中的 n 元语法名称分析

我正在致力于对人员数据库进行重复数据删除对于第一遍我遵循基本的两步过程以避免对整个数据库进行 O n 2 操作如所述在文献中 http nike psu edu publications jcdl05 pdf 首先我阻止迭代整
如何用Python检查一个单词是否是英文单词？

我想在 Python 程序中检查一个单词是否在英语词典中我相信 nltk wordnet 接口可能是可行的方法但我不知道如何使用它来完成如此简单的任务 def is english word word pass how to I imp

随机推荐

如何防止用户在反应中多次点击登录表单的提交按钮错误？

我使用formik和react router dom进行react登录管理但如果短时间内多次点击提交按钮重定向到首页后会出现以下错误警告无法对已卸载的组件执行 React 状态更新这是一个无操作但它表明应用程序中存在内存泄漏要
代码块 10.05 中的程序参数文本框不可见

我的环境是ubuntu 11 10 当我尝试调试程序并在程序参数文本框中添加程序参数时我发现它被挤成一行而且没有办法让它变得更宽类似的问题是否困扰过您我在windows下检查在同一个地方确实有一个文本框而且我检查了我的wxWid
C# 如何解决Web客户端上传文件“远程服务器返回错误：(405)方法不允许。”？

您好我想将本地的 html 文件上传到服务器中的远程文件夹该文件夹包含带有 geoserver 元素的数据目录这是我的代码 public void CopyWS string SourcePath string Destination
提取 .Rmd 文件的 html 依赖项（包含 htmlwidgets）

Question 我如何创建一个函数它将 Rmd 文件包含 htmlwidgets 代码作为输入并输出包含其 JavaScript CSS 依赖项的 html 文件具体来说临时文件 rmarkdown 为 pandoc 生成 i
保护网站管理部分的最佳实践是什么？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我想知道人们认为保护网站管理部分的最佳实践是什么特别是从身份验证访问的角度来看当然有一些显而易见的事情例如使用 SSL 和记录所有访问但我
使用 C++11 将我的比较函数传递给 std::multiset

我有一个 std multiset 它存储 std pair 我希望第一个属性对唯一性没有限制但我希望第二个属性是唯一的因此我决定将我自己的函数传递给 multiset 以实现此目的如果没有请告诉我基于this https st
带查询字符串的 Laravel 路由 url

在 laravel 4 上我可以使用 route 帮助器生成带有查询字符串的 url 但在 4 1 上改为 url url admin events array lang gt en admineventsurl lang en I ge
使用 CSS 将图像从一个
移动到另一个
作为 Javascript 函数的一部分

我是一名新手编码员正在开发一个简单的纸牌游戏作为我的第一个真正的项目我需要帮助将一个 img 从一个图像移动到另一个图像作为检查分数的函数的一部分如果分数超过 99 则运行checkscore 功能作为此函数的一部分它将图像从
Web表单中的Treeview检查父节点上的子节点检查

我使用 System Web UI 类的 Treeview 控件来显示项目的类别和子类别我尝试过以下代码但没有希望 protected void tvwOrganisation TreeNodeCheckChanged object se
RewriteRule 重定向到绝对路径，而不是正确的 URL

我已经为我的网站创建了一堆 RewriteRules 并且在我的本地设置中没有遇到任何问题这是我的 htaccess 的片段 Options FollowSymLinks MultiViews RewriteEngine On Rewri
如何发送和接收通过 getUsermedia() 生成的桌面捕获流

我正在使用 WebRTC Socket io 制作一个屏幕共享应用程序但卡在一个地方使用 WebRTC Socket io 连接两个浏览器并可以发送文字我正在寻求支持codelab https codelabs developers
PHP 中的工作日（周一至周五）

有没有办法使用strtotime将工作日周一至周五添加到日期或者其他方法我想做的是 date Y m j strtotime 3 working days 如果您限制为工作日请使用字符串 weekdays echo date Y
将 EAR 部署到 WebLogic 时出现 Eclipse 验证错误：cvc-complex-type.2.4c：预期元素 'module@http://java.sun.com/xml/ns/javaee'

无法使用 Eclipse 将 EAR 直接部署到 Oracle WebLogic 环境详情 Eclipse 版本 Indigo 包括 Oracle Enterprise Pack for Eclipse 12 1 1 0 0 Weblogi
android 无效密钥规范异常？

i am using InApp Purchase api in my application where i have made an demo project in which i have taken one button when
如何使用 pymysql 从多个 select 语句中获取结果

基本上我有以下示例假设 cur 来自有效连接 gt gt gt con pymysql connect
如何从客户端浏览器中的内容生成并提示保存文件？ [复制]

这个问题在这里已经有答案了我遇到一种情况我需要让用户选择将本地存储在客户端内存中的一些数据保存到磁盘我当前的解决方法是有一个像这样的处理程序 define handler download deck deck json setf he
HTML 元素过多会影响页面性能吗？

我想知道两者之间是否有区别 1 10 000 个可见的表行 2 使用 display none 隐藏 10 000 个表格行我想知道的是如果页面上所有 10 000 行都可见是否会导致页面滚动滞后但如果我隐藏其中的 9000 个这
在 Julia 中将 4 个字节转换为 Float32 的最快方法？

我有一个mmaped 数组Vector UInt8 我想将 4 个字节从特定位置转换为Float32 目前我可以通过以下方式做到这一点 f1 a i reinterpret Float32 x i i 3 f2 a i read IOBuf
基础设施服务合同应该放在哪里？

I have UI 应用 Domain and 基础设施 Layers In my 基础设施图层参考Domain and 应用层注册两者的服务接口Ninject 但我需要在我的应用将服务分层基础设施层然后我需要引用基础设施层在我的应用 L
如何计算 pandas 列（字符串列表）中的值？

我有一个数据框列它是字符串列表 df colors 0 blue green brown 1 2 green red blue 3 purple 4 brown 我想要得到的是 blue 2 green 2 brown 2 red 1 p

如何计算 pandas 列（字符串列表）中的值？

Solution

虚拟数据

如何计算 pandas 列（字符串列表）中的值？ 的相关文章

随机推荐

热门标签

如何计算 pandas 列（字符串列表）中的值？的相关文章