split() 操作后获取 pandas 中唯一的字符串列表

2024-01-11

我正在开始使用熊猫，并且已经较大 DataFrame 中的一列数据例如

0                  one two
1            two seven six
2           three one five
3    seven five five eight
4                 six four
5                    three
dtype: object

我想做的是将单词序列拆分为其组成部分，然后获取单词的唯一集合或计数。我可以很好地进行分割

numbers.str.split(' ')

0                    [one, two]
1             [two, seven, six]
2            [three, one, five]
3    [seven, five, five, eight]
4                   [six, four]
5                       [three]
dtype: object

但是，我不确定从这里该去哪里。再次，我想要输出，例如

['one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight']

或在具有计数的字典中相同，或在与这两者之一等效的系列/数据帧中。

到目前为止，我能做的最好的事情就是将 apply() 与 Set 结合使用来获取唯一的单词。从我到目前为止所看到的来看，pandas 是一个非常优雅的包，对于比我更了解它的人来说，这似乎很容易实现。

提前致谢！

如果我理解正确的话，我认为你可以使用 pandas 执行以下操作。在您拆分字符串之前，我将从该系列开始：

print s

0                  one two
1            two seven six
2           three one five
3    seven five five eight
4                 six four
5                    three

stacked = pd.DataFrame(s.str.split().tolist()).stack()
print stacked

0  0      one
   1      two
1  0      two
   1    seven
   2      six
2  0    three
   1      one
   2     five
3  0    seven
   1     five
   2     five
   3    eight
4  0      six
   1     four
5  0    three

现在只需计算该系列的值计数：

print stacked.value_counts()

five     3
one      2
three    2
six      2
two      2
seven    2
eight    1
four     1
dtype: int64

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

split

pandas

unique

split() 操作后获取 pandas 中唯一的字符串列表的相关文章

Python：如果满足条件，则循环遍历一个字典并在新字典中创建键/值对

我想将一个字典的值与第二个字典的值进行比较如果值满足特定条件我想创建第三个字典其中的键和值对将根据匹配情况而变化这是一个显示我的问题的人为示例编辑对所有返回感到抱歉但堆栈溢出无法识别单个返回并且在一行上运行 3 4 行使代
扭曲多种协议

我希望为我正在从事的项目学习扭曲该项目需要服务器响应 HTTP 请求以及通过 TCP 连接的其他协议 Twisted能够同时处理多种协议吗我想使用 Twisted Web 来帮助处理 HTTP 但同时需要响应其他端口上的 TCP 连接
熊猫加入具有不同索引级别/日期时间的数据帧？

嗨我有两个 DataFrame 如下所示 dineType menuName unique columns date y m d
使用 Python 将列名称与 CSV 文件中的数据对齐

这是我用来将数据写入 csv 文件的代码 with open temp csv a as fp a csv writer fp delimiter t data faceXpos faceYpos faceHeight faceWidth
Python 正则表达式从文本中提取域

我有以下正则表达式 r a zA Z0 9 a zA Z0 9 61 a zA Z0 9 a zA Z 2 6 当我将其应用于文本字符串时比方说这是 www website1 com 这是 website2 com 我得到 www we
如何将数据从 JavaScript 发送到 Python

我正在 jinja2 和 python2 7 上使用 GAE 进行 Web 开发我可以从Python获取数据但我无法将数据从 JavaScript 发送到 Python 这是 JavaScript 代码 function toSave
打开文件路径在 python 中不起作用[重复]

这个问题在这里已经有答案了我正在编写一个数据库程序 personica 是我的测试主题我通常在文件路径的位置有一个变量但出于测试和演示的目的我只有一个字符串在我的计算机上的这个确切位置有一个文本文件顺便说一句因为我很偏执所以
以编程方式结束/退出粘合作业

我正在使用 Glue 书签来处理数据我的工作是每天安排的但也可以手动启动由于我使用书签有时胶水作业可以在没有新数据要处理的情况下启动然后读取的数据帧为空在这种情况下我想好好地结束我的工作因为它没有什么关系我试过 if
使用 scipy、python、numpy 进行非线性 e^(-x) 回归

下面的代码为我提供了一条最佳拟合线的平坦线而不是沿着 e x 模型的一条适合数据的漂亮曲线谁能告诉我如何修复下面的代码以使其适合我的数据 import numpy as np import matplotlib pyplot as pl
django-allauth：电子邮件确认

我已经设置了 django allauth 并在新用户注册时使用电子邮件确认效果很好但在确认电子邮件中我得到 Hello from example com You re receiving this e mail because us
如何检查discord.py中的所有者

我试图让这个命令只有所有者才能运行它是否有办法检查服务器的最高角色或创建者我尝试了 commands is owner 但这仅检查某人是否是机器人的所有者 Guild owner https discordpy readthedocs
无法使用 wxPython 打开在 folium 中生成的本地 HTML 文件

我目前正在尝试将 GPS 坐标绘制为地图上的标记并在 wxPython 中显示结果我使用 folium 绘制坐标标记并生成 HTML 文件 import folium fmap folium Map 43 5321 172 6362 z
自动创建带有文件输出的目录[重复]

这个问题在这里已经有答案了假设我想制作一个文件 filename foo bar baz txt with open filename w as f f write FOOBAR 这给出了一个IOError since foo bar不存
如何在 FastAPI Swagger API 中按方法类型对方法进行排序？

如何在 FastAPI Swagger 自动文档中设置 API 方法的排序顺序我希望所有方法按类型分组 GET POST PUT DELETE 这个答案 https stackoverflow com questions 24951268
在python中检测按下了哪些键

我需要知道现在按下的是哪个键我不想捕获一些特定的按键来触发事件或类似的事情我想知道现在按下了哪些键并显示它们的列表我还需要捕获特殊键如 F1 F12 shift alt home windows 等基本上是键盘上的所有键我如何在
AppEngine 警告 - OpenBLAS 警告 - 无法确定该系统上的 L2 缓存大小

我尝试在 GC AppEngine 上部署应用程序部署过程中没有错误但应用程序无法运行仅显示加载页面日志中唯一一个奇怪的原始日志 OpenBLAS WARNING could not determine the L2 cache s
获取列的 [0, x] 元素的最小值

我需要计算一列其中值是对其他列进行矢量化运算的结果 df new col df col1 min 0 df col2 然而事实证明我不能像上面的语法一样使用 min 那么获得 pandas 列的零和给定值之间的最小值的正确方法是什么
类unix系统中的python和python3命令有什么区别？

我通读了每个命令的描述但每个命令的描述都是完全相同的所以我不明白这两个命令在类 Unix 系统中的工作方式有何不同谁能解释其中的区别吗 Python3命令的引入是因为python命令指向了python2 从那时起 Python3 已成
Pandas：数据帧累积和，如果其他列为假则重置[重复]

这个问题在这里已经有答案了我有一个包含 2 列的数据框这里的目标很简单如果行列设置为 False 则重置 df cumsum df value condition 0 1 1 1 2 1 2 3 1 3 4 0 4 5 1 想要的结果
我可以以某种方式“编译”一个Python脚本以在没有安装Python的PC上运行吗？

所以我有一个Python脚本 myscript py 我是这样执行的 python D myscript py 但是我必须安装 Python 并将其包含在PATH使其工作的环境变量是否有可能以某种方式将 Python 可执行文件与 Py

随机推荐

Linq 完全外连接与数据表中的 NULL 记录 C#

请问有人可以帮忙吗我需要在 Extn In Call Records Extn Number 上返回一个表如果任一侧不匹配仍然返回一个计算就像 SQL 完全外连接一样我花了几个小时看这个但无法让它工作如果删除联合我可以让代码
Monodroid - EditText 输入法不接受数字

我在使用 Mono for Android 中的 EditText 控件时遇到一些非常奇怪的问题我的解决方案针对的是 2 3 并且我正在 T Mobile VivaCity 上进行调试这是我的 EditText 的 AXML
如何阻止 git 在结账时破坏编码

我最近使用以下设置将 gitattributes 文件添加到 c 存储库 text auto cs text diff csharp 我重新规范化了存储库按照 github 上的这些说明进行操作 https help github com
更干净的元组 groupBy

我有一系列键值对 String Int 我想按键将它们分组为值序列即Seq String Int gt Map String Iterable Int 明显地 toMap在这里没有用并且groupBy将值维护为元组我想出的最好的办法是
Android Things：截图

如何通过 ADB for Android Things 截屏我努力了 adb shell screencap p sdcard screen png adb pull sdcard screen png adb shell rm sdca
Angular UI-Routing，页面刷新时自动重定向到父状态

我正在开发一个使用 Angular UI 路由的项目当我尝试刷新网页或直接输入 URL 时它会被重定向到父状态它确实加载了我重新加载的 URL 的状态但随后快速重定向到父状态这是我的状态路由 stateProvider state
如何在 Objective C 中初始化一个空的可变数组

我有一个对象卡车列表其中包含填充表格视图的各种属性当您点击它们时它们会转到单独的卡车页面有一个添加按钮可以将它们添加到另一个表格视图中的收藏夹列表中如何在 Cocoa 中初始化一个空的可变数组我有以下代码 IBAction
bash脚本杀死超过一小时的php进程

我有以下内容 kill 9 ps aux grep php awk 9 0 9 0 9 awk print 2 它的作用是杀死被 fcgid 放弃的进程并杀死它们以释放 RAM 我想每小时运行一次 cron 但想杀死早于一小时的进程我只是
Textmate 到处检查拼写

有什么方法可以检查我在 Textmate 中输入的所有单词的拼写吗很难相信但我实际上使用合法的英语单词来表示我的所有变量和类名因此未突出显示的拼写错误简直要了我的命如果有一种方法可以检查带有特殊字符的单词的拼写那就太好了 uesr
删除 PostgreSQL 中数字列的所有尾随零

我有这张桌子properties其中有一个列atomic mass类型的NUMERIC 9 6 atomic mass 1 008000 4 002600 6 940000 9 012200 10 810000 12 011000 14 0
如何访问类的静态成员？

我正在尝试访问类的静态成员我的班级是 class A public static strName A is my name public function xyz Since I have bunch of classes stored
使用 perl 和 DBI 将非常大的表从一个 DB2 复制到另一个 DB2

我每天需要将一个非常大数百万行的表从一个 DB2 数据库复制到另一个 DB2 数据库并且我需要使用 perl 和 DBI 有没有比简单地从第一个数据库中获取每一行并将它们逐一插入到第二个数据库中更快的方法这是我得到的 sth1 ud
谷歌地图，没有启动导航的选项，只有预览

在我的应用程序中我在以下代码集的帮助下启动 Google 导航 String uri http maps google com maps saddr gpsLatitude gpsLongitude daddr updateAccepte
OSX Yosemite 升级后 adb（android 调试桥）出现问题

我昨天将我的 2011 款 13 英寸 Macbook 升级到了 Yosemite 现在我在使用 adb 工具 1 0 31 1 0 32 时遇到问题例如在设备上安装构建时通过 ddms 复制文件从eclipse android st
jsplumb 1.4.1 通过 uuid 或对象示例删除Endpoint

我有一些 div 元素每个元素有 2 个端点一个在左侧一个在右侧现在我想删除每个右侧端点每个端点都有自己唯一的 uuid 我得到了右侧端点的每个 uuid 的数组 gt 遍历它们并删除其中的每一个但这不起作用谁能给我一个通过
使用内收益回报

如果我没记错的话当我在里面使用yield时using SqlConnection阻止我遇到运行时异常 using var connection new SqlConnection connectionString var command
如何在 Java Swing 中显示英镑 (£) 符号？

目前我向 Java 源代码添加了英镑符号并编译生成的 Swing 组件显示为方形不支持的字符符号我怀疑这是一个编码问题 Java源文件被编码为cp1252 Eclipse似乎默认是这样解决这个问题的正确方法是什么使用 u0
PHP 命令行不运行 PHP 文件？

我目前正在从 Windows 命令提示符处触发 PHP 使用 C xampp php gt php f c Uncrypt php 哪个输出根据帮助文档这很奇怪php h 的开关 f should f 解析并执行但是这不起作用 PH
为什么 d3 更新整个数据

我有一个 svg 元素其数据是这样创建的 var chart d3 select my div append svg var chartData chartData push x 1 y 3 x 2 y 5 chartData push
split() 操作后获取 pandas 中唯一的字符串列表

我正在开始使用熊猫并且已经较大 DataFrame 中的一列数据例如 0 one two 1 two seven six 2 three one five 3 seven five five eight 4 six four 5 thre

split() 操作后获取 pandas 中唯一的字符串列表

split() 操作后获取 pandas 中唯一的字符串列表 的相关文章

随机推荐

热门标签

split() 操作后获取 pandas 中唯一的字符串列表的相关文章