如何拆分数据列中的值并将其添加到具有 pandas 条件的新列

2024-03-05

我有一个df，

name                        Value
Sri is a cricketer          Sri,is
Ram player                  Ram
Ravi is a singer            is
cricket and foot is ball    and,is,foot

和一个清单，

my_list=["is", "foot"]

我正在尝试按 (,) 拆分 df["value"] ，如果 my_list 中存在该值，则将该值添加到新列。我的预期输出是

name                      Value        my_list
Sri is a cricketer        Sri           is      
Ram player                Ram 
Ravi is a singer                        is     
cricket and foot is ball  and          is,foot

请帮助实现这一目标，提前致谢

Use str.findall http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.findall.html with str.join http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.join.html:

my_list=["is", "foot"]
df['my_list'] = df['Value'].str.findall('(' + '|'.join(my_list) + ')').str.join(',')
print (df)
                       name        Value  my_list
0        Sri is a cricketer       Sri,is       is
1                Ram player          Ram         
2          Ravi is a singer           is       is
3  cricket and foot is ball  and,is,foot  is,foot

另一种解决方案是split http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.split.html并得到intersections of sets:

my_list=["is", "foot"]
df['my_list']=df['Value'].str.split(',').apply(lambda x: set(x) & set(my_list)).str.join(',')
print (df)
                       name        Value  my_list
0        Sri is a cricketer       Sri,is       is
1                Ram player          Ram         
2          Ravi is a singer           is       is
3  cricket and foot is ball  and,is,foot  is,foot

最后：

df['Value'] = (df['Value'].str.replace('(' + '|,'.join(my_list) + ')', '')
                          .str.replace('[,]{2,}',',')
                          .str.strip(','))
print (df)
                       name Value  my_list
0        Sri is a cricketer   Sri       is
1                Ram player   Ram         
2          Ravi is a singer             is
3  cricket and foot is ball   and  is,foot

Or:

my_list=["is", "foot"]

s1 = df['Value'].str.split(',')

df['my_list'] = s1.apply(lambda x: set(x) & set(my_list)).str.join(',')
df['Value'] = s1.apply(lambda x: set(x) - set(my_list)).str.join(',')
print (df)

                       name Value  my_list
0        Sri is a cricketer   Sri       is
1                Ram player   Ram         
2          Ravi is a singer             is
3  cricket and foot is ball   and  is,foot

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

dataanalysis

如何拆分数据列中的值并将其添加到具有 pandas 条件的新列的相关文章

numpy python 中的“AttributeError：'matrix'对象没有属性'strftime'”错误

我有一个维度为 72000 1 的矩阵该矩阵涉及时间戳我想使用 strftime 如下所示 strftime d m y 为了得到像这样的输出 11 03 02 我有这样一个矩阵 M np matrix timestamps 我使用了
NumPy linalg.eig

我有这个烦人的问题但我还没有弄清楚我有一个矩阵我想找到特征向量所以我写 val vec np linalg eig mymatrix 然后我得到了 vec 我的问题是当我小组中的其他人对相同的矩阵 mymatrix 做同样的事情时
在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
从 Python 下载/安装 Windows 更新

我正在编写一个脚本来自动安装 Windows 更新我可以将其部署在多台计算机上这样我就不必担心手动更新它们我想用 Python 编写这个但找不到任何关于如何完成此操作的信息我需要知道如何搜索更新下载更新并从 python 脚本安
从sklearn PCA获取特征值和向量

如何获取 PCA 应用程序的特征值和特征向量 from sklearn decomposition import PCA clf PCA 0 98 whiten True converse 98 variance X train clf f
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
ValueError：不支持连续[重复]

这个问题在这里已经有答案了我正在使用 GridSearchCV 进行线性回归的交叉验证不是分类器也不是逻辑回归我还使用 StandardScaler 对 X 进行标准化我的数据框有 17 个特征 X 和 5 个目标 y 观察约11
如何在 Django 中使用基于类的视图创建注册视图？

当我开始使用 Django 时我几乎使用 FBV 基于函数的视图来处理所有事情包括注册新用户但当我更深入地研究项目时我意识到基于类的视图通常更适合大型项目因为它们更干净且可维护但这并不是说 FBV 不是无论如何我将整个项目
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
使用 Conda 更新特定模块会删除大量软件包

我最近开始使用 Anaconda Python 发行版因为它提供了许多开箱即用的数据分析库使用 conda 创建环境和安装软件包也轻而易举但是当我想更新 Python 本身或任何其他模块时我遇到了一些严重的问题我事先被告知我的很多
在 Spyder 的变量资源管理器中查看局部变量

我是 python 新手正在使用 Spyder 的 IDE 我欣赏它的一项功能是它的变量资源管理器然而根据一些研究我发现它只显示全局变量我找到的解决方法是使用检查模块 import inspect local vars def m
以编程方式使用 Sphinx 特定指令解析 .rst 文件

我希望能够在 Python 中解析基于 sphinx 的 rst 以便进一步处理和检查就像是 import sphinx p sphinx parse path to file rst do something with p 似乎在 do
Flask 应用程序的测试覆盖率不起作用

您好想在终端的 Flask 应用程序中测试删除路由我可以看到测试已经过去它说 test user delete test app LayoutTestCase ok 但是当我打开封面时它仍然是红色的这意味着没有覆盖它请有人向我
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个
[cocos2d-x]当我尝试在 Windows 10 中运行“python android-build.py -p 19 cpp-tests”时出现错误

当我尝试运行命令时python android build p cpp tests 我收到如图所示的错误在此之前我收到了另一条关于 Android SDK Tools 版本兼容性的错误消息所以我只是将 sdk 版本从 26 0 0
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j

随机推荐

来自 URL 的 Facebook ID

给定一个 Facebook 网址例如http facebook com cnn http facebook com cnn 有什么方法可以获取该页面的ID而不需要抓取它吗这是更好的并且legal 使用图形 API 来执行此操作只需执
使用 MySQLdb 执行“SELECT ... WHERE ... IN ...”

我在 Python 中执行一些 SQL 时遇到问题尽管类似的 SQL 在mysql命令行该表如下所示 mysql gt SELECT FROM foo fooid bar 1 A 2 B 3 C 4 D 4 rows in set 0
如何在 Kubernetes 中模拟断电

我有我的rook ceph集群运行于AWS 它加载了数据有什么办法可以刺激一下电源检测失败这样我就可以测试我的集群的行为从 Docker 你可以发送 KILL 信号 SIGPWR 电源故障系统 V http man7 org li
重试时修改源 Observable - RxJava

如何在重试时更新可观察的源 List
如何在 PHP 中获取单选按钮的值？

我创建了一个基本网站要求用户选择一个单选按钮我想要一个 PHP 文件来检索所选单选按钮的值并做出相应响应但该文件当前不产生任何输出我现在使用的代码有什么问题吗为什么我的 PHP 文件无法正确检索单选按钮值索引 html
如何在Lua中创建目录？

是否可以在 lua 中创建目录如果是这样怎么办有一个系统调用或类似的东西这是来自内存的您应该能够使用它来运行任意程序其中可能包括 mkdir 命令 EDIT 我找到了我的Lua 编程书在第 203 页它提到了如何使用
将 JFreeChart 系列名称映射到系列索引

我正在策划一个TimeTableXYDataset用一个StackedXYBarRenderer 不幸的是每个系列的颜色在刷新时都会发生变化我知道如何使用设置颜色setSeriesPaint渲染器的方法但它采用整数系列索引作为参数我
如何在 .NET 中启用程序集绑定失败日志记录 (Fusion)

如何在 NET 中启用程序集绑定失败日志记录 Fusion 将以下值添加到 HKEY LOCAL MACHINE SOFTWARE Microsoft Fusion Add DWORD ForceLog set value to 1 DWO
获取 JCarousel 中当前项目的索引

我正在尝试获取当前项目的索引J旋转木马 http sorgalla com jcarousel 这样我就可以向用户显示轮播中的当前位置例如 13 20 我怎样才能做到这一点 EDIT 最终产品样品我认为您正在寻找的是 carousel
如何在 .NET 4.0 中使用 XPath 2.0 方法？

我正在使用 NET 4 0 并且我想使用 XPath 2 0 方法例如 Matches 1 upper case 2 lower case 3 尝试在文档中查找元素 X 路径示例 MyDocument MyNode matches MyA
pcap_loop 和 pcap_dispatch 区别

pcap loop 和 pcap dispatch 到底有什么区别该手册对这一点的描述非常好我是板着脸说的保证从man pcap loop pcap loop processes packets from a live captur
nServiceBus、公共交通、Rhino 服务总线、其他？

只是做一些快速的尝试以可能使用消息传递系统来处理良好解耦的工作流系统中的文件人们发现使用上述每个框架的优点和缺点是什么与带有 WCF 绑定和或非 MSMQ 解决方案的手动 MSMQ 系统相比使用这些有哪些优势我建议远离手动解决方
在 Android 锁定任务模式下执行呼叫

TL DR 如何在使用时拨打电话Activity startLockTask 我正在尝试在 Android 设备上设置受限环境即通常所说的 Kiosk 模式官方文档可以在这里找到 https developer android com
XPath 2.0 和/或 XSLT 2.0 是否会在 PHP 中实现？

The question was asked but deleted by the asker before it received an answer Because I believe the question is sound and
当 Java 类未在我的代码中实例化时，是否可以使用 Groovy 重写 Java 类中的方法？

我正在开发一个 Eclipse RCP 应用程序最近开始在其中使用 Groovy 所以我99 的代码仍然是Java 我读到可以使用 Groovy 重写方法并向 Java 类添加方法并且我能够通过向 java lang String 添加
清除 Jupyter Python 笔记本中的 MatPlotLib 图形

我希望 MatPlotLib 中的 3D 散点图在 Jupyter Python 笔记本中交互式旋转因此我集成了一个滑块ipywidgets更新视角下面的测试代码显示了我想要实现的目标问题在于在前一个数字下方添加了一个新数字而不
从 Programm 类开始打开一个窗口？

我有一个控制台应用程序所以我需要打开一个名为 UserInterface xaml 的窗口这是一个窗口我的班级计划我有这个 class Program STAThread static void Main string args va
使用 python 在 OpenCV 中进行透视校正

我正在尝试对倾斜的矩形信用卡进行透视校正该矩形在所有 4 个方向上都倾斜我可以找到它的四个角及其各自的倾斜角度但我找不到它必须投影的坐标的确切位置我正在使用 cv2 getPerspectiveTransform 进行转换我有
Azure Pipelines 未找到具有提供的指纹的证书

问题已描述here https developercommunity visualstudio com content problem 881015 no certificate found with the supplied thumbp
如何拆分数据列中的值并将其添加到具有 pandas 条件的新列

我有一个df name Value Sri is a cricketer Sri is Ram player Ram Ravi is a singer is cricket and foot is ball and is foot 和一个清

如何拆分数据列中的值并将其添加到具有 pandas 条件的新列

如何拆分数据列中的值并将其添加到具有 pandas 条件的新列 的相关文章

随机推荐

热门标签

如何拆分数据列中的值并将其添加到具有 pandas 条件的新列的相关文章