在多列中查找字符串？

2023-12-01

我有一个包含 3 列 tel1、tel2、tel3 的数据框我想保留一列或多列中包含特定值的行：

例如，我想保留列 tel1 和 tel2 或 tel3 以“06”开头的行

我怎样才能做到这一点？谢谢

让我们用这个df作为示例数据框：

In [54]: df = pd.DataFrame({'tel{}'.format(j): 
                            ['{:02d}'.format(i+j) 
                             for i in range(10)] for j in range(3)})

In [71]: df
Out[71]: 
  tel0 tel1 tel2
0   00   01   02
1   01   02   03
2   02   03   04
3   03   04   05
4   04   05   06
5   05   06   07
6   06   07   08
7   07   08   09
8   08   09   10
9   09   10   11

您可以找到其中的值df['tel0']以。。开始'06' using StringMethods.startswith:

In [72]: df['tel0'].str.startswith('06')
Out[72]: 
0    False
1    False
2    False
3    False
4    False
5    False
6     True
7    False
8    False
9    False
Name: tel0, dtype: bool

要将两个布尔系列与逻辑或组合起来，请使用|:

In [73]: df['tel0'].str.startswith('06') | df['tel1'].str.startswith('06')
Out[73]: 
0    False
1    False
2    False
3    False
4    False
5     True
6     True
7    False
8    False
9    False
dtype: bool

或者，如果您想使用逻辑或组合布尔系列列表，您可以使用reduce:

In [79]: import functools
In [80]: import numpy as np
In [80]: mask = functools.reduce(np.logical_or, [df['tel{}'.format(i)].str.startswith('06') for i in range(3)])

In [81]: mask
Out[81]: 
0    False
1    False
2    False
3    False
4     True
5     True
6     True
7    False
8    False
9    False
Name: tel0, dtype: bool

一旦你有了布尔值mask，您可以使用选择关联的行df.loc:

In [75]: df.loc[mask]
Out[75]: 
  tel0 tel1 tel2
4   04   05   06
5   05   06   07
6   06   07   08

注意还有很多其他的向量化 str 方法除了开始。你可能会发现str.contains对于查找哪些行很有用contain一个字符串。注意str.contains默认情况下将其参数解释为正则表达式模式：

In [85]: df['tel0'].str.contains(r'6|7')
Out[85]: 
0    False
1    False
2    False
3    False
4    False
5    False
6     True
7     True
8    False
9    False
Name: tel0, dtype: bool

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pandas

在多列中查找字符串？的相关文章

以最小的内存占用拆分大型 Pandas 数据帧

我有一个大的 DataFrame 我想将其分成一个测试集和一个用于模型构建的训练集但是我不想复制 DataFrame 因为我已达到内存限制是否有一个类似于 pop 的操作但对于一个大段它会同时删除 DataFrame 的一部分并允
将数据帧中的 NaN 转换为零

我有字典并使用创建了 Pandas cars pd DataFrame from dict cars dict orient index 和对索引进行排序按字母顺序排列汽车 cars sort index axis 1 排序后我注意到
当有重复的列名时，填充奇怪的行为

我有一个如下所示的数据框 df pd DataFrame A np nan 1 1 np nan B 2 np nan 2 2 index 1 1 2 2 df columns A A 现在我想要ffill价值groupby the ind
根据列表中的关键字过滤数据框中的文本

我有一个列表列表列表的每个子列表都包含用于过滤数据框中文本的关键字 keywords tarifa mantenimiento mensual tasa anual seguro bancaria seguro generales mi
如何向量化 pandas 数据框中的比较？

我有数据框的一部分df像这样 nr Time Event 70 8 70 0 70 0 74 52 74 12 74 0 我想将事件分配给最后一列默认情况下第一个条目为 1 If Time i lt 7 and nr i nr i 1
根据连续行值差异拆分数据框

我有一个这样的数据框 df col1 col2 col3 1 2 3 2 5 6 7 8 9 10 11 12 11 12 13 13 14 15 14 15 16 现在我想当两个连续行的 col1 差异大于 1 时从上面创建多个数据框所
Pandas：使用数据帧的多列作为另一个数据帧的索引

我有一个包含我的数据的大型数据框以及另一个具有相同第一维度的数据框其中包含有关每个时间点的元数据例如试验编号是什么试验类型是什么我想要做的是使用元数据帧的值对大数据帧进行切片我想将它们分开而不是将数据数据帧存储为较大数据
pandas 数据框中的第一列不是列？

我有一个数据框 gt gt df Column1 Column2 vo1 102 0 023002 0 301 3571 662104 0 302 1346 910261 0 那么有三列吗但 gt gt df dtypes Column1
Pandas 解析 csv 错误 - 预期 1 个字段，找到 9 个字段

我正在尝试从 csv 文件解析 planets pd read csv planets csv sep 但我总是会遇到这个错误 ParserError Error tokenizing data C error Expected 1 fie
使用带有不匹配索引的 pandas .loc 时内存爆炸+分配导致重复轴错误

这是一个观察将 pandas 单元格与条件连接起来的最 Pythonic 方法 https stackoverflow com questions 69313521 most pythonic way to concatenate pand
pandas 替换列子集的空值

我有一个包含许多列的数据框例如 df name salary age title John 100 35 eng Bill 200 NaN adm Lena NaN 28 NaN Jane 120 45 eng 我想替换工资和年龄中的空值
Python：按组计算数据框中的特定出现次数

假设我有一个 df df pd DataFrame id 12 35 37 67 99 78 product banana apple banana pear banana apple reordered 1 0 0 1 1 1 id pr
scikit-learn 中跨多列的标签编码

我正在尝试使用 scikit learnLabelEncoder对 pandas 进行编码DataFrame字符串标签由于数据框有许多 50 列我想避免创建LabelEncoder每列的对象我宁愿只拥有一件大的LabelEncoder
如何在 pandas 中添加堆叠条形图孵化？（...或者如何在 pandas 绘图与 matplotlib 中获得 BarContainer 与 AxesSubplot ？）

我有一个使用的代码示例matplotlib pyplot plot 这是可行的我想复制它以在堆叠条形图上制作阴影条形段然而我一直在使用pandas DataFrame plot 代替matplotlib pyplot plot 并且也
使用索引作为循环变量连接多个数据帧

我通过 for 循环创建多个数据帧并将它们连接起来效果很好但我需要包含循环变量作为索引我找不到将循环变量设置为索引的方法 maindf pd DataFrame for i in 20170724 20170725 20170726
使用字典来键入一系列值[重复]

这个问题在这里已经有答案了我有一个 pandas 数据框我想根据另一列的值在新列中创建类别我可以通过这样做来解决我的基本问题 range range 0 5 Below 5 range 6 10 between range 11 10
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
当价格低于阈值时使用 pandas DataFrame 实施矢量化止损

给出这个示例数据框 date close signal positions 2017 01 02 27 90 0 0 0 0 2017 01 03 27 76 0 0 0 0 2017 01 04 28 65 1 0 1 0 2017 01
在至少 7 天内连续三天登录该产品的用户

我有一个用于用户参与的数据框 df 如下所示 time stamp user id 2013 01 01 10 05 23 1 2013 01 03 16 35 23 1 2013 01 06 11 06 35 1 2013 01 10 1
Python matplotlib 在鼠标悬停时不显示完整日期

我有一个数据框日期索引 and 温度值 Date Temperature 2015 10 21 9 118 2015 10 22 9 099 2015 10 23 8 945 2015 10 26 8 848 2015 10 27 8 84

随机推荐

按mysql中select语句“in”子句中的值顺序排序

我正在从一个具有整数 id 值的大表数百万行中选择一组帐户记录从某种意义上说这是一个基本的查询我正在做的事情是构建一个大的逗号分隔列表并将其作为 in 子句传递到查询中现在的结果是完全无序的我想做的是按照 in 子句中的值的
当为 WinHTTPRequest 指定事件处理程序前缀时，WScript.CreateObject 会使 Windows 脚本主机崩溃

根据MSDN 文档WinHTTPRequest 有四个事件处理程序应该可以通过指定事件处理程序前缀来访问它们不幸的是这样做会导致 Windows Scripting Host 崩溃以下代码使 Windows 脚本主机崩溃 Set o
window.prompt和prompt之间有什么真正的区别吗？

只是出于好奇 window prompt 和 JavaScript 中的提示之间有什么区别吗对于老师使用的我的考试问题的答案之一 var yourName window prompt Please enter your first nam
如何在knitr的pdf输出中保持带有图形标题的图形位置？

我正在使用knitr 1 9 5和1 9 17 和rmarkdown 0 5 3 1 并且想在pdf输出中保留图形位置当 chunk 选项时生成的 pdf 文件工作正常fig pos H 用来然而当fig caption yes被设
一页上有多个倒计时器

目前正在开发一个需要在一页上有两个计时器的项目定时器需要有一个启动按钮并且两者都有不同的计时即定时器 1 持续 10 秒定时器 2 持续 20 秒这是我正在使用的脚本但我不知道如何复制计时器并让每个计时器独立工作有没有人可以轻
php、文件下载

我正在使用简单的文件下载脚本 if file exists file header Content Description File Transfer header Content Type application octet stream
R Shiny 保存反应性 ggplots

我试图弄清楚如何在我的 R Shiny 项目中保存反应性 ggplots 我已经关注了this指南以及 R Shiny 网站上的指南但是我认为我可能遇到问题因为我使用的是反应图这是我到目前为止的代码 ui lt fluidPage
如何将对象中数组的索引值添加到键

我在变量中有一个对象info as 0 ProId Space Name cake Quantity 1 1 ProId new Name walk Quantity 1 我正在尝试将数量值更改为index 1对于每个索引我尝试将静态值设
如何使用 CASE 更新 MySQL 中的条目以获得新值？

谁能告诉我如何解决这个查询 update ae44 set Price Case when ID AT259793380 then 500 when ID AT271729590 then 600 when ID AT275981020 t
将数据变量传递给 R 公式

假设我想写anscombe gt lm tidy x1 y1 其实我想写anscombe gt lm tidy x1 y1 where x1 and y1是数据框的一部分因此由于以下功能似乎有效 plot gg lt function
如何将文本添加到按钮上方的 Inno Setup 斜线？

如何将文本添加到按钮上方的 Inno Setup 斜线来自 Inno Setup 帮助特殊用途的 BeveledLabel 消息可用于指定一条线向导窗口左下角显示的文本和卸载程序窗口下面是一个例子 Messages Beveled
如何在 Swift 中使用命名空间？

文档只提到了嵌套类型但不清楚它们是否可以用作命名空间我没有发现任何明确提及名称空间的内容我认为 Swift 的命名空间是令人向往的它的大量广告与实际情况不符例如 WWDC 视频指出如果您导入的框架有一个 MyClass 类并且
Python Max/Min 函数中的 iter 和 key 如何工作？ [复制]

这个问题在这里已经有答案了我对 Python 比较陌生我一直在阅读各种内置函数的文档当涉及到最大最小函数时 max arg1 arg2 args key or max iterable key 我知道 arg1 arg2 等或 it
Jquery - 我不应该重复选择器（存储在变量中）吗？

有时我发现自己多次重复选择器我是否应该以某种方式将 jquery 对象存储到变量中然后只使用该变量举个简单的例子以下内容怎么样 a contactus css padding 10px a contactus css margin
我可以使用 lambda 重写 JDK8 中功能接口的 toString 方法吗？

这个问题在这里已经有答案了我可以重写功能接口的 toString 方法吗或者改写一下是否有优雅的方法来更改实现函数式接口并使用 lambda 重写 toString 方法的匿名内部类当我在JDK8中创建lamba表达式时我可以覆盖
python 对象到本机 c++ 指针

我正在考虑使用 python 作为我正在从事的项目的嵌入式脚本语言并且已经完成了大部分工作但是我似乎无法将 python 扩展对象转换回本机 c 指针这是我的课 class CGEGameModeBase public virtual
寻找衍生脚本

我正在拼命寻找可以计算函数一阶导数的 JavaScript 该函数始终仅包含一个变量 x e g f x x f 3 2x 因此脚本应提供结果 6 因为2 3 6 我希望你明白我的意思 function slope f x dx dx d
.NET 在服务器上创建计划任务失败并显示 E_ACCESSDENIED

我有一个 ASP NET 网站 C 语言它接收用户数据然后尝试创建 Windows 计划任务当然这在 DEV 机器上运行得很好但在服务器上运行失败我试图弄清楚 ASPNET 用户或匿名 Web 用户需要什么权限才能创建任务
在 C++ 上解析 JSON 文件并获取主键的所有子文件[关闭]

Closed 这个问题需要多问focused 目前不接受答案我使用 boost 库需要在 C 上解析一些 json 文件对于前 json 部分 media Test1 https storage tst Test2 https sto
在多列中查找字符串？

我有一个包含 3 列 tel1 tel2 tel3 的数据框我想保留一列或多列中包含特定值的行例如我想保留列 tel1 和 tel2 或 tel3 以 06 开头的行我怎样才能做到这一点谢谢让我们用这个df作为示例数据框 In

在多列中查找字符串？

在多列中查找字符串？ 的相关文章

随机推荐

热门标签

在多列中查找字符串？的相关文章