当 DataFrame 列中的值以字符串开头时，使用 lambda 替换它们

2023-12-27

我有一个数据框：

import pandas as pd
import numpy as np
x = {'Value': ['Test', 'XXX123', 'XXX456', 'Test']}
df = pd.DataFrame(x)

我想使用 lambda 将以 XXX 开头的值替换为 np.nan。

我已经尝试了很多替换、应用和映射的方法，我能做的最好的就是“假”、“真”、“真”、“假”。

下面的方法有效，但我想知道更好的方法，并且我认为应用、替换和 lambda 可能是更好的方法。

df.Value.loc[df.Value.str.startswith('XXX', na=False)] = np.nan

use the apply https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.apply.html method

In [80]: x = {'Value': ['Test', 'XXX123', 'XXX456', 'Test']}
In [81]: df = pd.DataFrame(x)
In [82]: df.Value.apply(lambda x: np.nan if x.startswith('XXX') else x)
Out[82]:
0    Test
1     NaN
2     NaN
3    Test
Name: Value, dtype: object

Performance Comparision of apply, where, loc

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pandas

Lambda

replace

apply

startswith

当 DataFrame 列中的值以字符串开头时，使用 lambda 替换它们的相关文章

Groupby Sum 忽略几列

在此数据框中我想按位置进行分组并获得分数的总和但我不希望纬度经度和年份在此过程中受到影响 sample pd DataFrame Location A B C A B C Year 2001 2002 2003 200
基于坐标合并数据框

我有两个数据框两个数据框都包含经度和纬度列我想根据经度和纬度列合并这两个数据框首先我应用了普通merge函数它产生空的结果数据框我调查发现两个数据框没有相同的经度和纬度列然后我尝试了另一个函数merge asof并将方向设置为
如何将查找和替换限制为 CSV 中的一列？

我有一个 4 列 CSV 文件例如 0001 fish animal eats worms I use sed对文件进行查找和替换但我需要将此查找和替换限制为仅在第 3 列中找到的文本如何让查找和替换仅发生在这一列上您确定要使用se
两个不同长度的数据帧的列之间的余弦相似度？

我在 df1 中有文本列在 df2 中有文本列 df2 的长度将与 df1 的长度不同我想计算 df1 text 中每个条目与 df2 text 中每个条目的余弦相似度并为每场比赛给出分数输入样本 df1 mahesh suresh
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
Pandas date_range 为六个月值

我正在尝试创建一个日期范围该范围从特定日期开始以六个月为增量因此如果 end date 是 2020 01 15 那么在此之前的日期将是 2019 07 15 然后是 2019 01 15 依此类推 pandas 接受 6M 作为 d
与函数指针转换相关的 lambda 对象的生命周期

下列的这个答案 https stackoverflow com questions 4726768 returning functions in c 4730655 4730655我现在想知道 lambda 生命周期的规则是什么以及它们与
访问默认 lambda 参数中的模板类参数

我正在写一个简单的通用池模板类在构造函数中采用一个参数该参数是一个工厂函数用于根据需要实例化池中的对象 template
如何将字符串方法应用于数据帧的多列

我有一个包含多个字符串列的数据框我想使用对数据帧的多列上的系列有效的字符串方法我希望这样的事情 df pd DataFrame A 123f 456f B 789f 901f df Out 15 A B 0 123f 789f 1 45
Matplotlib 渲染日期、图像的问题

我在使用 conda forge 的 Matplotlib v 3 1 3 和 python 3 7 时遇到问题我拥有 Matplotlib 所需的所有依赖项当我输入这段代码时它应该可以工作我得到了泼溅艺术它基于此 YouTube
Python模糊字符串匹配作为相关样式表/矩阵

我有一个文件其中包含 x 个字符串名称及其关联的 ID 本质上是两列数据我想要的是一个格式为 x by x 的相关样式表将相关数据作为 x 轴和 y 轴但我想要 fuzzywuzzy 库的函数 fuzz ratio x y 作为输出
Pandas DataFrame 自定义 agg 函数奇怪的行为

我想使用自定义函数沿轴聚合 Pandas DataFrame 但我无法弄清楚该函数应返回什么 df pd DataFrame np arange 50 reshape 10 5 您可以将 numpy 函数传递给DataFrame agg C
什么机制使 Python lambda 可以在没有 wait 关键字的情况下工作？

我刚刚注意到一些令人惊讶的事情考虑以下示例 import asyncio async def wait n n asyncio sleep n async def main fn print meh await fn 1 print fo
Pandas cut 方法不包括下限

我正在尝试对包含 0 到 100 范围内的年龄的数据帧列进行分箱当我尝试使用垃圾箱来包含零年龄时它不起作用这是一个使用包含我的数据范围的列表的演示 pd cut pd Series range 101 0 24 49 74 100 范
确保特定列位于数据框中最后（或第一个）的最快方法是什么

given df df pd DataFrame np arange 8 reshape 2 4 columns list abcd 假设我需要专栏 b 到最后我可以做 df a c d b 但是确保给定列位于末尾的最有效方法是什么这就
Lambda 按值捕获和“mutable”关键字

关键词的必要性mutable在 lambda 中是造成极大混乱的根源考虑代码 int x 10 function
按年月分组并在 Python 中查找前 N 个最小值列

基于来自的输出数据帧这个链接 https stackoverflow com questions 69931611 resample by month and find certain number of columns which hav
重新索引 pandas DataFrame 以填充缺失的日期

我在 pandas DataFrame 中有每日数据df缺少某些日期例如下面的 1980 年 12 月 25 日我想重新索引 DataFrame 以添加具有 NaN 值的日期 date close None 0 1980 12 12 2
带有非独特标签的熊猫

我正在尝试对数据进行装箱并根据该装箱应用浮点值我认为 pandas cut 是实现此目的的工具但显然它需要每个 bin 标签都有唯一的值 values 0 6 0 5 0 5 0 6 0 8 0 9 bins 0 2 5 10 15 2
使用 Pandas 读取带有额外逗号且没有 quotechar 的 CSV？

Data from io import StringIO import pandas as pd s ID Level QID Text ResponseID responseText date key 375280046 S D3M Wh

随机推荐

在 Android/Jetpack Compose 中手动预填充导航后台

是否可以在 Android Jetpack Compose 中预填充导航后台我有一个深层链接可以深入导航层次结构但是按后退时它会导航到根路线 Example Route Main gt Route List gt Route De
请求相机权限 Flutter Web

我需要在我的网络应用程序中使用相机所以我想如果用户拒绝在他她的浏览器上使用相机我会再次请求它允许相机许可这是我的代码 import package universal html html dart as html RaisedBut
何时在 Blazor 中使用 ValueChanged 和 ValueExpression？

我在一些库 MatBlazor Telerik 中看到了这种常见模式ValueChanged and ValueExpression属性这真的让我很困惑两者有什么区别以及什么时候使用它我想添加一些用例ValueChanged and
我们如何对使用 cy.get() 获取的元素进行切片，然后仅对这些特定元素运行测试？

cy get li slice 0 5 上面的代码行不起作用因为它显示错误消息类型 Chainable 上不存在属性 slice 有没有办法对我们获取的元素进行切片cy get 还有其他几种方法可以做到这一点添加伪选择器 lt 5 取
流行博客文章排名算法

我正在建立一个博客聚合器例如Techmeme http techmeme com它可以从多个博客中查找最受欢迎的帖子与 Techmeme 不同我首先从各种 RSS 源聚合博客文章然后将标题和相关 URL 保存在数据库中之后我必须
单击工具提示内容 vuetify

大家我有一个问题可以点击工具提示内容来调用任何函数吗当我的工具提示打开时我想单击调用测试功能的范围
光滑的轮播从右到左

我已经设置了光滑的轮播来连续滚动但是我需要向相反的方向滚动添加 RTL 选项似乎不起作用在这里小提琴目前从左到右 http jsfiddle net mth2ghod http jsfiddle net mth2ghod funct
要解密的数据超出了该模数的最大值 128 字节。 RSA解密c#

我不知道如何在使用 X509 证书中的私钥解密文件时解决此异常要解密的数据超出了该模数 128 字节的最大值 byte data File ReadAllBytes F enc test file1 txt X509Certificate
本机库未在设备上运行

我已将armeabi armeabi v7a 文件夹放入libs 文件夹中而不是放入maven 存储库中但我在使用 libgdx 时遇到以下错误库 gdx backend jogl natives jar 包含不会在设备上运行的本机库
获取特定 div 的 span 类内的文本

我正在 T Mobile 网站上查找有关三星 Galaxy S9 的评论我能够为 HTML 代码创建一个 Beautiful Soup 对象但我无法获取 span 类中存在的评论文本还需要遍历评论页面以收集所有评论我尝试了 2 个代
jquery 调用 highcharts 生成错误 17

我试图从 highcharts com 获取一个仪表在我已经完成示例的页面上工作但我看不出我做错了什么如果有人能指出正确的方向这是我的小提琴高图仪表不工作 http jsfiddle net F6XUT 这是我的代码
Oracle：结合使用 ROWNUM 和 ORDER BY 子句更新表列

我想用连续的整数填充表列所以我考虑使用 ROWNUM 但是我需要根据其他列的顺序填充它例如ORDER BY column1 column2 不幸的是这是不可能的因为 Oracle 不接受以下声明 UPDATE table a SE
使用高分辨率纹理优化 SceneKit 性能

我是一位相当有经验的 iOS 开发人员但完全是 SceneKit 新手试图在基本应用程序中模拟一些行星为此我使用火星金星等的高分辨率法线和漫反射贴图应用于基本球体他们工作了它们看起来棒极了正是我想要的问题是我得到了ki
Jquery 模式对话框禁用滚动条

正如您在此链接中看到的 http jsbin com ozapol 9 http jsbin com ozapol 9 Jquery 在某些版本的 IE 和最新版本的 Chrome 上禁用滚动条我还没尝试过其他的有没有办法保持滚动条启用
正则表达式中的命名捕获组

我需要正则表达式的帮助来捕获以下字符串中的数字和连字符一些文字和东西 200 1234EM 一些其他东西它也可以不带连字符的部分出现一些文本 123EM 其他文本我需要在命名捕获组中使用 200 1234 或 123 我试过这个 b
嵌入双引号的 CSV 解析

我写了一个简单的 CSV 文件解析器但看完之后有关 CSV 格式的 wiki 页面 http en wikipedia org wiki Comma separated values我注意到基本格式的一些扩展通过双引号专门嵌入逗号我
如何让 ActionController::Live Streaming 与 Thin 一起工作？

Question 你能用吗thin with ActionController Live实现服务器端事件 SSE 和长轮询如果是这样怎么办 Context 虽然标题是重复的如何让 Rails 4 ActionController Liv
Python 2.6.6 中的小数和科学计数法问题

我在处理十进制值时遇到困难在某些情况下需要将其用于算术而在其他情况下则需要将其用作字符串具体来说我有一份费率清单例如 rates 0 1 0 000001 0 0000001 我使用它们来指定图像的压缩率我最初需要将这些值作为数
编辑数据时如何获取选定值 [codeigniter]

当我编辑数据时如何获取选定的值但我仍然可以选择 codeigniter div class form group div
当 DataFrame 列中的值以字符串开头时，使用 lambda 替换它们

我有一个数据框 import pandas as pd import numpy as np x Value Test XXX123 XXX456 Test df pd DataFrame x 我想使用 lambda 将以 XXX 开头的值

热门标签