数据框列值与列表的比较

2024-04-12

考虑这个数据框：

df = pd.DataFrame({'A': [1, 1, 2, 2, 3, 3],
                   'B': [10, 15, 20, 25, 30,35],
                   'C': [100, 150, 200, 250, 300, 350]})

这是获取 C 列值的代码，它是每组的第一行（A 列）：

firsts = df.groupby('A').first()['C']

所以首先是：(100, 200, 300).

现在我想添加新列1如果行的 C 列值位于firsts否则将会是0.

A	B	C	D
1	10	100	1
1	15	150	0
2	20	200	1
2	25	250	0
3	30	300	1
3	35	350	0

我用过这个：

df['D'] = df['C'].apply(lambda x: 1 if x in firsts else 0)

但输出是：

A	B	C
1	10	100
1	15	150
2	20	200
2	25	250
3	30	300
3	35	350

如果有人解释为什么我的解决方案是错误的以及这个问题的实际解决方案是什么，我将不胜感激？

您可以使用isin method:

df['D'] = df.C.isin(firsts).astype(int)

df
#   A   B   C   D
#0  1   10  100 1
#1  1   15  150 0
#2  2   20  200 1
#3  2   25  250 0
#4  3   30  300 1
#5  3   35  350 0

你的方法失败的原因是 pythonin运算符检查 Series 的索引而不是值，与字典的工作方式相同：

firsts
#A
#1    100
#2    200
#3    300
#Name: C, dtype: int64

1 in firsts
# True

100 in firsts
# False

2 in firsts
# True

200 in firsts
# False

按如下方式修改您的方法是有效的：

firstSet = set(firsts)
df['C'].apply(lambda x: 1 if x in firstSet else 0)

#0    1
#1    0
#2    1
#3    0
#4    1
#5    0
#Name: C, dtype: int64

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

数据框列值与列表的比较的相关文章

按边距（“全部”）值列对 Pandas 数据透视表进行排序

我试图根据 pandas 数据透视表中的行总和对最后一列边距 aggrfunc 进行降序排序我知道我在这里错过了一些简单的东西但我无法弄清楚数据框数据透视表 WIDGETS DATE 2 1 16 2 2 16 2 3 16 Al
Mypy 无法从文字列表推断项目的类型

我有一个变量x和一个文字列表例如 0 1 2 我想转换x这些文字之一如果x在列表中我将其退回否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
是否可以从 Julia 调用 Python 函数并返回其结果？

我正在使用 Python 从网络上抓取数据我想使用这些数据在 Julia 中运行计算是否可以在 Julia 中调用该函数并返回其结果或者我最好直接导出到 CSV 并以这种方式加载数据绝对地看PyCall jl https gith
从 Azure ML 实验中访问 Azure Blob 存储

Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块但是我需要将 JSON 文件写入 blob 存储由于没有模块可以执行此操作因此我尝试在Ex
如何通过 python 多处理利用所有核心

我一直在摆弄Python的multiprocessing现在已经使用了一个多小时的功能尝试使用并行化相当复杂的图形遍历函数multiprocessing Process and multiprocessing Manager import
创建上下文后将 jar 文件添加到 pyspark

我正在笔记本上使用 pyspark 并且不处理 SparkSession 的创建我需要加载一个包含一些我想在处理 rdd 时使用的函数的 jar 您可以使用 jars 轻松完成此操作但在我的特定情况下我无法做到这一点有没有办法访问sp
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
Python HMAC：类型错误：字符映射必须返回整数、None 或 unicode

我在使用 HMAC 时遇到了一个小问题运行这段代码时 signature hmac new key secret key msg string to sign digestmod sha1 我收到一个奇怪的错误 File usr loca
Python Anaconda：如何测试更新的库是否与我现有的代码兼容？

我在 Windows 7 机器上使用 Python 2 7 Anaconda 安装进行数据分析和科学计算当新的库发布时例如新版本的 pandas patsy 等您建议我如何测试新版本与现有代码的兼容性是否可以在同一台机器上安装两个
Plotly：如何检查基本图形结构（版本 4）

对于旧版本的plotly 例如在 Jupyterlab 中您可以简单地运行figure像这样检查你的图形的基础知识 Ouput data marker color red size 10 symbol 104 mode markers l
pandas 相当于 np.where

np where具有向量化 if else 的语义类似于 Apache Spark 的when otherwise数据帧方法我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
Airflow 1.9 - 无法将日志写入 s3

我在 aws 的 kubernetes 中运行气流 1 9 我希望将日志发送到 s3 因为气流容器本身的寿命并不长我已经阅读了描述该过程的各种线程和文档但我仍然无法让它工作首先是一个测试向我证明 s3 配置和权限是有效的这是在我们
在骨架图像中查找线 OpenCV python

我有以下图片我想找到一些线来进行一些计算平均长度等我尝试使用HoughLinesP 但它找不到线我能怎么做这是我的代码 sk skeleton mask rows cols sk shape imgOut np zeros row
使用 Python 将连续日期分组在一起

Given dates datetime 2014 10 11 datetime 2014 10 1 datetime 2014 10 2 datetime 2014 10 3 datetime 2014 10 5 datetime 201
如何指示 urwid 列表框的项目数多于当前显示的项目数？

有没有办法向用户显示 urwid 列表框在显示部分上方下方有其他项目我正在考虑类似滚动条的东西它可以显示条目的数量或者列表框顶部底部的单独栏如果这个行为无法实现有哪些方法可以实现这个通知在我的研究过程中我发现这个问题 ht
检测是否从psycopg2游标获取？

假设我执行以下命令 insert into hello username values me 我跑起来就像 cursor fetchall 我收到以下错误 psycopg2 ProgrammingError no results to fe
如何编写一个接受 int 或 float 的 C 函数？

我想用 C 语言创建一个扩展 Python 的函数该函数可以接受 float 或 int 类型的输入所以基本上我想要f 5 and f 5 5 成为可接受的输入我认为我不能使用if PyArg ParseTuple args i v
如何获取pandas中groupby对象中的组数？

我想知道有多少个独特的组需要执行计算给定一个名为 groupby 的对象dfgroup 我们如何找到组的数量简单快速 Pandaic ngroups 较新版本的 groupby API pandas gt 0 23 提供了此未记录的
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome
无法安装最新版本的 Numpy (1.22.3)

我正在尝试安装最新版本的 numpy 即 1 22 3 但看起来 pip 无法找到最后一个版本我知道我可以从源代码本地安装它但我想了解为什么我无法使用 pip 安装它 PS 我有最新版本的pip 22 0 4 ERROR Could n

随机推荐

JPA/Hibernate：我可以有一个没有注释的父级和一个带有注释的子级吗？

我需要创建一个可以独立使用或在更大的应用程序中使用的组件独立使用时它不需要数据库也不需要任何数据库 ORM 相关的依赖项当用作较大应用程序的一部分时某些类确实会通过 JPA Hibernate 持久保存到数据库中我认为组件中的域
是否可以在Windows CE 5.0浏览器中查看部署在IIS 6.0上的silverlight或asp.net 3.5网站？

我计划在 silverlight 中构建一个网站并将其部署在 IIS 6 0 上我不知道是否可以在Windows CE 5 0浏览器中浏览该应用程序如果不可能的话查看 silverlight 应用程序比查看 asp net 3 5
使用 haskell Pipes-bytestring 按行迭代文件

我正在使用管道库需要将 ByteString 流转换为行流即String 使用 ASCII 编码我知道还有其他库 Pipes Text 和 Pipes Prelude 也许可以让我更轻松地从文本文件中生成行但是由于其他一些代码我需
Python GUI 在整个过程完成之前不会更新

我有一个进程从目录中获取文件并将它们放入列表中然后它循环迭代该列表循环的最后一行是它应该更新我的 gui 显示的位置然后它再次从列表中的下一项开始循环我的问题是在整个过程完成之前它实际上不会更新 gui 这取决于列表的大小可能
在 slickgrid 上调用排序

在 slickgrid 中我可以使用以下命令设置排序列及其排序方向grid SetSortColumn colName true false 这仅设置排序字形但不进行排序有没有办法调用排序事件处理程序我已经定义了排序处理程序例如g
析构函数应该是线程安全的吗？

我正在查看遗留代码并发现以下片段 MyClass MyClass EnterCriticalSection cs Access Data Members NO Global members are being accessed here L
在 .net 中，如何在 Decimal 和 Double 之间进行选择

前几天我们在工作中讨论了这个问题我希望有一个 Stackoverflow 问题我可以向人们指出所以就在这里和有什么区别Double http msdn microsoft com en us library x99xtshc VS 7
Rails 3 - RMagick 使用 Paperclip 找不到 libfreetype.6.dylib

我正在尝试使用回形针上传一些图像它工作正常但如果我想添加一些样式 styles gt small gt 100x100 它不再工作了我收到此错误消息 myImage 识别命令无法识别所以我在网上找到了一些提示我用 Brew 安
scala 控制台错误：对象 apache 不是包组织的成员

我正在尝试这里建议的代码 http spark apache org docs 1 2 1 mllib ensembles html classification http spark apache org docs 1 2 1 mllib
protobuf net 是否支持列表/数组内共享引用的对象图？

看来 protobuf net 不支持列表数组的 AsReference 以及列表数组内对象的 AsReference 最终 v2 会支持此功能吗 ProtoMember 1 AsReference true DynamicType t
AngularJS $watch 函数如何工作？

我现在读了很多关于 AngularJS 的文章并且遇到了神奇的 watch 函数我知道如何使用它但我想知道它在后台是如何实现的是时间间隔函数吗或者是 Angular 会在执行的每个语句中调用此监视我现在不想深入研究源代码如果你
Rails：将子域路由到资源

是否可以将子域映射到资源我有一个公司模型目前使用 subdomain fu 我的路由文件包含 map company root controller gt companies action gt show conditions gt
[R=301] 和 [R=301,L] 有什么区别？

谁能与我分享一下两者之间的区别 R 301 and R 301 L 在 301 重定向中哪个最适合重定向 url 虽然两者都工作得很好但我确实注意到 R 301 L 将 URL 更改为新 URL 同时 R 301 仅重定向内容有人可以
Windows API `GetPixel()' 总是返回 `CLR_INVALID`，但是 `SetPixel()` 效果很好？

我的操作系统是 windows 7 64 位有 2 个显示器显示 I use GetPixel 但它总是返回CLR INVALID结果是这样的 COLORREF result GetPixel dc x y My GetDeviceCap
IIS 7.5、Web 服务和 HTTP 405 错误

我有一个在我的机器上托管的网络服务我使用 Windows 7 和 IIS 7 5 Problem 当客户端尝试使用 Web 服务时他她会收到 HTTP 405 错误在 IIS 的日志文件中我可以看到此操作被拒绝因为不允许使用 P
使用 R 获取总和为 100 的所有组合

我需要使用 8 个变量来获取总和等于 100 的所有组合这些变量可以按 10 的增量步长取 0 到 100 之间的任何值即 0 10 20 100 下面的脚本就是这样做的但是效率非常低因为它创建了一个巨大的数据集我想知道是否有人有
numpy 中的多维布尔数组索引

我有两个二维数组一个是数字数组一个是布尔值数组 x array 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4
我如何通过 linq to xml 从 xml 获取所有“属性”

XML 示例原始链接 http twitpic com 150f61
如何为xjc编写外部绑定文件？

JAXB 的文档xjc http java sun com webservices docs 1 6 jaxb xjc html says b 指定一个或多个要处理的外部绑定文件每个绑定文件必须有自己的 b 开关外部绑定文件的语法非常灵
数据框列值与列表的比较

考虑这个数据框 df pd DataFrame A 1 1 2 2 3 3 B 10 15 20 25 30 35 C 100 150 200 250 300 350 这是获取 C 列值的代码它是每组的第一行 A 列 firsts df

数据框列值与列表的比较

数据框列值与列表的比较 的相关文章

随机推荐

热门标签

数据框列值与列表的比较的相关文章