(pandas) 为什么 .bfill().ffill() 对组的作用与 ffill().bfill() 不同？

2023-12-15

我认为我在概念上遗漏了一些基本概念，但我无法在文档中找到答案。

>>> df=pd.DataFrame({'a':[1,1,2,2,3,3], 'b':[5,np.nan, 6, np.nan, np.nan, np.nan]})
>>> df
   a    b
0  1  5.0
1  1  NaN
2  2  6.0
3  2  NaN
4  3  NaN
5  3  NaN

使用 ffill() 然后使用 bfill()：

>>> df.groupby('a')['b'].ffill().bfill()
0    5.0
1    5.0
2    6.0
3    6.0
4    NaN
5    NaN

使用 bfill()，然后使用 ffill()：

>>> df.groupby('a')['b'].bfill().ffill()
0    5.0
1    5.0
2    6.0
3    6.0
4    6.0
5    6.0

第二种方式不会破坏分组吗？第一种方法是否始终确保仅使用该组中的其他值填充这些值？

我认为你需要：

print (df.groupby('a')['b'].apply(lambda x: x.ffill().bfill()))
0    5.0
1    5.0
2    6.0
3    6.0
4    NaN
5    NaN
Name: b, dtype: float64

print (df.groupby('a')['b'].apply(lambda x: x.bfill().ffill()))
0    5.0
1    5.0
2    6.0
3    6.0
4    NaN
5    NaN
Name: b, dtype: float64

因为在你的样本中只有第一个ffill or bfill is DataFrameGroupBy.ffill or DataFrameGroupBy.bfill，第二个是处理输出Series。所以它打破了群体，因为Series没有组。

print (df.groupby('a')['b'].ffill())
0    5.0
1    5.0
2    6.0
3    6.0
4    NaN
5    NaN
Name: b, dtype: float64

print (df.groupby('a')['b'].bfill())
0    5.0
1    NaN
2    6.0
3    NaN
4    NaN
5    NaN
Name: b, dtype: float64

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pandas

groupby

pandasgroupby

(pandas) 为什么 .bfill().ffill() 对组的作用与 ffill().bfill() 不同？的相关文章

使用 pd.Grouper() 获取第一个和最后一个元素

我有一个时间序列我将其重新采样为 5s 窗口如下所示 INDEX size price 2018 05 07 21 53 13 731 0 365127 9391 800000 2018 05 07 21 53 16 201 0 666
rpy2 (版本 2.3.10) - 将数据从 R 包导入到 python 中

因此我尝试将一些数据从 R 包导入到 python 中以测试我编写的其他一些 python rpy2 函数特别是我正在使用SpatialEpiR 中的包和pennLC数据集所以我能够导入 rpy2 包并正确连接到该包但是我不确
在 Pandas UDF PySpark 中传递多列

我想计算 PySpark DataFrame 两列之间的 Jaro Winkler 距离 Jaro Winkler 距离可通过所有节点上的 pyjarowinkler 包获得 pyjarowinkler 的工作原理如下 from pyjar
如何在 pandas 数据框中移动日期（添加 x 个月）？

我有一个包含日期列的数据框我知道如何将日期移动固定的月份数例如向 x 列中的所有日期添加 3 个月但是我无法弄清楚如何将日期移动几个月这不是固定的而是数据框的另一列有任何想法吗我在下面复制了一个最小的例子我得到的错误是
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
pandas to_sql sqlalchemy 与 secure_transport 的连接

我正在尝试将数据发送到具有 require secure transport ON 的服务器上的 mysql 数据库当我尝试使用以下代码连接到它时 import pandas as pd import pymysql from sqlal
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
如何加速 pandas 字符串函数？

我正在使用 pandas 矢量化 str split 方法来提取从上的拆分返回的第一个元素我还尝试使用 df apply 与 lambda 和 str split 来产生等效的结果使用 timeit 时我发现 df apply 的
当价格低于阈值时使用 pandas DataFrame 实施矢量化止损

给出这个示例数据框 date close signal positions 2017 01 02 27 90 0 0 0 0 2017 01 03 27 76 0 0 0 0 2017 01 04 28 65 1 0 1 0 2017 01
Pandas Series 中的 name 参数是什么？

在文档中Series http pandas pydata org pandas docs stable generated pandas Series html 使用参数name and fastpath没有解释他们在做什么 The n
从 pandas 数据框中删除 NaN 值并重塑表[重复]

这个问题在这里已经有答案了给定一个包含列的数据框NaNs 如何转换数据框以删除所有NaN从列中示例数据框 import pandas as pd import numpy as np dataframe from list of lis
如何准备图像分类的训练数据

我是机器学习新手在图像分类方面遇到一些问题使用简单的分类器技术 K 最近邻居我试图区分猫和狗到目前为止我的代码 import pandas as pd import numpy as np import seaborn as sns
pandas 中任意列表的笛卡尔积[重复]

这个问题在这里已经有答案了给定任意数量的列表我想生成一个 pandasDataFrame作为笛卡尔积例如给定 a 1 2 3 b val1 val2 c 100 101 我想最终得到一个DataFrame有柱子a b and c 以
使用欧元符号分隔符将 pandas 写入 csv 时出错

我正在尝试将 Pandas 数据框写入 csv 并以作为分隔符 data to csv file path sep 但是我收到错误 TypeError delimiter must be an 1 character string 我怎
为什么安装成功后无法导入pandas？

我已经使用命令 pip3 4 install pandas 安装了 pandas Successfully installed pandas python dateutil pytz numpy six Cleaning up root h
使用 loc 命令替换值

有一个数据框我需要replace值高于 512 时为 263 因此我首先使用此代码行来过滤索引 df loc df Fare gt 512 Fare astype int 这是结果 258 512 679 512 737 512 123
X 轴刻度标签按年份，X 轴网格线按财政季度

我试图将 x 轴刻度标签设置为年份但将网格线设置为财政季度数据很简单只是一个groupby date count 见下文每个日期都有一个计数我将其绘制为线图 rc rc form Bakken rc tgt oil groupby
映射 2 个数据帧并替换目标数据帧中匹配值的标头

我有一个数据框 df1 SAP Name SAP Class SAP Sec Avi 5 C Rison 6 A Slesh 7 B San 8 C Sud 7 B df2 Name Fi Class Avi 5 Rison 6 Slesh
Python pandas：向我的数据框中添加一列来计算变量

我有一个像这样的数据框 gt org group org1 1 org2 1 org3 2 org4 3 org5 3 org6 3 我想将列 count 添加到 gt 数据帧以计算组的成员数量预期结果如下 org group count
在 Python 中为非唯一列表创建虚拟列

目前我有下一个数据框 import pandas as pd df pd DataFrame ID 1 2 3 4 5 col2 a b c c d e f f b f a c b b a b print df ID c

随机推荐

无法运行模拟器

我已经有一段时间没有编码了所以我启动了 Eclipse 更新了插件和 Eclipse 现在当我尝试启动模拟器时出现异常 Exception in thread AWT EventQueue 0 java lang VerifyError
Xcode 机器人安装链接请求超时

I have been able to get my Xcode bot to integrate successfully and create a ipa file I have an ssl certificate installed
在Python中将不同大小的列表写入列中的csv

我需要将长度不同的列表写入列中的 CSV 文件我目前有 d lists writer csv writer fl for values in zip d writer writerow values 这只有效我怀疑正在发生的事情是它停止
从构建中排除包，但不从 Netbeans 8 的视图中排除包？

如何从构建过程中排除特定的包例如 com domain various 以便它不会出现在最终的 jar 文件中我已经尝试过以下方式右键单击项目 gt 项目属性在树中选择来源单击包括排除 gt 添加排除模式但这也隐藏了 Ne
我们如何从 PHP 将指数格式转换为实际数字

我们如何转换8 64E 14转化为 PHP 的实际值如果还不是浮动体则转换为浮动体并且printf 结果 printf 0f float 8 64E 14 请注意转换为 int 不起作用因为该转换无法理解以科学记数法表示为字符串的
在android中使用freemarker库

我正在尝试在我的项目中使用 freemarker 库但在初始化配置对象时遇到错误我进一步调查了这个问题我发现this关联我尝试应用上面链接中给出的补丁但无法成功应用有人在 Android 中使用过 Freemarker 吗请帮
使用 POCO 上传文件 - SSL 连接意外关闭异常

使用 POCO 将文件上传到 HTTPS url HTTP POST 请求始终返回 SSL 连接意外关闭异常下面是我用于文件分段上传的代码 try Poco URI uri uploadLink const Poco Net Conte
JavaDB 出现端口连接错误。

我是第一次使用 JavaDB 但在运行程序时遇到问题每当我运行它时我都会收到此错误连接到端口 1527 上的服务器本地主机时出错并显示消息连接被拒绝连接我的数据库和代码都设置得很好因为当我在别人的计算机上运行它时它工作正常但
SASS 创建函数来执行最大和最小边距

我找不到这个问题的解决方案我需要在 SASS 中设置一个边距最大值介于 2 个值之间一个是calc 另一个是常规的 px 值它会是这样的 calculation calc 15vw 10px cssClass margin righ
将数据框字符串列拆分为多列

我想获取表单的数据 before data frame attr c 1 30 4 6 type c foo and bar foo and bar 2 attr type 1 1 foo and bar 2 30 foo and bar
如何在 Xamarin.Forms 的 webview 中设置用户代理

我的程序中使用的页面之一需要 UA 包含字符串 weishao 我尝试使用下面的 JavaScript 来更改 UA 但它不起作用 var customUserAgent Mozilla 5 0 Linux Android 10 EBG A
如何使用 MVC.Net 模型绑定“List”列表

我正在尝试创建一个由一系列下拉列表组成的表单所有这些列表都是从数据库加载的我不知道需要多少个下拉列表或者每个下拉列表在编译时有多少个选项如何设置这些字段以允许它们在发布时进行模型绑定下面的每个代码元素都有很多其他复杂性但即使降低
单击按钮时如何关闭框架

我是 Java Swing 新手我正在创建一个带有一些组件的框架单击按钮时我必须关闭框架并打开另一个框架我曾尝试过setVisible false 但它只是隐藏框架而不是关闭它当我使用System exit 0 它关闭了所有框架
在 Facebook Graph API 上使用 POST 请求

我想访问图形 API 来获取我网站不同页面的分享数量我可以使用 GET 方法来执行此操作但我想使用 POST 以便可以在单个请求中发送更多 url 我目前的 GET 实现是 http graph facebook com ids htt
我用CSS（变换）制作了一个动画，当动画结束时它会重置

我有以下结构我的问题是当动画结束时替换掉它只是重新启动我想知道它是否会停止并在悬停时在结尾处等待谢谢这里是代码 http jsfiddle net bd4c5cc7 div class nav ul class list li
Firemonkey：我们可以更新AndroidManifest.template.xml中的targetSdkVersion吗？

我读到 berlin 与 marshmallow 兼容但我看到默认情况下在 AndroidManifest template xml 中我们有
Google 地图 Android API 授权失败 - 此服务在过去几个月内是否发生了变化？

我编写了一个 Xamarin Google Apps V2 应用程序我要部署的设备已安装 Google Play 服务该应用程序已在 API 控制台中正确设置并且几个月前我已经让该应用程序正常工作目前当应用程序部署到我的设备时我
对事件进行计数并在聚合期间插入字符串文字

我收集了大量代表某种事件的文档集合包含不同用户 ID 的事件 id ObjectId 57fd7d00e4b011cafdb90d22 userId 123123123 userType mobile event type clicked
在 for 循环中分配点击处理程序

我有几个 div mydiv1 mydiv2 mydiv3 并希望为它们分配点击处理程序 document ready function for var i 0 i lt 20 i question i click function ale
(pandas) 为什么 .bfill().ffill() 对组的作用与 ffill().bfill() 不同？

我认为我在概念上遗漏了一些基本概念但我无法在文档中找到答案 gt gt gt df pd DataFrame a 1 1 2 2 3 3 b 5 np nan 6 np nan np nan np nan gt gt gt df a b

(pandas) 为什么 .bfill().ffill() 对组的作用与 ffill().bfill() 不同？

(pandas) 为什么 .bfill().ffill() 对组的作用与 ffill().bfill() 不同？ 的相关文章

随机推荐

热门标签

(pandas) 为什么 .bfill().ffill() 对组的作用与 ffill().bfill() 不同？的相关文章