pandas，根据某些列值和 NAN 组合行

2024-04-20

所以我有一个 pandas 数据框，如下所示：

id_1    id_2    value1    value2
1       2       100       NAN
1       2       NAN       101
10      20      200       NAN    
10      20      NAN       202
10      2       345       345

我想要一个像这样的数据框：

id_1    id_2    value1    value2
1       2       100       101
10      20      200       202    
a       b       c         d

基本上，如果两个 ID 列匹配，那么肯定会有一个value-nan vs nan-value情况，我想通过替换来合并行nans.

pandas 有这方面的实用工具吗？它并没有完全堆积或融化。也许可以旋转，但我需要两个不定值。我想保留任何不具有两个 indeces 匹配的行。

我认为没有一个命令可以满足您的目的，并且有许多不同的方法可以实现此目的。但是，您可以使用melt and pivot彼此之后：

id_vars = ["id_1", "id_2"]
melted = df.melt(id_vars=id_vars).dropna()
pivoted = melted.pivot_table(index=id_vars, columns="variable", values="value")

print(pivoted)

    variable    value1  value2
id_1    id_2        
1       2       100.0   101.0
10      2       345.0   345.0
        20      200.0   202.0

但是，上述解决方案比以下两个解决方案慢。

首先，您可以使用前向填充ffill填充 NaN 和last获取包含所有有效值的最后一行ffill:

ids = ["id_1", "id_2"]

df.groupby(ids).ffill()\
  .groupby(ids).last()\
  .reset_index()

    id_1    id_2    value1  value2
0   1       2       100     101
1   10      2       345     345
2   10      20      200     202

其次，不要分组两次（因为ffill返回一个数据框），您可以使用自定义apply其结果相同：

def collapse(x):
    return x.ffill().iloc[-1, 2:]

df.groupby(ids).apply(collapse).reset_index()

即使我们在这里使用 apply，它也是最快的解决方案（至少对于您提供的虚拟数据而言 - 对于较大的数据集，它可能会以不同的方式扩展）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

pandas，根据某些列值和 NAN 组合行的相关文章

pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
Python逻辑运算符优先级[重复]

这个问题在这里已经有答案了哪个运算符优先4 gt 5 or 3 lt 4 and 9 gt 8 这会被评估为真还是假我知道该声明3 gt 4 or 2 lt 3 and 9 gt 10 显然应该评估为 false 但我不太确定 pyth
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
从 python 发起 SSH 隧道时出现问题

目标是在卫星服务器和集中式注册数据库之间建立 n 个 ssh 隧道我已经在我的服务器之间设置了公钥身份验证因此它们只需直接登录而无需密码提示怎么办我试过帕拉米科它看起来不错但仅仅建立一个基本的隧道就变得相当复杂尽管代码示例将受
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
如何为每个屏幕添加自己的 .py 和 .kv 文件？

我想为每个屏幕都有一个单独的 py 和 kv 文件应通过 main py main kv 中的 ScreenManager 选择屏幕设计应从文件 screen X kv 加载类等应从文件 screen X py 加载 Screens
无法在前端使用 JavaScript Fetch API 将文件上传到 FastAPI 后端

我正在尝试弄清楚如何将图像发送到我的 API 并验证生成的token那是在header的请求到目前为止这就是我所处的位置 app post endreProfilbilde async def endreProfilbilde requ
字典和数组作为类变量与实例变量

这是赚取积分的简单方法请解释以下内容 class C a b 0 c def init self self x def d self k v self x k v self a k v self b v self c append v d

随机推荐

计算 3D 中两点之间的距离

我的任务是创建主类在其中将任意点的值初始化为 0 0 0 并且能够单独访问和改变所有三个值 x y z 为此我使用了 getter 和 setter 我的下一个任务是在我的主类中创建一个方法我将其称为 distanceTo 来计算两点
（更改）Angular2 中的事件钩子

我知道改变 event Binding在 angular2 中但我很惊讶为什么我的代码没有按预期工作我的代码在这里 http plnkr co edit 9pSWSeqBc5oaSAtsfwNY p preview http plnk
为什么 Bootstrap 3 Collapse 与双击时的复选框状态不同步？

根据这个问题当复选框被选中时 Twitter Bootstrap 3 崩溃 https stackoverflow com questions 22480524 twitter bootstrap 3 collapse when chec
$scope.$on 在角度服务中的 $rootScope.$broadcast 之后不触发

这可能是重复的问题但我找到的解决此问题的方法在我的情况下不起作用这就是我发布该问题的原因我已经关注了service appRoot service MyService function rootScope var Messenger
Win32 API C++ 菜单栏

我正在尝试学习一些基本的 win32 api 我看到将项目添加到菜单栏教程中提到使用类似以下内容 hMenubar CreateMenu hMenu CreateMenu AppendMenuW hMenu MF STRING IDM FI
Vaadin 更改默认会话过期通知？

瓦丁7 6 2 如何更改默认的会话过期通知消息和通知类型要更改会话过期消息您需要创建自己的SystemMessagesProvider 您在其中定义它例如在 Servlet 部署中您可以执行以下操作 WebServlet url
Hibernate 3.6：SQL 方言中的 registerFunction 不起作用

我放弃并询问社区在我的项目中我使用 Hibernate 3 6 4 Final 和自定义 sql 方言 public class ServiceAppMySQL5InnoDBDialect extends MySQL5InnoDBDia
Bash 脚本使用 FreeTDS 建立连接、交互、不退出（只是挂起）

我在脚本中使用 FreeTDS 将记录插入 MSSQL 数据库这USEandINSERT命令有效但是exit命令没有它挂起我尝试过重定向stdoutbutcat抱怨我想我会用Expect http www nist gov mel
未能向 master 发送加入请求

我使用的是elasticsearch版本1 3 0 重启数据节点后无法检测到主节点我收到错误failed to send join request to master 在错误日志中 app101 dGRBqTFTQfae76IFCjsM
strtolower() 用于 unicode/多字节字符串

我的页面中有一些非英语外语文本但是当我尝试将其变为小写时它的字符会转换为包含问号的黑色菱形 a echo b strtolower a returns 我已在元标记中设置了字符集但这并没有解决问题我该怎么做才能将字符串转换为小写而
vim 中项目列表的智能硬包装

我喜欢 vim 而且我真的很喜欢在写文字时将它们硬包装起来 Tim Pope 的 markdown 插件很棒并且构建得当我尝试硬包装项目列表时它可以正确完成工作好吧这就是我所说的正确完成工作的意思 here I write a lon
iPhone 就像在 Silverlight ListBox 上滚动一样

我需要一个具有类似 iPhone 功能的 Silverlight 列表框也就是动画滚动点击拖动滚动在鼠标释放事件之后滚动将根据拖动的速度继续进行一段时间我搜索过没有找到提供此功能的控件供应商那么问题是我应该如何构建它我需
如何使用 rvest R 从谷歌新闻中获取头条新闻？

我想使用 R 中的 rvest 从谷歌新闻中获取头条新闻到目前为止我已经做到了这一点 library rvest url read html https www google com search hl en tbm nws authus
根据其他字段 javax.validation 的条件进行选项的字段验证

如果存在另一个字段我需要执行字段验证它可以是值之一 import javax validation class Person NotBlank private String name private Long groupId Valid
Windows 在 PATH 中搜索可执行文件的相对顺序是什么？

如果我有a com a cmd a bat and a exe我的文件中的 PATH 如果我只调用该命令 Windows 会选择哪一个a 这是微软官方指定的吗我只是想包裹我的gvim exe可执行文件 n 但是我的gvim bat似乎既不
Elasticsearch 过滤器/计算嵌套字段

我有带有嵌套字段的文档如下所示 results id 1234 name asdf id 5678 name jkl ip 1 2 3 4 嵌套字段的映射如下所示 results type nested properties id typ
PDO 最后插入 ID 总是正确的吗？

我有以下代码我想问的是这个想象一下当两个人同时加载页面时是否存在其他人的查询在检索到最后一个 ID 之前插入从而混淆 ID 的危险不这种情况是不可能的方法 db gt lastInsertId 返回此数据库连接的最后插入的
将一个 XML 包含在另一个 XML 中并使用 python 解析它

我想将一个 XML 文件包含在另一个 XML 文件中并用 python 解析它我正在尝试通过 Xinclude 来实现它有一个 file1 xml 看起来像
捕获 Exception 对象是否安全

我使用依赖于异常的 Java 库简化代码如下 try val eventTime eventTimeString as Date catch case e Exception gt logger error s Can t parse e
pandas，根据某些列值和 NAN 组合行

所以我有一个 pandas 数据框如下所示 id 1 id 2 value1 value2 1 2 100 NAN 1 2 NAN 101 10 20 200 NAN 10 20 NAN 202 10 2 345 345 我想要一个像这样

pandas，根据某些列值和 NAN 组合行

pandas，根据某些列值和 NAN 组合行 的相关文章

随机推荐

热门标签

pandas，根据某些列值和 NAN 组合行的相关文章