Python dfply 包 - 连接

2024-03-11

来自 R 并尝试使用 Python 中的 dfply 包模拟 dplyr。需要一些帮助。

我这里有两个问题,请帮忙。

  1. 如果这些连接列具有不同的名称,我如何连接两个数据集?
  2. 有没有办法加入更多的专栏?根据文档,我只能加入一列。

https://github.com/kieferk/dfply#joining https://github.com/kieferk/dfply#joining

我喜欢 dfply 包,但它缺乏关键功能。感谢您的帮助。或者帮助我使用 Python 中的任何其他包,例如 R dplyr


dfply 包是在 python 中的 Great pandas 包的基础上构建的。它的文档主要用于指导您了解其底层功能。如果你去它的 github 仓库并找到 join.py 文件,你可以看到各种 join 的底层实现依赖于 pandas 的 df.merge 函数。

所以回答你的问题(希望还不算太晚):

  1. 如果这些连接列具有不同的名称,我如何连接两个数据集?

    df>> inner_join(other, by=('A_c1','B_c1'))
    
  2. 有没有办法加入更多的专栏?根据文档,我只能加入一列。

    df>> inner_join(other, by=[('A_c1','B_c1'),('A_c2','B_c2')])
    

我需要补充的一件事是,在 2018 年 10 月撰写本文时,您必须安装该包的开发版本,其中添加了多列联接功能。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python dfply 包 - 连接 的相关文章

随机推荐