给定一个 Pandas 数据框,其中有一些标记的系列,例如Name and Villain.
假设数据框具有以下值:
Name: {'蝙蝠侠', '蝙蝠侠', '蜘蛛侠', '蜘蛛侠', '蜘蛛侠', '蜘蛛侠'}
Villain:{“小丑”、“贝恩”、“绿魔”、“电光”、“毒液”、“章鱼博士”}
总共,上述数据框有 2 个系列(或列),每个系列有 6 个数据点。
现在,基于Name,我想再连接 3 列:名字、姓氏、兴趣爱好到每个数据点。
结果添加了“Bruce;”韦恩;猫女”到名字为蝙蝠侠的每一行。还有“彼得;帕克; MaryJane' 到名称为蜘蛛侠的每一行。
最终结果应该是一个包含 5 列(系列)和 6 行的数据框。
这是一个经典的内连接场景。在pandas
, 使用merge
模块级功能:
In [13]: df1
Out[13]:
Name Villain
0 Batman Joker
1 Batman Bane
2 Spiderman Green Goblin
3 Spiderman Electro
4 Spiderman Venom
5 Spiderman Dr. Octopus
In [14]: df2
Out[14]:
FirstName LastName LoveInterest Name
0 Bruce Wayne Catwoman Batman
1 Peter Parker MaryJane Spiderman
In [15]: pd.DataFrame.merge(df1,df2,on='Name')
Out[15]:
Name Villain FirstName LastName LoveInterest
0 Batman Joker Bruce Wayne Catwoman
1 Batman Bane Bruce Wayne Catwoman
2 Spiderman Green Goblin Peter Parker MaryJane
3 Spiderman Electro Peter Parker MaryJane
4 Spiderman Venom Peter Parker MaryJane
5 Spiderman Dr. Octopus Peter Parker MaryJane
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)