我想删除重复项并保留第一个值。想要删除的重复项是 A = 'df' 。这是我的数据
A B C D E
qw 1 3 1 1
er 2 4 2 6
ew 4 8 44 4
df 34 34 34 34
df 2 5 2 2
df 3 3 7 3
df 4 4 7 4
we 2 5 5 2
we 4 4 4 4
df 34 9 34 34
df 3 3 9 3
we 4 7 4 4
qw 2 2 7 2
所以结果将是
A B C D E
qw 1 3 1 1
er 2 4 2 6
ew 4 8 44 4
**df** 34 34 34 34
we 2 5 5 2
we 4 4 4 4
**df** 34 9 34 34
we 4 7 4 4
qw 2 2 7 2
创建助手Series
用于区分连续值A
列,然后过滤boolean indexing http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-indexing与倒立的(~)
由以下创建的布尔掩码duplicated http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.duplicated.html与另一个掩码链接以获取比较值df
:
s = df['A'].ne(df['A'].shift()).cumsum()
df = df[~((df['A'] == 'df') & (s.duplicated()))]
print (df)
A B C D E
0 qw 1 3 1 1
1 er 2 4 2 6
2 ew 4 8 44 4
3 df 34 34 34 34
7 we 2 5 5 2
8 we 4 4 4 4
9 df 34 9 34 34
11 we 4 7 4 4
12 qw 2 2 7 2
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)