抱歉,这是我的第二篇文章 - 如果有什么不明白的地方请告诉我!
我正在尝试删除所有有重复项的行。我已经尝试过keep = False
参数为drop_duplicates()
,它只是没有做正确的事情。
假设我的数据框看起来像这样
|ORDER ID | ITEM CODE |
123 XXX
123 YYY
123 YYY
456 XXX
456 XXX
456 XXX
789 XXX
000 YYY
我希望它看起来像这样:
|ORDER ID | ITEM CODE |
123 XXX
789 XXX
000 YYY
尝试使用
df = df.drop_duplicates(subset='ORDER ID')
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)