只是期待一个从具有列表值的列中删除空值的解决方案,从某种意义上说,我们已经事先替换了一些字符串,它是列表的字符串表示形式的列。
In df.color
我们只是更换*._Blue
带空字符串:
示例数据框:
df = pd.DataFrame({ 'Bird': ["parrot", "Eagle", "Seagull"], 'color': [ "['Light_Blue','Green','Dark_Blue']", "['Sky_Blue','Black','White', 'Yellow','Gray']", "['White','Jet_Blue','Pink', 'Tan','Brown', 'Purple']"] })
>>> df
Bird color
0 parrot ['Light_Blue','Green','Dark_Blue']
1 Eagle ['Sky_Blue','Black','White', 'Yellow','Gray']
2 Seagull ['White','Jet_Blue','Pink', 'Tan','Brown', 'Pu...
上述 DF 的结果:
>>> df['color'].str.replace(r'\w+_Blue\b', '')
0 ['','Green','']
1 ['','Black','White', 'Yellow','Gray']
2 ['White','','Pink', 'Tan','Brown', 'Purple']
Name: color, dtype: object
通常在 python 中,可以轻松完成如下操作。
>>> lst = ['','Green','']
>>> [x for x in lst if x]
['Green']
恐怕是否可以做下面这样的事情。
df.color.mask(df == ' ')