预先感谢您的阅读。
我有一个数据框:
df = pd.DataFrame({'Words':[{'Sec': ['level']},{'Sec': ['levels']},{'Sec': ['level']},{'Und': ['ba ']},{'Pro': ['conf'],'ProAbb': ['cth']}],'Conflict':[None,None,None,None,'Match Conflict']})
Conflict Words
0 None {u'Sec': [u'level']}
1 None {u'Sec': [u'levels']}
2 None {u'Sec': [u'level']}
3 None {u'Und': [u'ba ']}
4 Match Conflict {u'ProAbb': [u'cth'], u'Pro': [u'conf']}
我想应用一个例程,对于其中的每个元素'Words'
,检查是否Conflict = 'Match Conflict'
如果是这样,则对其中的值应用一些函数'Words'
.
例如,使用以下占位符函数:
def func(x):
x = x.clear()
return x
I write:
df['Words'] = df[df['Conflict'] == 'Match Conflict']['Words'].apply(lambda x: func(x))
我的预期输出是:
Conflict Words
0 None {u'Sec': [u'level']}
1 None {u'Sec': [u'levels']}
2 None {u'Sec': [u'level']}
3 None {u'Und': [u'ba ']}
4 Match Conflict None
相反,我得到:
Conflict Words
0 None NaN
1 None NaN
2 None NaN
3 None NaN
4 Match Conflict None
该函数仅适用于具有Conflict = 'Match Conflict'
但以牺牲其他行为代价(这些行都变成了None
。我认为其他行将保持不变;显然情况并非如此。
你能解释一下我如何在不删除所有信息的情况下实现我想要的输出吗?Words
柱子?我相信答案可能在于np.where
但我没能完成这项工作,这是我能想到的最好的办法。
非常感谢任何帮助。谢谢。