我有这个数据框:
Receipt Description Card Member Account Cost
200a apple adam 08203928 $2
20022a pear bob 08203228 $7
202a orange alice 0820321228 $8
我想检查是否有一个值description
列包含特定的子字符串。例如,第一行(adam)有“apple”的描述。我想检查子字符串“appl”是否存在于此description
column.
如果是这样,我想创建一个名为的新列Data
然后将存储该值need more apples
。如果没有找到“apple”的子字符串,我不想在此列中存储任何内容。
这就是预期的新数据框的样子。
Receipt Description Card Member Account Cost **Data**
200a apple adam 08203928 $2 need more apples
20022a pear bob 08203228 $7
202a orange alice 0820321228 $8
你可以试试这个:
示例1:
df["**Data**"] = df["Description"].map(lambda x: "apple containes" if "appl" in x else '')
实施例2
如果您要检查每个水果的映射,那么您可以像这样创建
desc = {"appl":"need more apples","pear": "need more pear"}
def check_desc(x):
for key in desc:
if key.lower() in x.lower():
return desc[key]
return ''
df["**Data**"] = df["Description"].map(lambda x: check_desc(x))
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)