我有一个熊猫查找表,看起来像这样
Grade Lower_Boundary Upper_Boundary
1 -110 -96
2 -96 -91
3 -91 -85
4 -85 -81
5 -81 -77
6 -77 -72
7 -72 -68
8 -68 -63
9 -63 -58
10 -58 -54
11 -54 -50
12 -50 -46
13 -46 -42
14 -42 -38
15 -38 -34
16 -34 -28
17 -28 -18
18 -18 -11
19 -11 -11
20 -11 -9
我有另一个看起来包含分数的熊猫数据框。我想通过查找查找表将“等级”分配给分数列。因此,根据分数落在下限和上限的区间,应从查找表中的该行分配等级。有没有一种方法可以在不输入一堆 if then else 语句的情况下做到这一点?我只想到excel的索引匹配。
Score Grade
-75 6
-75 6
-60 9
-66 8
-66 8
-98 1
-60 9
-82 4
-70 7
-60 9
-60 9
-60 9
-56 10
-70 7
-70 7
-70 7
-66 8
-56 10
-66 8
-66 8
一个单行解决方案(我称你的查找表lookup
):
df['Score'].apply(lambda score: lookup['Grade'][(lookup['Lower_Boundary'] <= score) & (lookup['Upper_Boundary'] > score)].values[0])
解释:
对于给定的分数,以下是查找成绩的方法:
score = -75
match = (lookup['Lower_Boundary'] <= score) & (lookup['Upper_Boundary'] > score)
grade = lookup['Grade'][match]
这将返回一系列长度为 1 的序列。您可以通过以下方式获取其值:
grade.values[0]
你需要做的就是apply
以上到分数栏。如果您想要单行,请使用lambda
功能:
df['Score'].apply(lambda score: lookup['Grade'][(lookup['Lower_Boundary'] <= score) & (lookup['Upper_Boundary'] > score)].values[0])
否则以下内容会更具可读性:
def lookup_grade(score):
match = (lookup['Lower_Boundary'] <= score) & (lookup['Upper_Boundary'] > score)
grade = lookup['Grade'][match]
return grade.values[0]
df['Score'].apply(lookup_grade)
这种方法还可以更轻松地处理未找到匹配项的情况。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)