假设有100个样本,其中正样本70,负样本30,这个是由数据集本身决定的,机器要做的就是判别这100个样本中哪几个样本是正样本,哪几个样本是负样本。
现在机器做出了预测:
机器把原样本中70个正样本中的50个判为正,记为TP=50(True Positive,机器判断正确的正样本);
机器把原样本中70个正样本中的20个判为负,记为FN=50(False Negative,机器判断错误,认为该样本是负样本,但它是正样本。可以理解为“机器错误的认为它是负样本,负负得正所以它本来的面目应该是正样本”);
机器把原样本中30个负样本中的10个判为正,记为FP=10(False Positive,机器判断错误,认为该样本是正样本,但它是负样本。可以理解为“机器错误的认为它是正样本,那它本来的面目是负样本”);
机器把原样本中30个负样本中的20个判为负,记为TN=20(True Negative,机器判断正确的负样本);
a
c
c
u
r
a
c
y
=
T
P
T
P
+
F
P
accuracy=\frac{TP}{TP + FP}
accuracy=TP+FPTP
r
e
c
a
l
l
=
T
P
T
P
+
F
N
recall = \frac{TP}{TP + FN}
recall=TP+FNTP
从以上公式我们可以看出,accuracy是相对于机器判断的正样本情况来的,TP+FP等于机器判断的60个正样本;recall是相对于原样本正样本情况来的,TP+FN等于原样本中正样本数量。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)