我在网上搜索了很多,但没有找到任何关于 R 中 C5.0 函数的“成本”参数的有用描述。在 C5.0 R 手册中,它只是说“与可能的错误。矩阵应有 C 列和行,其中 C 是类别级别的数量”。它没有告诉我是否row or the column是模型的预测结果。
有人可以帮忙吗?
以下是C5.0(版本0.1.0-15)帮助页面的引用:
成本矩阵应为 CxC,其中 C 是类别数。
对角线元素被忽略。列应与真实情况相对应
类和行是预测的类。例如,如果 C = 3
红、蓝、绿类(按顺序),(2,3) 中的值为 5
矩阵的元素表示预测的成本
蓝色的绿色样本是通常值(一)的五倍。
按照帮助页面中的示例,这将是一个成本矩阵:
cost.matrix <- matrix(c(
NA, 2, 4,
3, NA, 5,
7, 1, NA
), 3, 3, byrow=TRUE)
rownames(cost.matrix) <- colnames(cost.matrix) <- c("Red", "Blue", "Green")
cost.matrix
Red Blue Green
Red NA 2 4
Blue 3 NA 5
Green 7 1 NA
这意味着以下内容:
- 将红色样本预测为蓝色是通常值的 3 倍(一)
- 将红色样本预测为绿色是平常值的 7 倍
- 将蓝色样本预测为红色是通常值的 2 倍
- 将蓝色样本预测为绿色是通常值的 1 倍
- 将绿色样本预测为红色是通常值的 4 倍
- 将绿色样本预测为蓝色是通常值的 5 倍
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)