默认情况下plot.rpart
将仅标记因子变量的水平letters
,第一级将是a
, 第二b
等等。例子:
library(rpart)
library(ggplot2) #for the data
data("diamonds")
df <- diamonds[1:2000,]
fit <- rpart(price ~ color + cut + clarity, data = df)
plot(fit)
text(fit)
在我看来,不要自定义此图,而是使用 rpart 绘图专用包:
library(rpart.plot)
prp(fit)
它有许多自定义选项(示例):
prp(fit,
type = 4,
extra = 101,
fallen.leaves = T,
box.palette = colorRampPalette(c("red", "white", "green3"))(10),
round = 2,
branch.lty = 2,
branch.lwd = 1,
space = -1,
varlen = 0,
faclen = 0)
另一种选择是:
library(rattle)
fancyRpartPlot(fit,
type = 4)
它使用prp
内部具有不同的默认值。