我有一个名为 mpg 的数据集。我有兴趣绘制箱线图(上面有点)来查看变量 drv(传动系统类型)和 cty(每加仑城市英里)之间的关系。
下面是我的代码:ggplot(data=mpg,mapping=aes(x=drv,y=cty))+geom_boxplot(outlier.shape = NA)+geom_jitter()
有没有办法从 geom_jitter() 中排除异常值?
您可以隐藏 geom_boxplot 的异常值outlier.shape=NA
。对于geom_jitter,您可以使用透明度来隐藏异常值,但需要首先定义这些异常值。
mpg %>%
group_by(drv) %>%
mutate(cty.show = as.numeric( # so ggplot doesn't complain about alpha being discrete
between(cty,
quantile(cty)[2] - 1.5*IQR(cty),
quantile(cty)[4] + 1.5*IQR(cty)))) %>%
ggplot(aes(drv, cty)) +
geom_boxplot(outlier.shape = NA) +
geom_jitter(aes(alpha=cty.show), show.legend=FALSE) +
scale_alpha_continuous(range = c(0, 1)) # otherwise outliers only partially transparent.
对于第二个图,如果需要,可以调整 y 限制。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)