我试图弄清楚是否有一种方法可以获取用于何时的间隔ntile()
用来。
我有一个样本,我想将其用作获取较大样本的百分位值的基础,并且我希望找到一种方法来获取使用时的间隔值ntile()
.
对此的任何启发将不胜感激。
我真的很想把这个作为评论,但我仍然无法评论。
如何使用分位数来生成区间,如下所示:
# create fake data; 100 samples randomly picked from 1 to 500
fakeData <- runif(100, 1, 500)
# create percentile values; tweak the probs to specify the quantile that you want
x <- quantile(fakeData, probs = seq(0, 1, length.out = 100))
然后,您可以将该间隔应用于更大的数据集(即使用 cut,这可能会给 dplyr 的 ntile 带来相同的结果)。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)