我刚刚开始使用 R,我不确定如何将我的数据集与以下示例代码合并:
sample(x, size, replace = FALSE, prob = NULL)
我有一个数据集,需要将其放入训练集 (75%) 和测试集 (25%) 中。
我不确定应该在 x 和 size 中输入哪些信息?
x 是数据集文件,大小是我有多少个样本?
有多种方法可以实现数据分区。要获得更完整的方法,请查看createDataPartition
函数在caret
包裹。
这是一个简单的例子:
data(mtcars)
## 75% of the sample size
smp_size <- floor(0.75 * nrow(mtcars))
## set the seed to make your partition reproducible
set.seed(123)
train_ind <- sample(seq_len(nrow(mtcars)), size = smp_size)
train <- mtcars[train_ind, ]
test <- mtcars[-train_ind, ]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)