我想知道是否可以在预定义的网格中使用随机搜索。例如,我的网格有alpha
and lambda
for glmnet
方法。alpha
介于 0 和 1 之间,并且lambda
介于-10到10之间。我想使用随机搜索5次来随机尝试这个范围内的点。我为网格搜索编写了以下代码,它工作正常,但我无法修改它以进行有限的随机搜索。
rand_ctrl <- trainControl(method = "repeatedcv", repeats = 5,
search = "random")
grid <- expand.grid(alpha=seq(0,1,0.1),lambda=seq(-10,10,1)) # I think this should be modified
rand_search <- train(Response ~ ., data = train_dat,
method = "glmnet",
## Create 20 random parameter values
metric = "RMSE",
tuneLength = 5,
preProc = c("scale"),
tuneGrid = grid,
trControl = rand_ctrl)
一种方法是定义一个网格并使用sample
选择几个随机行:
set.seed(1)
samp <- sample(1:nrow(grid), 5)
grid[samp,]
#output
alpha lambda
62 0.6 -5
86 0.8 -3
132 1.0 1
208 0.9 8
46 0.1 -6
然后使用这个子集作为tuneGrid
争论
另一种方法是使用runif
它从由下限和上限定义的均匀分布生成随机数:
set.seed(1)
data.frame(alpha = runif(5, 0 , 1),
lambda = runif(5, -10, 10))
#output
alpha lambda
1 0.2655087 7.967794
2 0.3721239 8.893505
3 0.5728534 3.215956
4 0.9082078 2.582281
5 0.2016819 -8.764275
并将其提供为tuneGrid
争论。
第二种方法不是从网格中选取随机元素,而是在定义的最小值和最大值之间选取随机数。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)