R - mlr：是否有一种简单的方法可以在嵌套重采样（空间）中获得调整后的支持向量机模型的可变重要性？

2024-01-27

我正在尝试获取可变重要性对于a的所有预测变量（或变量，或特征）调优支持向量机 (SVM)模型使用e1071::svm通过mlr- 封装在R。但我不确定我的评估是否正确。好吧，一开始的想法是：

为了获得诚实调整的 svm 模型，我遵循嵌套重采样教程 https://mlr-org.github.io/mlr-tutorial/devel/html/nested_resampling/index.html使用空间 n 重交叉验证（SpRepCV）在外循环和空间交叉验证（SpCV）在内循环中。作为调整参数gamma and cost在随机网格搜索中进行调整。作为所有预测变量的变量重要性评估，我想使用permutation.importance，即与描述 https://mlr-org.github.io/mlr-tutorial/devel/html/filter_methods/index.html，基本上是特征排列和未排列预测之间的聚合差异。

In mlr，有一些过滤函数 https://mlr-org.github.io/mlr-tutorial/devel/html/feature_selection/index.html获得变量重要性，但同时在基于用户特定选择输入（阈值或变量数量）的模型拟合之前创建子集。 - 但是，我想检索每个拟合模型的所有变量的变量重要性。（我知道学习者作为random forest有重要评价“包容”）

现在，我正在使用mlr::generateFeatureImportanceData https://www.rdocumentation.org/packages/mlr/versions/2.10/topics/generateFeatureImportanceData in the extract-重采样中的参数，看起来真的很尴尬。所以我想问一下，有没有更简单的方法呢？

这里有一个使用的例子mlr-开发版本：

## initialize libraries
# devtools::install_github("mlr-org/mlr) # using developper version of mlr
if(!require("pacman")) install.packages("pacman")
pacman::p_load("mlr", "ParamHelpers", "e1071", "parallelMap")


## create tuning setting
svm.ps <- ParamHelpers::makeParamSet(
  ParamHelpers::makeNumericParam("cost", lower = -12, 
                                 upper = 15, trafo = function(x) 2^x),
  ParamHelpers::makeNumericParam("gamma", lower = -15, 
                                 upper = 6, trafo = function(x) 2^x)
)

## create random search grid, small iteration number for example
ctrl.tune <- mlr::makeTuneControlRandom(maxit = 8) 

# inner resampling loop, "
inner <- mlr::makeResampleDesc("SpCV", iters = 3, predict = "both")

# outer loop, "
outer <- mlr::makeResampleDesc("SpRepCV", folds = 5, reps = 2, predict = "both")


## create learner - Support Vector Machine of the e1071-package
lrn.svm <- mlr::makeLearner("classif.svm", predict.type = "prob")

# ... tuning in inner resampling
lrn.svm.tune <- mlr::makeTuneWrapper(learner = lrn.svm, resampling = inner, 
                                     measures = list(auc),
                                     par.set = svm.ps, control = ctrl.tune, 
                                     show.info = FALSE) 


## create function that calculate variable importance based on permutation 
extractVarImpFunction <- function(x)
{
  list(mlr::generateFeatureImportanceData(task = mlr::makeClassifTask(
                          id = x$task.desc$id, 
                          data = mlr::getTaskData(mlr::spatial.task, subset = x$subset), 
                          target = x$task.desc$target,
                          positive = x$task.desc$positive, 
                          coordinates = mlr::spatial.task$coordinates[x$subset,]),
                        method = "permutation.importance", 
                        learner = mlr::makeLearner(cl = "classif.svm", 
                                                     predict.type = "prob", 
                          cost = x$learner.model$opt.result$x$cost,
                          gamma = x$learner.model$opt.result$x$gamma),
                        measure = list(mlr::auc), nmc = 10
                          )$res
      )
}



## start resampling for getting variable importance of tuned models (outer)

# parallelize tuning
parallelMap::parallelStart(mode = "multicore", level = "mlr.tuneParams", cpus = 8)

res.VarImpTuned <- mlr::resample(learner = lrn.svm.tune, task = mlr::spatial.task, 
                                 extract = extractVarImpFunction,
                                 resampling = outer, measures = list(auc), 
                                 models = TRUE, show.info = TRUE)

parallelMap::parallelStop() # stop parallelization

## get mean auroc decrease
var.imp <- do.call(rbind, lapply(res.VarImpTuned$extract, FUN = function(x){x[[1]]}))
var.imp <- data.frame(AUC_DECR = colMeans(var.imp), Variable = names(colMeans(var.imp)))

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R - mlr：是否有一种简单的方法可以在嵌套重采样（空间）中获得调整后的支持向量机模型的可变重要性？的相关文章

使用格式表过滤数据框

样本数据修改自formattablegithub 文档 df lt data frame id 1 10 name c Bob Ashley James David Jenny Hans Leo John Emily Lee age c
在 R data.table 中计算时间增量

我有一个篮球运动员数据的数据表其中包括每场比赛和多名球员的比赛日期我想创建一个列来计算自上一场比赛以来的天数我在 R 中使用 data table 包 PLAYERID GAME DATE 1 2989 2014 01 1 2 298
如何扩展 ggplot y 轴限制以包含最大值

通常在图中 Y 轴值标签会在绘制的最大值下方被截断 For example library tidyverse mtcars gt ggplot aes x mpg y hp geom point 我知道scale y continous
计算横截面积作为高度的函数

我试图弄清楚如何计算不同水位的河流横截面的充满水的面积对于横截面我有 5 m 宽河流上每 25 cm 的深度并且可以根据之前很好回答的问题来计算面积计算不同高度的横截面积 https stackoverflow com questio
data.table 相当于 dplyr::filter_at

考虑数据 library data table library magrittr vec1 lt c Iron Copper vec2 lt c Defective Passed Error set seed 123 a1 lt sampl
keras 模型拟合：ValueError：无法找到可以处理输入的数据适配器：，

我正在构建一个简单的 CNN 模型用于多类分类训练和测试数据位于data path根据所需的类子目录flow from directory的函数ImageDataGenerator 这是我根据数据构建和训练模型的代码 from tenso
将 SAS sas7bdat 数据读入 R

R 有哪些选项可以读取本机 SAS 格式的文件 sas7bdat 进入R The NCES 共同核心 https nces ed gov ccd pubschuniv asp例如包含以此格式保存的大量数据文件存储库为了具体起见让我们集
如何使用 R 更改 png 文件的大小

我正在绘制 png 文件并获取一张小图片你知道一些可以改变 png 图大小的简单代码吗我的地块太高太薄另外有没有办法改变情节的分辨率谢谢伊格尔 png png filename Rplot 03d png width 480 h
使用 r 以周为单位对数据进行分组

I have a CVS file which has data for different countries at different weeks of this year I want to create a summary data
R：从 Github 安装包时出现编码问题

我正在尝试安装dcStockR https github com yutannihilation dcStockR来自 Github 的包这是一个htmlwidgets http www htmlwidgets org 周围的包装纸dc
将 stat_smooth 添加到 ggplot2 中的仅 1 个方面

我有一些数据在某个因素的某个水平上存在显着的相关性在另一个层面上则没有并排绘制这些图很简单使用 stat smooth 向它们添加一行也很简单但是我不希望线条或其填充显示在两个面之一中有没有一种简单的方法可以做到这一点
R闪亮：基于checkboxgroupinput的子集数据

我想根据复选框输入动态选择的列对数据进行子集有什么方法可以使我的输入文件在我的代码中全局可用以便可以方便地进行进一步的操作以下是我的代码 Server R library shiny shinyServer function inpu
与heroku配合使用的统计引擎

我有一个 Heroku Rails 应用程序需要处理一些重要的数字并且我需要使用像 R 这样的统计库更糟糕的是 MatLab 我正在寻找以下任何问题的答案是否有不需要二进制文件的功能齐全的统计包 GEM 是否可以将 R 二进制文件作
如何使用 Rcpp 将 C 结构从 C 库公开到 R

我正在尝试将 C 结构从 C 库公开到 R 中例如 struct A int flag 库提供 API 来构造和销毁是很常见的A A initA void freeA A a 感谢RCPP MODULE 很容易暴露它而不考虑析构函数 in
如何在 R 中创建纯 ascii 表作为输出，类似于 MySQL 风格？

我正在尝试为 R 找到一个输出的函数data frameMySQL 风格的 ascii 表中的对象如下 id var1 var2 1 asdf g 2 asdf h 3 asdf j 有这样的功能吗至少有两个工具可以做到这一点 csvfi
省略 RColorBrewer 调色板上较亮的颜色以在 ggplot2 中使用

我想在 RColorBrewer 的 Oranges 调色板中使用较深的颜色以便在我的 ggplot 条形图中使用然而我却做不到帮助下面是示例代码 my palette brewer pal n 9 Oranges 4 9 Bar
do.call 的 envir 选项如何工作？

的文档do call states If quote is FALSE 默认值然后对参数进行求值在调用环境中而不是在envir 这句话向我暗示当quote FALSE 指定envir没有什么区别然而事实并非如此事实上我遇到过需
包什么时候需要为它自己的对象使用 :::

考虑这个 R 包有两个函数一个是导出函数另一个是内部函数 hello R export hello lt function internalFunctions hello internal 你好内部 R hello internal
ggplot2以限制为中心的多边形世界地图给出了有趣的边缘

使用下面的代码我生成了一张以华盛顿特区为中心的地图解决方案基于科斯克的解决方案在这里 https stackoverflow com questions 10620862 use different center than the pri
二部图匹配以匹配两个集合

我是新手igraphR 中的包我有两套A and B 每个都有N顶点 A1 A2 AN and B1 B2 BN 每个元素之间都有一个边缘A对每一个元素B 我有一个函数fWgt Ai Bj 返回之间的边的权重Ai and Bj 我一直在尝

随机推荐

ANT - 无法加载依赖类 com/jcraft/jsch/Logger

我的 Ant 脚本有问题我需要将文件复制到 Linux 服务器
go 中 ioutil.ReadAll 的替代方案？

对于我正在制作的程序此函数作为 for 循环中的 goroutine 运行具体取决于传入的 url 数量没有设定数量 func makeRequest url string ch chan lt string errors map s
当两个超类具有同名但签名不同的成员函数时，存在歧义

struct A void f int x struct B template
安装了Visual Studio 2010 SP1，仍然不支持CSS3和HTML5

我已从以下位置下载了最新版本的 Visual Studio 2010 Service Pack 1 here http www microsoft com download en details aspx id 23691 然而在我提取文
如何在分解时间序列图中自定义标题、轴标签等

我相当熟悉通过编写自己的 x 轴标签或主标题来修改绘图的常用方法但在绘制时间序列分解的结果时我无法自定义输出例如 library TTR t lt ts co2 frequency 12 start 1 deltat 1 12 td
测试小程序的最佳机制是什么？

我正在尝试有效地为小程序构建一个功能测试套件并且我正在尝试为其找到一个好的框架过去当我想设计一个测试套件来对应用程序进行功能测试和负载测试时它始终是基于 Web 的应用程序或者至少是某种基于服务的应用程序并且我已经使用grind
如何在http get请求中设置标头？

我正在 Go 中执行一个简单的 http GET client http Client req http NewRequest GET url nil res client Do req 但我找不到自定义请求标头的方法doc http go
如何获取维基数据上所有电影的列表？

我正在使用 Freebase 为我的网站获取所有电影但它很快就会被关闭所以我在寻找另一个免费的电影数据库并发现了维基数据说实话如何查询所有电影太复杂了所以我想你们可以帮助我获取维基数据中的所有电影将来我还想加入电视节目和连续剧
jQuery - 对数组进行排序？

我使用 Ajax 获取一些 XML 然后用结果填充表单上的一些字段表单上有一个数字字段我想按该数字对结果进行排序从高到低的在前我将如何在 jQuery 中做到这一点我的js函数代码目前是 function linkCounts w
运行时动态绑定和类继承之间的区别

我试图澄清动态语言 Python Ruby 和静态类型语言 java C 中运行时动态绑定和类继承的概念我不确定我是对还是错在 Python 和 Ruby 等动态语言中运行时动态绑定是作为鸭子类型实现的当解释器检查对象的类型时它检
新 Chrome 打包应用程序的最小/最大按钮在哪里？

我正在使用 Chrome 的开发通道 v23 并且正在使用新的Chrome 打包应用程序 http developer chrome com dev apps about apps html平台新平台的目的之一是将打包应用程序从浏览器中
卷积神经网络如何处理通道

我已经浏览了很多关于 CNN 通常处理多个通道例如 RGB 图像中的 3 个的方式的解释但我仍然不知所措当将 5x5x3 滤镜例如应用于 RGB 图像的补丁时会发生什么exactly发生实际上是每个通道分别发生 3 个不同的
JAXB 继承，解组到编组类的子类

我正在使用 JAXB 来读取和写入 XML 我想要的是使用基本 JAXB 类进行编组并使用继承的 JAXB 类进行解组这是为了允许发送方 Java 应用程序将 XML 发送到另一个接收方 Java 应用程序发送者和接收者将共享一个公共
带有前置零的“单位相关”CSS 属性值是否等同于相应的“无前置零”值？

我正在扫描一些样式表时发现其中使用了linear gradient with rgba 颜色停止点其中rgba数字使用了多个实例0而不是只有一个0 background image linear gradient to top left
外行人对 JavaScript 为什么有奇怪的浮动数学的解释 – IEEE 754 标准 [重复]

这个问题在这里已经有答案了当我对浮点数进行数学运算时我永远无法准确理解 JavaScript 到底发生了什么我一直非常害怕使用小数以至于我尽可能避免使用它们然而如果我知道 IEEE 754 标准的幕后发生了什么那么我就能够预测
NgbDatePicker - 如何将 longDate 字符串绑定到 [ngModel]？

我试图将格式化为 longDate 字符串的日期绑定到 ngbDatePicker 中的 ngModel 输入值例如当用户选择日期时我想显示 2017年1月15日而不是 2017 01 15 我知道 ngModel 仅绑定到 Ngb
用于渲染视频的 2d 上下文与 WebGL

我目前正在使用CanvasRenderingContext2D drawImage 将来自 RTC 媒体流的视频绘制到画布上不幸的是这会占用大量的 CPU 资源使用以下方法执行此操作会性能更高吗WebGLRenderingContex
我的自定义 UITableViewCell （使用故事板创建）内的对象为零

我通过以下步骤在我的 iPhone 应用程序中创建了一个自定义表格视图单元格在我的故事板中我创建了一个示例单元格将其拖入UILabel and a UIImageView 添加了新文件我将其作为其子类UITableViewCell
仅当目标不存在时，使用 Ansible 在远程系统上移动文件

我正在尝试编写一个 Ansible 角色来移动远程系统上的多个文件我找到了一个堆栈溢出帖子 https stackoverflow com a 24165405 1174185关于如何做到这一点本质上是说只需使用带有 mv 的命令模块
R - mlr：是否有一种简单的方法可以在嵌套重采样（空间）中获得调整后的支持向量机模型的可变重要性？

我正在尝试获取可变重要性对于a的所有预测变量或变量或特征调优支持向量机 SVM 模型使用e1071 svm通过mlr 封装在R 但我不确定我的评估是否正确好吧一开始的想法是为了获得诚实调整的 svm 模型我遵循嵌套重采样教程

R - mlr：是否有一种简单的方法可以在嵌套重采样（空间）中获得调整后的支持向量机模型的可变重要性？

R - mlr：是否有一种简单的方法可以在嵌套重采样（空间）中获得调整后的支持向量机模型的可变重要性？ 的相关文章

随机推荐

热门标签

R - mlr：是否有一种简单的方法可以在嵌套重采样（空间）中获得调整后的支持向量机模型的可变重要性？的相关文章