自动比较小鼠 glm.mids 的嵌套模型

2024-01-20

我有一个来自 R 的多重插补模型mice包中有很多因子变量。例如：

library(mice)
library(Hmisc)

# turn all the variables into factors
fake = nhanes
fake$age = as.factor(nhanes$age)
fake$bmi = cut2(nhanes$bmi, g=3) 
fake$chl = cut2(nhanes$chl, g=3) 

head(fake)
  age         bmi hyp       chl
1   1        <NA>  NA      <NA>
2   2 [20.4,25.5)   1 [187,206)
3   1        <NA>   1 [187,206)
4   3        <NA>  NA      <NA>
5   1 [20.4,25.5)   1 [113,187)
6   3        <NA>  NA [113,187)

imput = mice(nhanes)

# big model
fit1 = glm.mids((hyp==2) ~ age + bmi + chl, data=imput, family = binomial)

我想测试每个的重要性entire通过针对每次删除一个变量的每个可能的嵌套模型测试完整模型，来影响模型中的变量（不是每个级别的指示变量）。手动，我可以这样做：

# small model (no chl)
fit2 = glm.mids((hyp==2) ~ age + bmi, data=imput, family = binomial)

# extract p-value from pool.compare
pool.compare(fit1, fit2)$pvalue

如何对模型中的所有因子变量自动执行此操作？非常有用的功能drop1有人向我建议上一个问题 https://stackoverflow.com/questions/26618951/automatically-use-lrt-to-assess-significance-of-entire-factor-variable-- 现在我想做一些完全一样的事情，除了mice case.

可能有用的注释：一个烦人的功能pool.compare是它似乎希望将较大模型中的“额外”变量放置在与较小模型共享的变量之后。

在按照所需的顺序排列预测变量的不同组合后，您可以使用循环来迭代它们pool.compare.

所以用你的fake上面的数据 - 调整类别数量

library(mice)
library(Hmisc)
# turn all the variables into factors
# turn all the variables into factors
fake <- nhanes
fake$age <- as.factor(nhanes$age)
fake$bmi <- cut2(nhanes$bmi, g=2) 
fake$chl <- cut2(nhanes$chl, g=2) 

# Impute
imput <- mice(fake, seed=1)

# Create models 
# - reduced models with one variable removed
# - full models with extra variables at end of expression
vars <- c("age", "bmi", "chl")

red <- combn(vars, length(vars)-1 , simplify=FALSE)
diffs <- lapply(red, function(i) setdiff(vars, i) )
(full <- lapply(1:length(red), function(i) 
                            paste(c(red[[i]], diffs[[i]]), collapse=" + ")))
#[[1]]
#[1] "age + bmi + chl"

#[[2]]
#[1] "age + chl + bmi"

#[[3]]
#[1] "bmi + chl + age"

(red <- combn(vars, length(vars)-1 , FUN=paste, collapse=" + "))
#[1] "age + bmi" "age + chl" "bmi + chl"

这些模型现在已按正确的顺序传递给glm称呼。我也更换过glm.mids方法，因为它已被替换为with.mids - see ?glm.mids

out <- vector("list", length(red))

for( i in 1:length(red)) {

  redMod <-  with(imput, 
               glm(formula(paste("(hyp==2) ~ ", red[[i]])), family = binomial))

  fullMod <-  with(imput, 
               glm(formula(paste("(hyp==2) ~ ", full[[i]])), family = binomial))

  out[[i]] <- list(predictors = diffs[[i]], 
                   pval = c(pool.compare(fullMod, redMod)$pvalue))
   }

do.call(rbind.data.frame, out)
#    predictors      pval
#2         chl 0.9976629
#21        bmi 0.9985028
#3         age 0.9815831

# Check manually by leaving out chl
mod1 <- with(imput, glm((hyp==2) ~ age + bmi + chl , family = binomial))
mod2 <- with(imput, glm((hyp==2) ~ age + bmi , family = binomial))
pool.compare(mod1, mod2)$pvalue
#         [,1]
#[1,] 0.9976629

使用此数据集您会收到很多警告

EDIT

你可以将其包装在一个函数中

impGlmDrop1 <- function(vars, outcome, Data=imput,  Family="binomial") 
{

  red <- combn(vars, length(vars)-1 , simplify=FALSE)
  diffs <- lapply(red, function(i) setdiff(vars, i))
  full <- lapply(1:length(red), function(i) 
                      paste(c(red[[i]], diffs[[i]]), collapse=" + "))
  red <- combn(vars, length(vars)-1 , FUN=paste, collapse=" + ")

  out <- vector("list", length(red))
  for( i in 1:length(red)) {

  redMod <-  with(Data, 
              glm(formula(paste(outcome, red[[i]], sep="~")), family = Family))
  fullMod <-  with(Data, 
              glm(formula(paste(outcome, full[[i]], sep="~")), family = Family))
  out[[i]] <- list(predictors = diffs[[i]], 
                   pval = c(pool.compare(fullMod, redMod)$pvalue)  )
  }
  do.call(rbind.data.frame, out)
}

# Run
impGlmDrop1(c("age", "bmi", "chl"), "(hyp==2)")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

ANOVA

categoricaldata

rmice

自动比较小鼠 glm.mids 的嵌套模型的相关文章

有人可以解释一下这段代码吗？尤其是“函数x和[[x]]”的作用？

这是 R 中的代码我无法理解其作用function x and qdata x 在这行代码中有人能给我详细解释一下吗这段代码不是我写的谢谢 outs lapply names qdata 12 35 function x hist
如何在Shiny中动态生成的条件面板中格式化条件？

我正在尝试使用 for 循环在 Shiny 中创建小部件每个块包含 label 复选框选择选择器两个数字输入我想根据复选框的值和选择选择器的值来设置显示或隐藏两个数字输入的条件在我创建的 for 循环中我为每个小部件变量添加了一
将 R 中的 arules 生成的规则应用于新交易

我的目标是使用 R 包生成的规则arules来预测topic每个事务每个事务有 1 个主题其中每个事务是文档中的一组单词我有一个训练集trans train 用于创建规则和测试集trans test 我想预测它的主题我还希望能够
xts 函数不将我的 POSIXct 日期视为适当的基于时间的对象

我创建了一个包含两列的数据框 gt head data frame Date Rainfall 1 1992 01 06 14 00 00 0 3 2 1992 01 06 15 00 00 0 2 3 1992 01 06 16 00 0
如何从闪亮模块调用闪亮模块？

如何从闪亮模块中调用闪亮模块并传递第一个模块中的选择作为一个例子我编写了一个应用程序来显示星球大战主题dplyr在 DT data 表中模块StarWars 来自同一数据集的相关电影应显示在另一个子选项卡模块电影的另一个 DT d
R 因子变量之间的相关性

我想知道是否有一种简单的方法来识别与另一个变量 100 相关的特征因子变量因此在示例中该过程将匹配颜色和车辆以及植物和高度 color lt c black black blue blue yellow vehicle
对列表中的每个数值列表求和

我想将值附加到 R 中河图中的标签我有一个值列表列表需要它来显示节点之间的流如下所示 edges lt list A list C 10 E 5 B list C 10 C list D 13 E 7 我知道有一个函数可以减少或求和
sapply 函数从命名向量中的值填充数据帧的列，需要很长时间。有更快的方法吗？

这是我正在做的一个例子 x lt c a 2 b 4 c 2 d 9 df lt data frame names c d c a b x是一个命名向量其值的顺序与它们在中出现的顺序不同df names 我需要在数据框中形成一个新列该列
Foreach循环无法找到对象

我正在尝试将 foreach 与并行后端结合使用来加速计算用于特征选择的 AUCRF 随机森林的交叉验证如果这确实重要的话在这样做的过程中我需要获取向量的子集向量的名称可以更改但可以作为字符向量进行访问我使用 eval par
dplyr 标准评估：summarise_ 以及求和变量的变量名称

我遇到了很多与我的问题类似的问题但只解决了我问题的一部分我使用带有标准评估的 dplyr 来容纳变量名称这对于管道中的 filter 和 group by 效果很好但是为了总结我无法为我正在求和的指标提供变量名称一个例子就可以
在 R 中使用 randomforest() 进行分类？

我最初有一个由 N 行 12 列组成的数据框最后一列是我的班级 0 或 1 我必须将整个数据框转换为数字 training lt sapply training temp as numeric 但后来我认为我需要将类列作为因子列来使用 r
闪亮的演示文稿 (ioslides)：自定义 CSS 和徽标

我安装了以下内容 RStudio 预览版版本 0 98 864 2014 年 5 月 24 日 knitr 和shiny 的开发版本来自 devtools install github c yihui knitr rstudio shi
Shiny 中的模态对话框：可以调整宽度但不能调整高度

在我的 Shiny 应用程序中我有几个来自闪亮BS 包的模式窗口我可以像这样调整这些模式窗口的宽度 tags head tags style HTML modal lg width 1200px abs 1 background col
R：错误消息---包错误：“functionName”未从当前命名空间解析

我正在使用一个一直运行到 R3 0 的软件包问题如上所述当我们调用在 R 2 15 2 中工作的函数时从 R 3 0 开始我们得到一个错误 Error in C solarspectrum3 as double lon as doub
在 Shiny 中使用 readlines(prompt = )

我有一个代码使用以下方式获取输入readlines prompt 功能您能告诉我 Shiny 中的哪个输入函数足以将此代码适应 Shiny 应用程序吗我需要一个交互功能我无法使用简单的输入selectInput 因为我有很多read
R - 根据另一个数据框查找每组的重叠日期

我有一个数据框其中包含多个雨量计的降雨测量值如下例所示 gt rnfl ID date value 1 250 2000 03 01 5 37 2 250 2000 03 02 0 00 3 250 2000 03 03 2 94 4
有效地将环境从内部功能转移到全局环境

我有一个在其中创建环境的函数我希望将该环境分配给全局环境目前我通过将环境分配给来做到这一点globalenv 作为最后一步如下 funfun lt function inc 1 dataEnv lt new env dataEnv d
正则表达式挑选括号之间的一些文本[重复]

这个问题在这里已经有答案了可能的重复提取 R 中所有括号内的信息正则表达式 https stackoverflow com questions 8613237 extract info inside all parenthesis i
解释 survreg 中的威布尔参数

我正在尝试使用从 R 中的 survreg 估计的参数生成逆威布尔分布我的意思是对于给定的概率这将是在 MS Excel 中实现的小型模拟模型中的随机数返回使用我的参数预计出现故障的时间我理解逆威布尔分布的一般形式是 X b l
R 条形图中的 X 轴

我想问一个关于 barplot 轴的问题首先请看我的数据 SerNo DOY Rain 1 350 0 2 351 0 3 352 0 4 353 0 5 354 0 6 355 0 7 356 0 8 357 0 9 358 0 10

随机推荐

有条件地更改 Google 日历活动的颜色

我使用下面的代码根据事件名称更改 Google 日历中的颜色我正在使用在这里找到的代码片段https webapps stackexchange com questions 85625 change the color of multip
PerformanceWarning - Pandas 和 Pytables，我可以解决这个问题吗？

我收到以下性能警告 PerformanceWarning your performance may suffer as PyTables will pickle object types that it cannot map directl
通过 pyenv 安装的解释器不会添加到 $PATH

我不明白为什么pyenv 通过自制软件安装似乎不起作用看来我的 PATHpyenv 未正确更新变量因此无法找到通过 pyenv 安装的解释器例如对于 python 版本 3 6 8 pyenv versions system 3
选择子项后会触发 WPF TreeviewItem 父项选定事件吗？

我有一个标准的 WPF 树视图项目其中包含许多子项以编程方式创建树时我将选定的事件处理程序添加到父项和子项我发现当子项选择事件被触发并被处理后父项事件就会被触发问题是我根据所选项目填充数据网格因此每次选择子项目后数据网格
绘制make生成的DAG图？

我的理解是当make执行时它内部会生成一个DAG来表示项目中的所有依赖项有没有办法获取 DAG 并将其绘制成图表比如使用 graphviz 之类的东西我在 Ubuntu 8 04 上使用 gnu make EDIT 我刚刚遇到了这
postgresql：在 JSON 数组中过滤

假设我们有一张桌子items其中有列name and attributes CREATE TABLE students name VARCHAR 100 attributes JSON 其中属性是一组总是结构相同的 JSON 文档例如
“OneToOneField”实例没有“用户名”成员

创建Profile模型时出现以下错误 OneToOneField 实例没有用户名成员这是我创建的代码片段 from django db import models from django contrib auth models imp
单击链接时显示部分视图

我对 JQuery 和 MVC 2 相当陌生这使得这有点困难我以前一直使用 WebForms 我正在使用书呆子晚餐 http nerddinner codeplex com 设置示例我已经切换Dinner for Person尽管我
Jetpack Compose 中的导航 - 片段/ViewModel

所以我正在查看这个官方 Compose 教程https developer android com courses pathways compose https developer android com courses pathways
如何在android中保存单选按钮的状态

我想保存在android中单击的单选按钮的状态当用户转到下一个问题时它必须保存状态以便当他返回到上一个状态时它必须显示所选选项使用共享首选项保存单选按钮的状态并且您可以检索其他活动中的数据这是java类 import and
在android中使用firebase数据填充ListView

我再次提出这个问题但我很接近我有以下代码我试图在列表视图中显示 firebase 值 protected void onCreate Bundle savedInstanceState super onCreate savedInst
使用 SDCard 上的一些文件创建 zip 文件

当我几天前发布一个问题时我意识到库存电子邮件应用程序无法发送附件中的多个文件 https stackoverflow com questions 5773006 sending email with multiple attachment
(# ﾟДﾟ) 是一个 5 个字母的单词。但在 iOS 中，[@"(# ﾟДﾟ)" 长度] 是 7。为什么呢？

是一个 5 个字母的单词但在 iOS 中长度是 7 Why 我在用着
swagger .net core API 操作错误的不明确 HTTP 方法

使用 net Core 2 API 实现 Swashbuckle Swagger 我现在在访问 swagger json 时收到 500 错误 NotSupportedException 不明确的 HTTP 操作方法 EBisAPI Con
修改大 R data.frame 时内存不足

我有一个大数据框占用大约 900MB 内存然后我尝试这样修改它 dataframe 17 37544 0 似乎使得 R 使用超过 3G 的内存并且 R 抱怨错误无法分配大小为 3 0 Mb 的向量我在 32 位机器上我发现这种
我使用 xcode 6.0.1 上传应用程序后，“您的二进制文件未针对 iPhone 5 进行优化”

使用 Xcode 版本 6 0 1 6A317 上传二进制文件后我收到这封电子邮件您的二进制文件未针对 iPhone 5 进行优化新的 iPhone 应用程序和应用程序提交的更新必须支持 iPhone 5 上的 4 英寸显示屏并且
错误：指定的密钥太长；最大密钥长度为 1000 字节

Error 1071 指定的密钥太长最大密钥长度为 1000 字节 CREATE TABLE phppos modules actions action id VARCHAR 255 CHARACTER SET utf8 COLLATE
使用 jest 和 css-modules 测试 React 组件时出错

我正在尝试测试我的组件jest react redux但我不断收到以下错误 Test suite failed to run stream react redux src containers App App css 1 Object
如何选择最接近句点的前 280 个单词的文本？

我需要从较长的文本中提取指定数量单词的较短文本片段我可以使用以下方法来做到这一点 text There was a very big cat that was sitting on the ledge It was overlooking
自动比较小鼠 glm.mids 的嵌套模型

我有一个来自 R 的多重插补模型mice包中有很多因子变量例如 library mice library Hmisc turn all the variables into factors fake nhanes fake age as

自动比较小鼠 glm.mids 的嵌套模型

自动比较小鼠 glm.mids 的嵌套模型 的相关文章

随机推荐

热门标签

自动比较小鼠 glm.mids 的嵌套模型的相关文章