我可以使用 mi 包汇集估算的随机效应模型估计值吗？

2024-02-12

看来mi在过去几年的某个时候，软件包进行了相当大的重写。

以下教程详细概述了“旧”的处理方式：http://thomasleeper.com/Rcourse/Tutorials/mi.html http://thomasleeper.com/Rcourse/Tutorials/mi.html

“新”的做事方式（坚持 Leeper 的模拟演示）看起来像这样：

#load mi
library(mi)
#set seed
set.seed(10)
#simulate some data (with some observations missing)
x1 <- runif(100, 0, 5)
x2 <- rnorm(100)
y <- 2*x1 + 20*x2 + rnorm(100)
mydf <- cbind.data.frame(x1, x2, y)
mydf$x1[sample(1:nrow(mydf), 20, FALSE)] <- NA
mydf$x2[sample(1:nrow(mydf), 10, FALSE)] <- NA

# Convert to a missing_data.frame
mydf_mdf <- missing_data.frame(mydf)

# impute
mydf_imp <- mi(mydf_mdf)

尽管函数名称已更改，但这实际上与“旧”的处理方式非常相似。

最大的变化（从我的角度来看）是替换了以下“旧”功能

lm.mi(formula, mi.object, ...)

glm.mi(formula, mi.object, family = gaussian, ...)

bayesglm.mi(formula, mi.object, family = gaussian, ...)

polr.mi(formula, mi.object, ...)

bayespolr.mi(formula, mi.object, ...)

lmer.mi(formula, mi.object, rescale=FALSE, ...)

glmer.mi(formula, mi.object, family = gaussian, rescale=FALSE, ...).

以前，用户可以使用这些函数之一为每个估算数据集计算模型，然后使用mi.pooled() (or coef.mi()如果我们遵循 Leeper 的例子）。

在当前版本中mi（我安装了 v1.0），最后这些步骤似乎已合并为一个函数，pool(). The pool()函数似乎读取在上述插补过程中分配给变量的族和链接函数，然后使用以下方法估计模型bayesglm使用如下所示的指定公式。

# run models on imputed data and pool the results
summary(pool(y ~ x1 + x2, mydf_imp))

## 
## Call:
## pool(formula = y ~ x1 + x2, data = mydf_imp)
## 
## Deviance Residuals: 
##      Min        1Q    Median        3Q       Max  
## -1.98754  -0.40923   0.03393   0.46734   2.13848  
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -0.34711    0.25979  -1.336    0.215    
## x1           2.07806    0.08738  23.783 1.46e-13 ***
## x2          19.90544    0.11068 179.844  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for gaussian family taken to be 0.7896688)
## 
##     Null deviance: 38594.916  on 99  degrees of freedom
## Residual deviance:    76.598  on 97  degrees of freedom
## AIC: 264.74
## 
## Number of Fisher Scoring iterations: 7

看起来我们即将恢复模拟 Beta 值（2 和 20）。换句话说，它的行为符合预期。

让我们采用一组稍微大一些的数据，并简单地模拟随机效应，只是为了获得分组变量。

mydf2 <- data.frame(x1 = rep(runif(100, 0, 5), 20)
                   ,x2 = rep(rnorm(100, 0, 2.5), 20)
                   ,group_var = rep(1:20, each = 100)
                   ,noise = rep(rnorm(100), 20))

mydf2$y <- 2*mydf2$x1 + 20*mydf2$x2 + mydf2$noise

mydf2$x1[sample(1:nrow(mydf2), 200, FALSE)] <- NA
mydf2$x2[sample(1:nrow(mydf2), 100, FALSE)] <- NA

# Convert to a missing_data.frame
mydf2_mdf <- missing_data.frame(mydf2)

show(mydf2_mdf)

## Object of class missing_data.frame with 2000 observations on 5 variables
## 
## There are 4 missing data patterns
## 
## Append '@patterns' to this missing_data.frame to access the corresponding pattern for every observation or perhaps use table()
## 
##                 type missing method  model
## x1        continuous     200    ppd linear
## x2        continuous     100    ppd linear
## group_var continuous       0   <NA>   <NA>
## noise     continuous       0   <NA>   <NA>
## y         continuous       0   <NA>   <NA>
## 
##             family     link transformation
## x1        gaussian identity    standardize
## x2        gaussian identity    standardize
## group_var     <NA>     <NA>    standardize
## noise         <NA>     <NA>    standardize
## y             <NA>     <NA>    standardize

Since missing_data.frame()似乎正在翻译group_var作为连续的，我使用change()函数来自mi重新分配给"un"对于“无序分类”，然后按上述方式进行。

mydf2_mdf <- change(mydf2_mdf, y = "group_var", what = "type", to = "un"  )

# impute
mydf2_imp <- mi(mydf2_mdf)

现在，除非1.0版本mi删除了以前版本的功能（即可用的功能lmer.mi and glmer.mi），我假设在公式中添加随机效应应该指出pool()到适当的lme4功能。然而，最初的错误消息表明情况并非如此。

# run models on imputed data and pool the results
summary(pool(y ~ x1 + x2 + (1|group_var), mydf2_imp))
## Warning in Ops.factor(1, group_var): '|' not meaningful for factors
## Warning in Ops.factor(1, group_var): '|' not meaningful for factors
## Error in if (prior.scale[j] < min.prior.scale) {: missing value where TRUE/FALSE needed

按照我的警告消息并从我的因子中提取整数确实可以让我得到一个估计，但结果表明pool()仍在估计固定效应模型bayesglm并保持我尝试的随机效应不变。

summary(pool(y ~ x1 + x2 + (1|as.numeric(as.character(group_var))), mydf2_imp))

## 
## Call:
## pool(formula = y ~ x1 + x2 + (1 | as.numeric(as.character(group_var))), 
##     data = mydf2_imp)
## 
## Deviance Residuals: 
##      Min        1Q    Median        3Q       Max  
## -1.93633  -0.69923   0.01073   0.56752   2.12167  
## 
## Coefficients:
##                                               Estimate Std. Error  t value
## (Intercept)                                  1.383e-01  2.596e+02    0.001
## x1                                           1.995e+00  1.463e-02  136.288
## x2                                           2.000e+01  8.004e-03 2499.077
## 1 | as.numeric(as.character(group_var))TRUE -3.105e-08  2.596e+02    0.000
##                                             Pr(>|t|)    
## (Intercept)                                        1    
## x1                                            <2e-16 ***
## x2                                            <2e-16 ***
## 1 | as.numeric(as.character(group_var))TRUE        1    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for gaussian family taken to be 0.8586836)
## 
##     Null deviance: 5384205.2  on 1999  degrees of freedom
## Residual deviance:    1713.9  on 1996  degrees of freedom
## AIC: 5377
## 
## Number of Fisher Scoring iterations: 4

我的问题是：

是否可以使用以下方法轻松生成汇总随机效应估计mi?, and
如果是，怎么办？

只是为了提供一种替代方案，有一个包非常关注混合效应模型的 MI 以及汇集从中获得的结果（mitml, 在这里找到它 https://cran.r-project.org/web/packages/mitml/index.html).

使用该包非常简单。它依赖于包pan and jomo用于插补，但它也可以处理来自其他 MI 包的输入（?as.mitml.list).

来自混合效应模型的汇集估计大部分是自动化的，并包含在testEstimates功能。

require(mitml)
require(lme4)

data(studentratings)

# impute example data using 'pan'
fml <- ReadDis + SES ~ ReadAchiev + (1|ID)
imp <- panImpute(studentratings, formula=fml, n.burn=1000, n.iter=100, m=5)

implist <- mitmlComplete(imp, print=1:5)

# fit model using lme4
fit.lmer <- with(implist, lmer(SES ~ (1|ID)))

# pool results using 'Rubin's rules'
testEstimates(fit.lmer, var.comp=TRUE)

Output:

# Call:

# testEstimates(model = fit.lmer, var.comp = TRUE)

# Final parameter estimates and inferences obtained from 5 imputed data sets.

#              Estimate Std.Error   t.value        df   p.value       RIV       FMI 
# (Intercept)    46.988     1.119    41.997   801.800     0.000     0.076     0.073 

#                         Estimate 
# Intercept~~Intercept|ID   38.272 
# Residual~~Residual       298.446 
# ICC|ID                     0.114 

# Unadjusted hypothesis test as appropriate in larger samples.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

我可以使用 mi 包汇集估算的随机效应模型估计值吗？的相关文章

使用变量在 r 中像 aes_string 一样选择轴

我试图提供一个带有列名的变量来创建一个plotly图表类似于ggplot2 aes string 不知怎的我被困住了 plot ly iris x Sepal Length y Sepal Width works as expected
RStudio 在临时目录中从 Rmarkdown 创建 PDF 文件

我使用 RStudio 和 Rmarkdown 来创建报告由于某种原因使用 Knit 按钮会导致它仅在某个临时目录中创建从命令输出来看似乎 pandoc 本身被指示这样做我觉得这很奇怪 usr lib rstudio bin pa
将 data.frame 的列中的值替换为另一个 data.frame 中的值

我的情况是我有一个数据框其中有一列填充了整数 1 到 6 我想用更具描述性的标签替换这些整数这些标签在另一个充当键的数据框中提供 V1 V2 1 1 LABEL1 2 2 LABEL2 3 3 LABEL3 4 4 LABEL4
在 mts 对象上使用 Apply 系列函数

在 mts 对象上使用 apply 或 sapply 会在发送到函数时删除其时间序列属性我应该如何在 mts 对象中的每个时间序列上应用相同的函数带有 ts 输入和 ts 输出并返回它最好是 mts 我的意思是除了使用 for 循环
单击并按住 R 中的按钮闪亮？

我希望能够通过单击 R 闪亮按钮来更改参数的值所以我需要按钮一个用于增加值一个用于减少值我想在按住按钮的同时保持值以一定的速度减少增加通过释放按钮的点击动作应该停止到目前为止我还没有找到这个选项actionButtons在
在 for 循环中绘制的多个 ggplot2 绘图的网格

作为一个新的 ggplot2 用户我对可能性的数量感到有点迷失并且很难在网上找到我认为简单问题的简单答案我想在同一张纸上显示 ggplot2 的多个图但知道这些图来自 for 循环以下示例无法编译仅用于说明 for i in c
在 Shiny 中使用 readlines(prompt = )

我有一个代码使用以下方式获取输入readlines prompt 功能您能告诉我 Shiny 中的哪个输入函数足以将此代码适应 Shiny 应用程序吗我需要一个交互功能我无法使用简单的输入selectInput 因为我有很多read
glm() 模型的交叉验证

我正在尝试对我之前在 R 中构建的一些 glm 模型进行 10 倍交叉验证我对cv glm 函数在boot包尽管我已经阅读了很多帮助文件当我提供以下公式时 library boot cv glm data glmfit K 10 这里
udunits2 R 安装：找不到 udunits2.h

我正在尝试在 R 中安装 udunits2 以满足对ggforce包裹但是安装程序在检查 udunits2 时始终失败我已经尝试过中的说明this https stackoverflow com questions 47059517
仅在具有重复块名称的另一个 Rmarkdown 文档中运行一个 Rmarkdown 文档中的代码

我正在 Rmarkdown 中编写一系列相互补充的报告我想将上一份报告的结果纳入我目前正在编写的报告中我看到其他建议使用的问题purl从 Rmarkdown 文档中提取 R 代码然后运行它所以我尝试了以下操作 r read previ
mclapply 用户时间大于已用时间

我正在尝试使用mclapply的功能parallel封装在R 该函数通过计算对数似然距离将值分配给序列矩阵这是一个 CPU 密集型操作所结果的system time价值观令人困惑 gt system time mclapply work
如何用日语创建 ggplot2 标题？

我正在准备日语演示文稿并希望图像的标题和图例名称为日语我可以让文本在 RStudio 中渲染得很好但是当渲染图像时日语字符仅显示为方框 x 10 10 y x x df data frame x y ggplot df aes x
我可以调整scale_color_brewer的下限吗？

我已经订购了我想使用 color Brewer 的分类数据但我很难看到非常低的值有没有办法去掉这些较低的值或设置范围的下限 ggplot data frame x 1 6 y 10 15 w letters 1 6 aes x y co
当子集长度为零时，如何简洁地处理子集？

从向量中排除元素x x lt c 1 4 3 2 我们可以减去位置向量 excl lt c 2 3 x excl 1 1 2 这也是动态工作的 excl lt which x which max x gt quantile x 25 1 2
如何将 mcmc.list 转换为 bugs 对象？

我正在使用rjagsR 库功能coda samples产生一个mcmc list 例如来自example coda samples library rjags data LINE LINE recompile LINE out lt c
通过 RCpp 返回 NA

新手 RCpp 问题在这里 How can I make a NumericVector returnNA到R 例如假设我有一个 RCpp 代码它分配NA到向量的第一个元素 RCpp export NumericVector myFun
使用 dplyr 的 select 引用变量名[重复]

这个问题在这里已经有答案了通常我会想要选择变量的子集其中该子集是函数的结果在这个简单的例子中我首先获取与宽度特征相关的所有变量名称 library dplyr library magrittr data iris width var
在 ggplot 中过滤管道 df

我正在使用 dplyr 管道来清理我的 df 然后直接输入到 ggplot 中但是我只想一次只绘制一组因此我需要过滤到该组问题是我希望比例保持不变就好像所有群体都存在一样是否可以在 ggplot 命令中进一步过滤管道 df 例
通过 r 中的组变量进行汇总

我有一个数据框如下 head newStormObject FATALITIES INJURIES PROPVALDMG CROPVALDMG EVTYPE total 1 0 15 2 5e 05 0 TORNADO 15 2 0 0 2
R - 如何为数据范围内的缺失值绘制条形图零点？

假设我对 1 到 10 之间的整数的 200 个点有 10 个观察值 mysample sample rep seq 1 10 20 10 我想用条形图绘制它 barplot table mysample barplot https i s

随机推荐

Knex 以静默方式转换 Postgres 时间戳与时区并返回错误的时间

我的 psql 数据库中有一个表其中的 trigger time 列的类型为 TIMESTAMP WITH TIME ZONE DEFAULT now 我行中的数据是这样的2018 06 27 15 45 00 03 从 psql 控制台
水平对齐元素，jquery mobile

我对 jquery mobile 或相关移动 UI 框架没有太多经验我发现水平对齐元素很困难我想水平对齐文本字段并选择标签以便它们显示为内联 I tried 数据类型水平 and 数据内联真但他们不工作这是我正在使用的代码 d
React Native - 使用 AWS Amplify 将视频上传到 AWS S3 存储

我正在尝试使用 React Native 中的 AWS Amplify 将视频上传到 AWS S3 点击此链接后我可以上传图像 aws amplify 使用存储中的 PUT 上传图像 https aws amplify github io
如何在 MatLab 中创建 3D 绘图？

请帮助我使用以下参数在 MatLab 中创建 3D 绘图 x t y t z 2t 2 0
使 Toplevel 调整自身大小以适合标题

考虑 usr bin python from Tkinter import root Tk root withdraw top Toplevel top title Some long title label Label top text
Ansible 失败，显示 /bin/sh: 1: /usr/bin/python: not found

我遇到了以前从未见过的错误这是命令和错误 ansible playbook create api yml PLAY straw GATHERING FACTS failed 104 55 47 224 gt failed true par
是否在 grails 中使用 getter 和 setter？

如果您在 grails 项目中有一个域类您还可以使用 getter 和 setter 来写入或读取它们例如域类 Book 具有属性 String author 在控制器中你有一本书你想设置这本书的作者这适用于直接访问属性或使用 g
水平旋转的iphone uipickerview？

我只在极少数 iPhone 应用程序中看到过它但它看起来像一个左右旋转的选择器而不是顶部底部他们通常将其放在 tableView 的 1 行以允许用户在少量选项如 3 10 之间快速进行选择这是如何编码的继续戴夫德隆的回
包含日期的字符串上的 Linq 大于和小于运算符

我正在我的应用程序中编写一个 linq 查询我想在其上使用小于运算符然而我尝试将其应用到的列是字符串类型我们无法更改并且导致智能感知抛出错误因为我的问题是我还能怎么做这是我的代码中发生错误的部分 public Actio
使 jQuery AJAX 具有非 javascript（非 ajax）后备？

我已经在我的最新项目中完成了大量工作但我意识到存在一些问题如果您没有支持 Javascript 的浏览器则无法提交任何表单因为每个表单都使用AJAX 提交我向大家提出的问题是我怎样才能实现某种后备这样如果他们没有启用Java
如何在 Stackdriver 中导出以前的日志

我在 Stackdriver 中有一个日志记录了进入我的 api 并失败的每个请求我想编写一个脚本来计算每个错误消息出现的次数问题是 Stackdriver V2 中的导出功能只允许我接收即将到来的错误消息但我只关心已经存在于日志中
Laravel 5.5 PHPunit 测试 - “尚未设置门面根。”

当我尝试抓住DB Connection gt getPdo 我收到错误尚未设置外观根我相信这发生在Schema在我尝试添加 try catch 之前门面也是如此当然测试目录位于应用程序目录之外我感觉它与此有关但我还没有成功地弄
JSF/Facelets：为什么将 JSF/Facelets 与 HTML 标签混合不是一个好主意？

我现在已经读过好几次了一些开发人员并不提倡在 XHTML 文件中将 JSF Facelets 标记与 HTML 标记交错显然 HTML 标签不会成为 UI 组件树的一部分但是这样做有什么缺点呢我经常发现作者进行这种混合的代码示例 h
Logstash 与 log4j socketappender 不起作用

我正在尝试通过 log4j 套接字附加程序流式传输我的日志并尝试通过logstash log4j 输入插件检索相同的日志我的logstash配置看起来像 input log4j type gt socketlogs port gt 19
Angular 2 表单验证器弄乱了取消按钮

我有一个数据收集组件其中包括用于取消整个过程的取消按钮问题是如果由 Angular 2 验证器验证的某些 HTML 输入字段具有焦点并且无效并且我按下取消按钮则该组件不会被删除相反验证器将触发并且取消按钮按下将被忽略在
如何在 Outlook 2010 中将嵌入图像添加到 HTML 邮件中

我有 Office 2003 VBA 代码使用这里描述的技术 http www outlookcode com d code htmlimg htm使用未记录的 MAPI 属性和 CDO 1 21 将图像嵌入 HTML 消息中不再支持
Hadoop 框架中使用的属性的完整列表

我正在对 Hadoop 框架进行一些研究我想问一下框架中可以使用的属性例如 io sort mb io sort record percent etc 我可以参考这个框架的整个属性列表吗非常希望有人能帮助我另外我想问一下 io s
Python 3 枚举比 Python 2 慢有什么原因吗？

Python 3 在最小循环的枚举方面似乎比 Python 2 慢很多而在较新版本的 Python 3 中情况似乎变得更糟我在 64 位 Windows 计算机 Intel i7 2700K 3 5 GHz 上安装了 Python 2
为什么我的产品中的目标是红色的？ [复制]

这个问题在这里已经有答案了可能的重复 app 文件在 Xcode 4 的新项目中显示为红色缺失 https stackoverflow com questions 5409015 app file appears in red miss
我可以使用 mi 包汇集估算的随机效应模型估计值吗？

看来mi在过去几年的某个时候软件包进行了相当大的重写以下教程详细概述了旧的处理方式 http thomasleeper com Rcourse Tutorials mi html http thomasleeper com Rcou

我可以使用 mi 包汇集估算的随机效应模型估计值吗？

我可以使用 mi 包汇集估算的随机效应模型估计值吗？ 的相关文章

随机推荐

热门标签

我可以使用 mi 包汇集估算的随机效应模型估计值吗？的相关文章