使用 R 中 {boot} 中的 boot() 函数对最高级别的集群数据进行非参数引导

2024-01-11

我有两级分层数据，我正在尝试在最高级别上执行非参数引导采样，即，通过替换对最高级别的集群进行随机采样，同时保留原始的集群内数据。

我想使用 {boot} 包中的 boot() 函数来实现此目的，因为我想使用需要引导对象的 boot.ci() 来构建 BCa 置信区间。

以下是我不幸的尝试 - 在启动调用上运行调试表明随机采样没有在集群级别发生（=主题）。

### create a very simple two-level dataset with 'subject' as clustering variable

rho <- 0.4
dat <- expand.grid(
    trial=factor(1:5),
    subject=factor(1:3)
    )
sig <- rho * tcrossprod(model.matrix(~ 0 + subject, dat))
diag(sig) <- 1
set.seed(17); dat$value <- chol(sig) %*% rnorm(15, 0, 1)


### my statistic function (adapted from here: http://biostat.mc.vanderbilt.edu/wiki/Main/HowToBootstrapCorrelatedData)

resamp.mean <- function(data, i){
    cluster <- c('subject', 'trial')

    # sample the clustering factor
    cls <- unique(data[[cluster[1]]])[i]   

    # subset on the sampled clustering factors
    sub <- lapply(cls, function(b) subset(data, data[[cluster[1]]]==b))   

    sub.2 <- do.call(rbind, sub)      # join and return samples
    mean((sub.2$value))               # calculate the statistic
}


debugonce(boot)
set.seed(17); dat.boot <- boot(data = dat, statistic = resamp.mean, 4)


### stepping trough the debugger until object 'i' was assigned
### investigating 'i'
# Browse[2]> head(i)

     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14] [,15]
[1,]    3    7   12   13   10   14   14   15   12    12    12     4     5     9    10
[2,]   15    9    3   13    4   10    2    4    6    11    10     4     9     4     3
[3,]    8    4    7   15   10   12    9    8    9    12     4    15    14    10     4
[4,]   12    3    1   15    8   13    9    1    4    13     9    13     2    11     2

### which is not what I was hoping for.


### I would like something that looks like this, supposing indices = c(2, 2, 1) for the first resample: 

     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14] [,15]
[1,]    6    7    8    9   10    6    7    8    9    10     1     2     3     4     5

任何帮助将非常感激。

我认为问题源于修改后的统计函数（具体来说，cls函数内的对象）。你能试试这个吗？取消注释print声明以查看哪些对象已被采样。它不使用index论证哪个boot期望，相反它只是使用sample就像原来的函数一样。

resamp.mean <- function(dat, 
                        indices, 
                        cluster = c('subject', 'trial'), 
                        replace = TRUE){
      # boot expects an indices argument but the sampling happens
      # via sample() as in the original source of the function

      # sample the clustering factor
      cls <- sample(unique(dat[[cluster[1]]]), replace=replace)

      # subset on the sampled clustering factors
      sub <- lapply(cls, function(b) subset(dat, dat[[cluster[1]]]==b))

      # join and return samples
      sub <- do.call(rbind, sub)

      # UNCOMMENT HERE TO SEE SAMPLED SUBJECTS 
      # print(sub)

      mean(sub$value)
}

一次重采样来自resamp.mean均值之前的函数value计算如下：

    trial subject      value
1       1       1 -1.1581291
2       2       1 -0.1458287
3       3       1 -0.2134525
4       4       1 -0.5796521
5       5       1  0.6501587
11      1       3  2.6678441
12      2       3  1.3945740
13      3       3  1.4849435
14      4       3  0.4086737
15      5       3  1.3399146
111     1       1 -1.1581291
121     2       1 -0.1458287
131     3       1 -0.2134525
141     4       1 -0.5796521
151     5       1  0.6501587

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 R 中 {boot} 中的 boot() 函数对最高级别的集群数据进行非参数引导的相关文章

sqlite3-ruby gem：无法构建 gem 本机扩展

Update 看看这个后续问题 Windows 上的 Gem 更新它坏了吗 https stackoverflow com questions 134581 gem update on windows is it broken 在 Win
Excel 2013 数据透视表不会更改当前页面，除非手动导航到

我们有一小段 VBA 代码多年来一直完美运行本质上是 Me PivotTables APivot PivotFields AField CurrentPage Some text 这种方法一直有效直到 Excel 2013 该行将失败
将带有星号的注册表项传递给测试路径

我想通过以下方式运行此注册表路径Test Path在 PowerShell 中但它包含一个星号该星号在注册表中有效但在 Windows 路径中无效问题是当我通过它时 Test Path将星号视为通配符因此这需要非常非常长的时间
如何在 iOS 中注册自定义文件类型

我目前正在创建一个应用程序我想让用户在其中备份他们的文件 plist m4a 我压缩文件并将扩展名更改为自定义扩展名专门针对我的应用程序例如 MyBackup 然后用户可以通过电子邮件或 iTunes 文件共享进行导出我已经阅读过
如何更改 aptana studio 的背景颜色？

如何将 Aptana IDE 或整个主题的黑色背景更改为其他背景例如蓝色正如 gyozo 在评论中提到的对于蓝色主题请使用窗口 gt 首选项 gt Aptana Studio gt 主题并选择 Eclipse 主题
如何获得 JavaScript 阶乘程序的循环来显示所使用的工作？

你好我面临着用 JavaScript 编写一个程序的挑战尽管我对它不太了解但它要求用户输入一个数字然后计算该数字的阶乘我使用了已经提出的问题并设法使计算正常工作但无法获得所需的输出我必须在以下输出中获取它而不使用任何花哨的库
如何将十六进制字符串转换为无符号长整型？

我有以下十六进制值 CString str str T FFF000 如何将其转换为unsigned long 您可以使用strtol作用于常规 C 字符串的函数它使用指定的基数将字符串转换为 long long l strtol str
Jackson 将单个项目反序列化到列表中

我正在尝试使用一项服务该服务为我提供了一个带有数组字段的实体 id 23233 items name item 1 name item 2 但是当数组包含单个项目时将返回该项目本身而不是包含一个元素的数组 id 43567 item
Swagger/Openapi-Annotations：如何使用 $ref 生成 allOf？

我正在生成 Rest 端点包括添加OpenAPI Swagger对生成的代码进行注释虽然它对于基本类型运行得很好但我在自定义类方面遇到了一些问题现在我有很多自定义类的重复架构条目使用 Schema 实现 MyClass class
我可以将 MongoDB 与实体框架一起使用吗？

实体框架有可能支持MongoDB数据库吗有人写过实体框架MongoDB Provider吗简短的回答不这肯定是可能的但不合理 MongoDB 是文档数据库不支持集合之间的任何物理关系 EF 非常适合 SQL MySQL 等关系数
Biopython 可以执行 Seq.find() 来解释歧义代码吗

我希望能够在 Seq 对象中搜索考虑歧义代码的子序列 Seq 对象例如以下内容应该是正确的 from Bio Seq import Seq from Bio Alphabet IUPAC import IUPACAmbiguousDNA
使用 VBA 通过 Access 导航网页/操作 IE

你好 StackOverflow 社区我有一个关于使用 Access VBA 操作 IE 的问题本质上我正在尝试编写代码使用 IE 打开特定网页在该页面中搜索特定链接目标链接的名称将取决于用户的情况通过以编程方式单击该链接导航
我可以让 swagger-php 在查询字符串上使用数组吗？

我使用 Swagger php 当我定义查询字符串上的参数时它可以是一个数组但据我所知它不支持这种查询字符串 https api domain tld v1 objects q 1 q 5 q 12 我相信这会被设定in the co
如何将容器管理事务 (CMT) 与 JBoss AS 6、Hibernate 3.6、JPA、JTA 和 EJB3 结合使用

我正在尝试使用 CMT 设置网络应用程序我已经让它在 Eclipse 中独立运行了现在我尝试使用 Struts 1 0 让它在 Jboss AS 6 中工作我选择 CMT 是因为我读过的 doco 暗示它是最好的并且使用起来最简单
使用适用于 Android 和 ios 的 Angular NativeScript 的透明选项卡栏和操作栏

我想让标签栏透明操作栏在滑动布局或页面上透明操作栏或选项卡栏必须位于页面顶部就像两层一样我尝试过使用 css 使其透明但它在页面上并没有变得透明
JQuery 删除和内存泄漏

我正在开发一个游戏我看到了很多内存消耗我使用jquery animate 动画完成后我 remove 元素我的问题是从 dom 树中删除一个元素后对象还存在记忆中吗 Javascript 是一种垃圾收集语言这意味着当没有代码保
ubuntu：升级软件（cmake）-版本消歧（本地编译）[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我的机器上安装了 cmake 2 8 0 来自 ubuntu 软件包二进制文件放置在 usr bin cmake 中我需要将 cmake 版本至少
在 Google 地图上绘制线条/路径

我很长一段时间都在忙于寻找如何在 HelloMapView 中的地图上的两个 GPS 点之间画一条线但没有运气谁能告诉我该怎么做假设我使用扩展 MapView 的 HelloMapView 我需要使用叠加层吗如果是这样我是否必须重
OpenCV SIFT 描述符关键点半径

我正在深入研究OpenCV的SIFT描述符提取的实现 https github com Itseez opencv blob master modules nonfree src sift cpp 我发现了一些令人费解的代码来获取兴趣点邻域
谓词对于列表中的所有元素都必须为 true

我有一组事实 likes john mary likes mary robert likes robert kate likes alan george likes alan mary likes george mary likes har

随机推荐

使用 Pandas MultiIndex 选择多行分层 DataFrame

我有一个具有 3 个级别的 MultiIndex 的 Pandas DataFrame 假设我有以下数据 df pd DataFrame ColB A1 B1 1 cb1 A1 B1 2 cb2 A1 B2 1 cb3 A1 B2 2 cb
MahApps Metro HamburgerMenu 绑定不起作用

我不太确定这是否是问这个问题的最佳地点但我想我应该尝试一下我正在尝试使用 MahApps Metro UI Toolkit 在我的应用程序中实现汉堡菜单该工具包在我制作的测试窗口中效果很好因此我开始转向使用视图模型的主窗口之一问
通过 for 循环绑定的事件中数值错误

var rows document getElementsByClassName row for var i 0 l rows length i lt l i if i 2 0 rows i click function alert I a
调用 RedirectToAction 时 Response.Cookies 会重置

在我的 asp net mvc 项目中我有一个 AccountController 它在登录时将带有用户首选项的 cookie 设置为 Request Response 然后执行 RedirectToAction 重定向后 cookie
NoSuchModuleError：无法加载插件：sqlalchemy.dialects:redshift.psycopg2

我正在尝试从我的 python 代码连接到 redshift 我安装的点 psycopg2 2 6 1 redshift sqlalchemy 0 4 1 SQLAlchemy 1 0 9 我的虚拟机有 libpq dev python p
PHP 升级后第 0 行出现未知错误 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我该如何解决这个奇怪的问题我将我的 VPS 上的 PHP 更新到了 5 6 0 现在在这个特定的脚本上我收到了这两个错误而我之前没有
如何知道拉斐尔对象是否被隐藏？

我正在创建一个图表应用程序在其中隐藏和显示一些元素例如 var c paper circle 10 10 10 c hide var c2 paper circle 10 10 10 c2 show 现在我想对这样的形状采取行动例如计
ModuleNotFoundError - Python 3 的 PyMySQL

我正在尝试让一个简单的测试程序在我的机器上运行并连接到 SQL DB 我pip安装然后卸载然后用pip3安装 pymysql 我遇到的问题导入 PyMySQL ModuleNotFoundError 没有名为 PyMySQL 的模块当我
nodejs根据时间戳查询azure存储表

我使用以下查询成功查询了带有分区键的表 var query new azure TableQuery where PartitionKey ne test 但我尝试用时间戳查询但失败了 var query new azure TableQu
访问 https://api.sandbox.paypal.com/v1/ payments/billing-plans/xxxxxxxxxxx 时收到 Http 响应代码 500

我创建了许多计费计划直到上周都运行良好我正在尝试删除该计划但在访问时收到错误 Got Http response code 500https api sandbox paypal com v1 payments billing pla
空接口有代码味道吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动
Redshift - 如何删除 NOT NULL 约束？

由于Redshift不支持ALTER COLUMN 我想知道是否可以从 Redshift 中的列中删除 NOT NULL 约束您无法更改该表还有一种替代方法您可以创建带有 NULL 约束的新列将旧列中的值复制到此新列然后删除旧列
如何在无头 Chrome 上使用 Selenium Webdriver？

我正在学习使用 Selenium 进行一些基本操作例如截屏抓取和测试并且希望将其与 Headless Chrome 一起使用该 Chrome 从 Chrome 59 开始已经稳定我已经能够使用 selenium webdriver
尝试将多个命令行参数传递给 javaws 启动应用程序？

我见过类似的问题但没有一个能够帮助我解决我的问题我被要求能够传递多个命令行参数来启动我们使用的自定义 Java 应用程序无论如何我已经尝试过这个命令因为我能找到的所有文档都说 javaws open arg1 arg2 arg3
如果收到 Firebase 安全规则信函，我该怎么办？ [复制]

这个问题在这里已经有答案了到达邮件需要做什么 rules rules version 2 service cloud firestore match databases database documents This rule allow
使用 IntelliJ 或 Play 时如何使“Java Hot Spot MaxPermSize”警告消失？

当我启动 IntelliJ 或运行时收到此警告play in a Play http www playframework com 项目 Java HotSpot TM 64 Bit Server VM warning ignoring op
git checkout 分支，不删除其中已删除的文件

这是我面临的情况充满生成文件的目录错误地提交到存储库它们显然不应该是所以我想删除它们 git rm cached foo cat gt foo gitignore gitignore git add foo git commit m
jquery ajax传递具有相同键的多个值的数据

有没有一种简单的方法可以使用 jquery 构建这样的 ajax 查询 http www test com value happy value good value day I tried getJSON http www test com
如何检索 Amazon cloudsearch 中的所有可搜索（未删除）文档

我想从 cloudsearch 检索所有可搜索文档我尝试做这样的否定搜索 search mySearchEndPoint cloudsearch amazonaws com 2011 02 01 search bq not keyword
使用 R 中 {boot} 中的 boot() 函数对最高级别的集群数据进行非参数引导

我有两级分层数据我正在尝试在最高级别上执行非参数引导采样即通过替换对最高级别的集群进行随机采样同时保留原始的集群内数据我想使用 boot 包中的 boot 函数来实现此目的因为我想使用需要引导对象的 boot ci 来构建 BC

使用 R 中 {boot} 中的 boot() 函数对最高级别的集群数据进行非参数引导

使用 R 中 {boot} 中的 boot() 函数对最高级别的集群数据进行非参数引导 的相关文章

随机推荐

热门标签

使用 R 中 {boot} 中的 boot() 函数对最高级别的集群数据进行非参数引导的相关文章