R bootstrap 按组与数据表加权平均值

2024-03-31

我正在尝试结合两种方法：

以可扩展的方式引导 data.table 中的多个列 https://stackoverflow.com/questions/38989932/bootstrapping-multiple-columns-in-data-table-in-a-scalable-fashion-r

with

R 中的 Bootstrap 加权平均值 https://stackoverflow.com/questions/46231261/bootstrap-weighted-mean-in-r

这是一些随机数据：

## Generate sample data

# Function to randomly generate weights
set.seed(7)
rtnorm <- function(n, mean, sd, a = -Inf, b = Inf){
qnorm(runif(n, pnorm(a, mean, sd), pnorm(b, mean, sd)), mean, sd)
}

# Generate variables
nps    <- round(runif(3500, min=-1, max=1), 0) # nps value which takes 1, 0 or -1
group  <- sample(letters[1:11], 3500, TRUE) # groups
weight <- rtnorm(n=3500, mean=1, sd=1, a=0.04, b=16) # weights between 0.04 and 16

# Build data frame
df = data.frame(group, nps, weight)

# The following packages / libraries are required:
require("data.table")
require("boot")

这是上面第一篇文章中增强加权平均值的代码：

samplewmean <- function(d, i, j) {
  d <- d[i, ]
  w <- j[i, ]
  return(weighted.mean(d, w))   
}

results_qsec <- boot(data= df[, 2, drop = FALSE], 
                     statistic = samplewmean, 
                     R=10000, 
                     j = df[, 3 , drop = FALSE])

这完全没问题。

下面是上面第二篇文章中的代码，通过数据表中的组引导平均值：

dt = data.table(df)
stat <- function(x, i) {x[i, (m=mean(nps))]}
dt[, list(list(boot(.SD, stat, R = 100))), by = group]$V1

这也很好用。

我很难结合这两种方法：

跑步 …

dt[, list(list(boot(.SD, samplewmean, R = 5000, j = dt[, 3 , drop = FALSE]))), by = group]$V1

... 出现错误消息：

Error in weighted.mean.default(d, w) : 
  'x' and 'w' must have the same length

跑步 …

dt[, list(list(boot(dt[, 2 , drop = FALSE], samplewmean, R = 5000, j = dt[, 3 , drop = FALSE]))), by = group]$V1

…引发了一个不同的错误：

Error in weighted.mean.default(d, w) : 
  (list) object cannot be coerced to type 'double'

我仍然无法理解 data.table 中的参数以及如何组合运行 data.table 的函数。

我将不胜感激任何帮助。

这与如何data.table在函数的范围内运行。 d 仍然是data.table within samplewmean即使在子集化之后i然而weighted.mean期望权重和值的数值向量。如果你unlist打电话之前weighted.mean，您将能够修复此错误

Weighted.mean.default(d, w) 中的错误：（列表）对象不能被强制输入“double”

在传递之前取消列出的代码weighted.mean:

samplewmean <- function(d, i, j) {
  d <- d[i, ]
  w <- j[i, ]
  return(weighted.mean(unlist(d), unlist(w)))   
}

dt[, list(list(boot(dt[, 2 , drop = FALSE], samplewmean, R = 5000, j = dt[, 3 , drop = FALSE]))), by = group]$V1

A more data.table-like (data.table version >= v1.10.2) 语法大概如下：

#a variable named original is being passed in from somewhere and i am unable to figure out from where
samplewmean <- function(d, valCol, wgtCol, original) {
    weighted.mean(unlist(d[, ..valCol]), unlist(d[, ..wgtCol]))
}

dt[, list(list(boot(.SD, statistic=samplewmean, R=1, valCol="nps", wgtCol="weight"))), by=group]$V1

或者另一种可能的语法是：（参见数据表常见问题解答 1.6 https://rawgit.com/wiki/Rdatatable/data.table/vignettes/datatable-faq.html#ok-but-i-dont-know-the-expressions-in-advance.-how-do-i-programatically-pass-them-in)

samplewmean <- function(d, valCol, wgtCol, original) {
    weighted.mean(unlist(d[, eval(substitute(valCol))]), unlist(d[, eval(substitute(wgtCol))]))
}

dt[, list(list(boot(.SD, statistic=samplewmean, R=1, valCol=nps, wgtCol=weight))), by=group]$V1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

statisticsbootstrap

R bootstrap 按组与数据表加权平均值的相关文章

使用字符串中的变量名称访问变量值，R

Intro 一个数据集有大量的age year变量 age 1990 age 1991 etc 我有一个字符串值数组length age years 表示这些变量使得age years 1 回报 age 1990 etc Need 我想搜
无法更新/编辑从 R 中的包（`gratia`）导出的 ggplot2 对象

我希望我在这里遗漏了一些令人痛苦的明显的东西我希望更新例如修复标题实验室等由生成的 ggplot 对象gratia draw 不太确定为什么我无法更新该对象有一个简单的解决方案吗 devtools install github
Quantmod 的简单功能不再起作用

我明天要交论文我收到了一条关于 quantmod 的非常奇怪的错误消息这是我在过去几周使用这个包时从未遇到过的我无法导入特定于道琼斯指数 DJI 的数据我收到以下错误消息 getSymbols DJI src yahoo from
列出 R 数据文件的内容而不加载

我有时用print load myDataFile RData 当我加载数据文件时列出它的内容有没有办法列出内容而不加载数据文件中包含的对象我认为如果不加载对象就无法做到这一点解决方案可能是使用包装器将 R 对象保存到save 该函数
访问或解析 R 中的 summary() 中的元素

我运行以下 R 命令来进行 Dunnett 测试并获取摘要如何访问下面线性假设的每一行这是摘要输出的一部分基本上我不知道摘要的结构我尝试使用名称但它似乎不起作用因为我没有看到任何命名属性来提供这一点 library multco
R 闪亮仪表板中的动态重复条件面板

我正在尝试创建一个动态条件面板所以我的条件如下在用户界面中输入 selectInput inpt Input Number seq 1 50 1 selectize FALSE 我的条件面板 UI 输入是 conditionalPane
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
如何按用户定义（例如非字母顺序）对数据框进行排序[重复]

这个问题在这里已经有答案了给定一个数据框dna gt dna chrom start chr2 39482 chr1 203918 chr1 198282 chrX 7839028 chr17 3874 以下代码重新排序dna by ch
`as.matrix` 和 `as.data.frame` S3 方法与 S4 方法

我注意到定义as matrix or as data frame作为 S4 类的 S3 方法使例如lm formula objS4 and prcomp object 开箱即用如果它们被定义为 S4 方法则这不起作用为什么将方法定义
更新 R6 对象实例中的方法定义

如何更新 R6 类实例的方法定义正如我所期望的 S3 使用当前的方法定义对于 R5 参考类我可以使用 myInstance myInstance copy 在 R6 中我尝试了 myInstance myInstance clone
sapply - 保留列名称

我试图总结数据集中许多不同列变量的平均值标准差等我已经编写了自己的汇总函数以准确返回我需要和正在使用的内容sapply立即将此函数应用于所有变量它工作正常但是返回的数据帧没有列名我似乎甚至无法使用列号引用重命名它们也就是说
R - 重塑 - 熔化错误

我正在尝试融化数据框但出现了这个奇怪的错误有什么想法吗 str zx7 data frame 519 obs of 5 variables calday new Date format 2011 01 03 2011 01 04 201
如何声明包含 M 个元素的列表对象

我想声明一个包含 M 3 x 3 矩阵的列表如果我事先知道数字 M 那么我可以通过以下方式声明这样的列表 elm lt matrix NA 3 3 Say M 7 myList lt list elm elm elm elm elm el
在r中的某个阈值处破坏 cumsum() 函数

例如我有以下代码 cumsum 1 100 我想打破它如果一个元素 i 1 大于3000 我怎样才能做到这一点因此而不是这个结果 1 1 3 6 10 15 21 28 36 45 55 66 78 91 105 120 136 15
如何按定义的顺序将图像合并到一个文件中

我有大约 100 张图像 png 我不想手动执行此操作而是希望将它们按照定义的顺序基于文件名并排放置在一个 pdf 中每行 12 个图像有人有什么建议吗我按照下面托马斯告诉我的方法尝试了它把它们贴在旁边有一个黑边我怎样才能去
在 RMarkdown 输出到 PDF 时缩进而不添加项目符号点或编号

之前有人问过如何在没有项目符号的情况下缩进文本 RMarkdown 中的点但这是针对 HTML 输出的在 RMarkdown 中缩进而不添加项目符号点或数字 https stackoverflow com questions 47087
使用选定因子水平的值向 ggplot-barchart 添加水平线

在这个情节中 df lt data frame factor as factor c rep A 3 rep B 3 Treatment c rep c A B C 2 values runif 6 0 1 ggplot df aes Tr
要在子集中显示的非数字条目的维恩图

我有以下数据框 SET1 SET2 SET3 par1 par2 par1 par2 par3 par2 par3 par4 par5 我想制作一个维恩图其中所有这些 parX 元素都显示在各自的子集中即作为标签而不仅仅是重叠元素的数
当设置 coord_fixed 时，ggplot/shiny 中的鼠标悬停坐标是错误的

我正在使用问题中的答案当您将鼠标悬停在闪亮的 ggplot 上时出现工具提示 https stackoverflow com questions 27965931 tooltip when you mouseover a ggplot o
当将遗传算法与 lme4 一起使用时，glmulti 无限期运行

我在 R 中使用 glmulti 进行模型平均我的模型中有大约 10 个变量使得详尽的筛选不切实际因此我需要使用遗传算法 GA 调用 method g 我需要包含随机效应因此我使用 glmulti 作为 lme4 的包装器此处提供

随机推荐

Oracle 10g PL/SQL Connect By Prior 返回同一行上的子级和父级

Table1 Child Parent a Bob Chris 2 Chris Kate 1 Shane Lana 3 Nala Bob 4 Table2 b Talent 1 something 2 nothing 3 something
CurrentThreadTaskScheduler 未完成同步

我尝试为视图模型编写单元测试但在尝试验证 ICommand 调用异步方法两次时遇到了困难我使用 Moq 作为我的依赖项我像这样设置了异步方法 this communicationServiceFake Setup x gt x Wri
将列表的 2 个数据框中的因子转换为数值

我在将列表中 2 个数据框的列转换为数字时遇到问题现在两个数据框都有 2 列由因素组成我想将它们转换为数字以便我可以对它们进行数学运算下面是示例代码 library XML bal lt http www baseball refe
为什么不总是使用 HTTP post 进行 ajax 调用？

我知道 HTTP get 和 post 方法之间的区别如详细信息中所述this https stackoverflow com questions 46585 when do you use post and when do you us
如何在 GWT 中实现 JQueryUI 滑块

我最近需要在 GWT 中实现一个滑块来捕获用户在任务上取得的进度百分比我对 GWT 孵化器中的滑块并不满意并且不太热衷于使用 spiffy UI 或 SmartGWT 等外部库我可以使用哪些替代方案在 GWT 中实现有效的滑块而不需
Spark：在不更改列的可为空属性的情况下转换小数

将列转换为DecimalType in a DataFrame似乎改变了可为空的属性具体来说我有一个不可为空的类型列DecimalType 12 4 我把它投射到DecimalType 38 9 using df withColumn
2d(3d) 坐标的哈希图（即双精度向量）？

我想知道是否有一个通用的全能解决方案hash map对于坐标 2d 或 3d 即双精度向量一个例子here https stackoverflow com questions 7222143 unordered map hash func
如何从 POSIX 文件描述符构造 C++ fstream？

我基本上是在寻找 fdopen 的 C 版本我对此做了一些研究这是看起来应该很容易但事实证明非常复杂的事情之一我是否在这个信念中遗漏了一些东西即它真的很容易如果没有是否有一个好的图书馆可以处理这个问题编辑将我的示例解决方案移
通过 XSLT 用 XHTML 中的标签替换 style= 属性

假设我在 XHTML 页面中有以下内容 span style color 555555 font style italic some text span 我将如何将其转换为 span style color 555555 em some t
Python Tkinter GUI 自动化

我想进入 GUI 自动化领域以便在我自己的程序上运行测试我想要测试的程序是用 Python 编写的并使用 Tkinter 作为 GUI 测试代码不一定必须是Python CPP 也可以我做了一些研究我已经面临一个问题根据我的研究
找不到 sbt 启动器 0.11.2

我有一个Play 2 0使用的应用程序sbt 0 11 2 但是当我建立一个新的Play服务器它抓取了最新版本sbt 0 11 3 现在当我跑步时sbt compile在新服务器上它抱怨 Detected sbt version 0 1
更改 python mechanize 中的链接

我正在尝试编写一个 python 脚本来生成我的批次的排名列表为此我只需使用网络浏览器中的检查元素功能更改链接的卷号参数链接相对看起来像 academic utility AcademicRecord jsp loginCode
C# txt 文件配置中的 Mysql 连接

我正在学习 C 付出了很多努力我已经能够创建一个小型系统在 Linux 服务器上的 Mysql 数据库中查询和插入信息到目前为止一切顺利但我想避免必须不断重复与数据库的连接代码或更改服务器数据库用户密码端口等连接信息我真
Windows 上的 git shell 报告“sh.exe 已停止工作 (APPPCRASH)”

我已经尝试过安装的 Git shellGitHub http windows github com 以及提供的适用于 Windows 的 Git http msysgit github io 在 XenServer 6 20 上的 Wind
在计算 networkx 中的传出和传入边缘时，len 抛出的“dict_keyiterator”没有 len()

我正在实现一个图形操作脚本我对以下错误感到困惑 Traceback most recent call last File py line 12 in
具有材质颜色的三个 js 动画搅拌机模型

我有一个导出的三个 js json 格式搅拌机模型该模型有一些带有颜色的材料如果我使用 THREE MorphAnimMesh 和 THREE MeshPhongMaterial 动画工作正常但没有材质颜色如果我使用 THREE
读取超过 2^18 字节的惰性字节串时发生段错误

考虑以下代码 http hpaste org 90394 http hpaste org 90394 我正在将一个 460mb 的大文件内存映射到一个惰性 ByteString ByteString 报告的长度471053056 When
我的 Sql server 2008 r2 中的无符号短数据类型

我想将端口号存储在我的 SQL Server 数据库中一般来说任何端口的值都可以是 0 到 65 535 并在以下链接上http msdn microsoft com en us library s3f49ktz 28v vs 71 2
编辑时更改 uitextfield 返回键类型

我有 4 个 uitextfields 可以识别它们何时为空或完整如果完成他们会将返回键类型更改为 GO 否则为默认类型问题是即使我使用 reloadinputview 键盘也不会更改按键类型 void viewDidLoad sup
R bootstrap 按组与数据表加权平均值

我正在尝试结合两种方法以可扩展的方式引导 data table 中的多个列 https stackoverflow com questions 38989932 bootstrapping multiple columns in data

R bootstrap 按组与数据表加权平均值

R bootstrap 按组与数据表加权平均值 的相关文章

随机推荐

热门标签

R bootstrap 按组与数据表加权平均值的相关文章