多列的加权平均值，按组（在 data.table 中）

2024-03-12

这个问题紧接着另一个问题组加权平均值 https://stackoverflow.com/questions/14145859/weighted-means-by-group-and-column：我想使用创建加权组内平均值data.table。与最初问题的不同之处在于，要平均的变量名称是在字符串向量中指定的。

数据：

df <- read.table(text= "
          region    state  county  weights y1980  y1990  y2000
             1        1       1       10     100    200     50
             1        1       2        5      50    100    200
             1        1       3      120    1000    500    250
             1        1       4        2      25    100    400
             1        1       4       15     125    150    200
             2        2       1        1      10     50    150
             2        2       2       10      10     10    200
             2        2       2       40      40    100     30
             2        2       3       20     100    100     10
", header=TRUE, na.strings=NA)

使用罗兰在上述问题中的建议答案：

library(data.table)
dt <- as.data.table(df)
dt2 <- dt[,lapply(.SD,weighted.mean,w=weights),by=list(region,state,county)]

我有一个带有字符串的向量来动态确定我想要组内加权平均值的列。

colsToKeep = c("y1980","y1990")

但我不知道如何将它作为 data.table 魔法的参数传递。

I tried

 dt[,lapply(
      as.list(colsToKeep),weighted.mean,w=weights),
      by=list(region,state,county)]`

但我然后得到：

Error in x * w : non-numeric argument to binary operator

不知道如何实现我想要的。

额外问题：我希望保留原始列名称，而不是获取 V1 和 V2。

注意我使用 data.table 包的 1.9.3 版本。

通常，您应该能够执行以下操作：

dt2 <- dt[,lapply(.SD,weighted.mean,w=weights), 
          by = list(region,state,county), .SDcols = colsToKeep]

即，只需将这些列提供给.SDcols。但目前，这行不通由于错误 https://github.com/Rdatatable/data.table/issues/495，在那里面weights列将不可用，因为它未在中指定.SDcols.

在修复之前，我们可以按如下方式完成此操作：

dt2 <- dt[, lapply(mget(colsToKeep), weighted.mean, w = weights), 
            by = list(region, state, county)]
#    region state county     y1980    y1990
# 1:      1     1      1  100.0000 200.0000
# 2:      1     1      2   50.0000 100.0000
# 3:      1     1      3 1000.0000 500.0000
# 4:      1     1      4  113.2353 144.1176
# 5:      2     2      1   10.0000  50.0000
# 6:      2     2      2   34.0000  82.0000
# 7:      2     2      3  100.0000 100.0000

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

多列的加权平均值，按组（在 data.table 中）的相关文章

Shiny可以识别用鼠标选择的文本（突出显示的文本）吗？

我需要用户将文本片段分配给 Shiny 中的类别或代码基本上我希望用户突出显示输出中的文本在下面的示例中来自table or text输出然后按一个按钮 code 并将选定的文本分配给应用程序内的对象在下面的应用程序中所选文
有没有一种简单的方法可以根据多个标准进行排名，从而保留 R 中的联系？

当单个标准排序良好时 rank 函数会返回明显的结果 rank c 2 4 1 3 5 1 2 4 1 3 5 当单个标准具有联系时排名函数默认情况下将平均排名分配给联系 rank c 2 4 1 1 5 1 3 0 4 0 1 5
ggplot2 - 添加具有不同中断和标签的辅助 y 轴

是否可以使用 ggplot2 手动向辅助 y 轴添加中断和标签 see bottom right 我希望在右侧 y 轴上有更紧凑的中断代表条形该图将作为基本情况然后我将展示如何更改辅助 y 轴上的分隔符和标签 sapply c pip
kmeans 对分组数据进行聚类

目前我尝试在分组数据中找到簇的中心通过使用示例数据集和问题定义我能够创建kmeans每个组内的集群然而当涉及到给定组的集群的每个中心时我不知道如何获取它们 https rdrr io cran broom man kmeans
warnings() 在函数内不起作用？如何解决这个问题？

op lt options warn 0 although doesn t work for any value of warn assign last warning NULL envir baseenv thisDoesntWork l
如何将 R 数据框中的多个字符列合并为单个列

我正在处理人口普查数据需要将四个字符列合并为一列 Example LOGRECNO STATE COUNTY TRACT BLOCK 60 01 001 021100 1053 61 01 001 021100 1054 62 01 00
如何在 R 中只为直方图的一个标签着色？

我有一个像这样的数据框 CellLines ZEB1 600MPE 2 8186 AU565 2 783 BT20 2 7817 BT474 2 6433 BT483 2 4994 BT549 3 035 CAMA1 2 718 DU447
R：根据元素长度从向量中删除元素

如何根据字符串的字符数或长度从字符串向量中删除元素 df lt c asdf fweafewwf af aewfawefwef awefWEfawefawef gt df 1 asdf fweafewwf af aewfawefwef aw
访问 R 工作区中的数据[重复]

这个问题在这里已经有答案了我是自学 R 的可能有一些非常基本的东西我可能不熟悉如果是这样我道歉我正在尝试访问外部来源提供给我的数据它作为一个工作空间出现我的流程如下 gt ls 1 2003OHT HR gt attach 20
ggplot 图例标签内的希腊字母、符号和换行符

我在尝试着有换行符自动或强制对齐文本左对齐或左右对齐有希腊字母和百分号在 gglot 图例标签内我尝试了几种方法但我似乎无法将我读到的所有技巧结合起来我可以通过插入来换行 n进入标签但这似乎不适用于希腊字母不适用于图例
将不同的 grViz 组合成一个图

我想结合不同的DiagrammeR绘制成一个图形生成的图如下例所示 library DiagrammeR pDia lt grViz digraph boxes and circles a graph statement graph ov
R闪亮主面板显示样式和字体

我正在学习闪亮的应用程序并且有一些关于调整布局的基本问题特别是样式和字体希望得到指点或明确的答案谢谢考虑一个基本的输入输出应用程序用户在 sidebarPanel 中输入数据然后在 mainPanel 中反应性地输出结果如何
为每个因素级别添加日期时间序列

我有一个带有因子列的数据框 s lt data frame id 901 910 s id lt as factor s id 我有一个日期时间序列 library lubridate start lt now as difftime 2
改进R中从google获取股票新闻数据的功能

我已经编写了一个函数来从 Google 获取和解析给定股票代码的新闻数据但我确信有一些方法可以改进它对于初学者来说我的函数返回一个 GMT 时区的对象而不是用户当前的时区如果传递的数字大于 299 它就会失败可能是因为 goog
如何在R中匹配具有相同主键的两个表中的数据

我有两个表其中包含有关人员的数据 df1 lt data frame id c 113 202 377 288 359 name c Alex Silvia Peter Jack Jonny 这为我提供了 id name 1 113 Al
如何读取 R 中的每个 .csv 文件并将其导出到单个大文件中

你好我有以下格式的数据 101 20130826T155649 3 1 round 0 10552 180 yellow 12002 1 round 1 19502 150 yellow 22452 1 round 2 28957 130
在 R 中使用逻辑 grep 抓取文本

下午好谢谢你帮我解答这个问题我有兴趣抓取一组超过 5000 个 URL 的列表我使用 lapply 和 readLines 使用下面的示例代码提取这些网页的文本 multipleURL lt c http dailymed nlm n
如何从数据框中删除少于 5 个观察值的个体 [重复]

这个问题在这里已经有答案了为了澄清这个问题我将简要描述数据中的每一行data frame是一个观察值列代表与该观察值相关的变量包括观察到什么个体观察时间观察地点等我想排除过滤观察值少于 5 个的个体换句话说如果 in
R data.table fwrite 到 fread 空间分隔符并清空

我在使用 fread 以作为分隔符和散布的空白值时遇到问题例如这个 dt lt data table 1 5 1 5 1 5 make a simple table dt 3 V2 NA add a blank in the midd
R data.table 1.9.2 关于 setkey 的问题

这似乎是 1 8 10 后引入的一个错误与包含列表的 DT 的 setkey 相关运行下面两个代码来查看问题 library data table dtl lt list dtl 1 lt data table scenario 1 p

随机推荐

使用 loadData 在 UIWebView 中显示 PDF

我正在尝试显示本地存储在 UIWebView 中的 PDF 这就是我目前尝试执行此操作的方式 if NSFileManager defaultManager fileExistsAtPath self url LOG ERROR Could
如何返回 JsonResult [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我在编写这个 AJAX 方法时遇到问题我想返回一个JsonResult 似乎是合乎逻辑的事情我能找到的所有例子都可以使用Jso
在Python中访问第n维[重复]

这个问题在这里已经有答案了我想要轻松读取多维 numpy 数组的某些部分对于任何数组访问第一维都很容易 b index 另一方面访问第六维度是困难的尤其是阅读 b index the next person to read th
角度 HTTP POST 请求

我在 Angular2 和 Spring MVC 中构建一个应用程序当我尝试向我的服务器发出 POST 请求时我没有收到任何成功或失败的迹象但请求没有发生因为我看不到新的数据当我从邮递员那里发出请求时请求成功我可以看到新数据
什么时候应该使用 MySQLi 而不是 MySQL？

有人可以帮我解释一下使用 MySQLi 而不是 MySQL 的优点和缺点吗是否存在不应该使用 MySQLi 的情况为了使用 MySQLi 我是否需要以不同的方式配置我的服务器例如我是否需要升级 Apache 或 PHP 才能支持 M
如何创建带有百分比计数器的 jQuery 预加载器？

我编写了从一本 jQuery 初学者书中学到的代码它非常适合作为页面的预加载器但我如何为其创建百分比计数器呢基于加载了多少正文内容目前我只有一个动画 GIF 但我想要一些更高级的东西 Lets preload window loa
使用转换器和提供程序而不是属性映射时如何让 ModelMapper.validate() 成功？

有类似的东西 Getter Setter public static class Entity private int hash private LocalDateTime createdTime and Getter Setter pub
调用 oncontextmenu 时 Firefox 浏览器的事件未定义

我在右键单击页面中的按钮时显示上下文菜单用于显示上下文菜单的代码是 window addEventListener contextmenu function e e preventDefault false 当我右键单击按钮时调用的上下
解决 git merge octopus 上的冲突

章鱼合并是指合并2个以上的头用户应该如何使用普通的三向合并工具比较文件 3 个文件被传递到合并工具 BASE LOCAL REMOTE 3 个头需要多少个以及什么组合在这种情况下您不应该使用章鱼合并八达通合并仅应在不存在合并冲突或冲
setInterval 使用 Electron 一小时后停止

希望有人能在这里指出我正确的方向我的电子应用程序需要每 10 分钟左右执行一次 API 调用目前我在渲染器进程中使用 setInterval 循环来执行此操作该循环每 10 分钟触发一次它通常工作得很好几个小时后似乎就停止了我
Android Studio 在创建新活动时“发生 IDE 错误”

更新见底部由于 Android Studio 将自身更新到 v3 0 我无法创建新的 Activity 我收到此错误报告对话框显示 2 个错误我尝试了不同的项目尝试清理项目重新同步 gradle 重新启动计算机卸载重新安装 A
strdup()：对警告感到困惑（“隐式声明”、“使指针...无需强制转换”、内存泄漏）

当我编译下面的一小段代码其中我们定义一个字符串然后使用 strdup 来制作副本时我收到 3 个警告来自 GCC 的 2 个编译器警告和来自 valgrind 的 1 个运行时警告错误我怀疑内存泄漏错误由 valgrind
x86-SSE 中四个压缩单精度浮点到无符号双字的转换

有没有办法将四个打包单精度浮点值转换为具有 SSE 扩展的 x86 中的四个双字最接近的指令是CVTPS2PI 但它不能在两个 xmm 寄存器上执行而是应该给出为CVTPS2PI MM XMM M64 如果我想要类似的东西怎么办
R metaMDS 排序距离

我一直在对不同采样点的丰富物种数据集进行一些排序我在用metaMDS 素食主义者可以做到这一点通过此功能您可以直接输入群落数据行中的站点和列中的物种并指定您希望使用的距离类型即 jaccard brays curtis euc
Linux 上的 OpenCL，集成英特尔图形芯片

我想用OpenCL在 Debian 8 上我读到在本页 http streamcomputing eu blog 2011 12 29 opencl hardware support Linux 上不支持 Intel 的 GPU 这篇文章
XCode 4.5 警告父/子类的类别之间的方法名称冲突

我正在开发一个最初使用 XCode 4 0 构建的项目然后迁移到使用 XCode 4 2 现在我已经测试了迁移到 XCode 4 5 并且收到了大量如下警告 instance method values in category from
如何将模型数据对象数组转换为dataProvider

假设我有模型User与其自身有多对多的关系命名为friends so user gt friends or model gt friends在视图中给了我一个数组User对象我想将朋友显示为网格视图但CGridView数据为data
在二维动画上绘制可变大小和位置的圆圈

我正在 Python 3 3 中使用 matplotlib 我有一个动画 2d 和 3d 窗口我在上面画点这些点代表物体但不确定它们是否真的存在所以我想围绕这些点画一个圆圈来显示不确定性这种不确定性是变化的所以底线是我想在 2
JavaScript 中可以编写连续的嵌套函数吗？

我知道这就是封闭的领域但是可以连续调用嵌套的匿名函数吗假设我有这个 function testing input var testing 0 function testing testing 1 return testing 我们可以有
多列的加权平均值，按组（在 data.table 中）

这个问题紧接着另一个问题组加权平均值 https stackoverflow com questions 14145859 weighted means by group and column 我想使用创建加权组内平均值data table

多列的加权平均值，按组（在 data.table 中）

多列的加权平均值，按组（在 data.table 中） 的相关文章

随机推荐

热门标签

多列的加权平均值，按组（在 data.table 中）的相关文章