R中几个big.matrix对象的逐元素平均值

2024-05-06

我有 17 个文件支持的 big.matrix 对象（暗淡 10985 x 52598，每个 4.3GB），我想计算其中的元素平均值。结果可以存储在另一个big.matrix（gcm.res.outputM）中。

biganalytics::apply() 不起作用，因为 MARGIN 只能设置为 1 或 2。我尝试使用 2 个 for 循环，如下所示

gcm.res.outputM <- filebacked.big.matrix(10958, 52598, separated = FALSE, backingfile = "gcm.res.outputM.bin", backingpath = NULL, descriptorfile = "gcm.res.outputM.desc", binarydescriptor = FALSE)

for(i in 1:10958){
   for(j in 1:52598){
    t <- rbind(gcm.res.output1[i,j], gcm.res.output2[i,j],gcm.res.output3[i,j], gcm.res.output4[i,j],
           gcm.res.output5[i,j], gcm.res.output6[i,j],gcm.res.output7[i,j], gcm.res.output8[i,j],
           gcm.res.output9[i,j], gcm.res.output10[i,j],gcm.res.output11[i,j], gcm.res.output12[i,j],
           gcm.res.output13[i,j], gcm.res.output14[i,j],gcm.res.output15[i,j], gcm.res.output16[i,j],
           gcm.res.output17[i,j])
    tM <- apply(t, 2, mean, na.rm = TRUE)
    gcm.res.outputM[i,j] <- tM
    }
}

每行 i 大约需要 1.5 分钟，因此运行时间约为 11 天。

有谁对如何加快计算速度有任何想法？我使用的是 64x Windows10 计算机，内存为 16GB。

Thanks!

您可以使用以下 Rcpp 代码：

// [[Rcpp::depends(BH, bigmemory, RcppEigen)]]
#include <bigmemory/MatrixAccessor.hpp>
#include <RcppEigen.h>
using namespace Eigen;
using namespace Rcpp;

// [[Rcpp::export]]
void add_to(XPtr<BigMatrix> xptr_from, XPtr<BigMatrix> xptr_to) {

  Map<MatrixXd> bm_from((double *)xptr_from->matrix(),
                        xptr_from->nrow(), xptr_from->ncol());
  Map<MatrixXd> bm_to((double *)xptr_to->matrix(),
                      xptr_to->nrow(), xptr_to->ncol());

  bm_to += bm_from;
}

// [[Rcpp::export]]
void div_by(XPtr<BigMatrix> xptr, double val) {

  Map<MatrixXd> bm((double *)xptr->matrix(),
                   xptr->nrow(), xptr->ncol());

  bm /= val;
}

然后，如果您有相同大小的 big.matrix 对象列表，您可以执行以下操作：

library(bigmemory)
bm_list <- lapply(1:5, function(i) big.matrix(1000, 500, init = i))
res <- deepcopy(bm_list[[1]])
lapply(bm_list[-1], function(bm) add_to(bm@address, res@address))
res[1:5, 1:5]  # verif
div_by(res@address, length(bm_list))
res[1:5, 1:5]  # verif

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

Bigdata

rbigmemory

R中几个big.matrix对象的逐元素平均值的相关文章

mtext：使用布局时较小的标签描述

使用 mtext 作为标签描述与使用 xlab 的作用不同如何使 mtext 标签始终与使用 xlab 时的大小相同无需始终定义 cex 参数在下面的最小示例中两个图的 cex cex lab 1 不过大小不同 layout mat
使用 R 进行语言相关排序

1 如何正确排序任务是根据英文字母对美国州名缩写进行排序但我注意到 R 根据某种操作系统语言或区域设置对列表进行排序例如在我的语言立陶宛语中甚至拉丁语非立陶宛语字母的顺序也与英语字母表中的顺序不同仅比较两个字母表中的非立
使用带有字边界的 mgsub 函数作为替换值

我试图用空格替换向量中字符串元素的子字符串以下是我们正在考虑的向量 test lt c PALMA DE MALLORCA THE RICH AND THE POOR A CAMEL IN THE DESERT SANTANDER SL
将“dplyr::across”与具有多个参数的函数一起使用

我想知道是否有办法使用dplyr across一个需要多个参数的函数如果没有如何执行以下操作dplyr tidyverse library dplyr create a dataframe df lt structure list x1
从R中的序列中随机提取多个连续项

Frag lt seq 1 30000 K lt 9 P lt sample 1 K 1 sys sample lt Frag seq P length Frag K 现在 sys sample 包含 3333 个数字如何在R中随机提取1
R 计算股票的 beta（使用 PerformanceAnalytics CAPM.beta() 函数或 lm() 函数产生意外结果）

我正在尝试使用 PerformanceAnalytics CAPM beta 函数量化 R 中股票的 beta 基准测试与 SPY 结果甚至与我在 Yahoo Google Finance 在线看到的值不接近代码 require Perf
通过 R 连接到 Azure SQL

下面的代码允许我通过 R 连接到 Azure SQL 服务器但是我只能访问主数据库而不能访问我在下面创建的两个数据库表格显示为空白有什么想法吗谢谢 library RODBC library dplyr library DB
如何根据一个值过滤远程表？

我正在做一个filter using in 但 dplyr 翻译查询的方式似乎不正确事实上 in 运算符对于多个值可以正常工作但当仅存在单个元素时则不行在我最初的场景中过滤值是动态的因此我希望有一个在这两种情况下都有效的函数 my
如何找到连续数字的区间开始和结束的位置？

我有一个向量 vec lt c 2 3 5 6 7 8 16 19 22 23 24 连续的数字是 c 2 3 c 5 6 7 8 c 22 23 24 所以第一个向量从 2 开始到 3 结束第二个向量从 5 开始到 8 结束对于第
替换 R 中内置函数的定义？

sparcl 包使用标准 stat 包中的 kmeans 函数我想让它使用我自己的 kmeans 实现一种方法是编辑 sparcl 包本身中的代码我宁愿避免这种情况因为它会很混乱而且我不确定如何在 R 中安装编辑过的代码不幸的是
如何以 HH:MM 表示小数时间

我有一个十进制格式的时间 22 13以小时为单位我想在 R 中将其表达为HH MM 我是说 22 08 贬值秒有人可以帮助我吗语法 02 0f是将值四舍五入为整数并使其始终为 2 个单位所以 7 8分钟将转换为字符 08 x lt
Shiny中的DT：仅更改单行的颜色

我有一个数据集 ID Value 102 306 41 800 101 783 105 193 myID 334 我想将其绘制为数据表其中只有带有 myID 的行为橙色表的其余部分为蓝色看过之后辅助函数 https rstudio g
替换 gtable 中 ggplot 的元素：标签和网格线

我正在学习操纵ggplot对象与gtable 这是我问的一个相关问题用 grid 和 gtable 拆解 ggplot https stackoverflow com questions 27750737 dismantling a gg
如何在r中找到按业务分组的第二高薪水

我想要的是每个企业的输出应该只包含第二高的工资条目例如 customer id name sales firstname lastname income business 6 Priyank Dwivedi 2 Priyank Dwive
使用 rpy2 将 NULL 从 Python 转换为 R

在 R 中经常NULL值用作默认值使用 Python 和 RPy2 如何显式提供NULL争论 None不可兑换 NotImplementedError 字符串 NULL 只会被转换为字符串并在执行过程中导致错误采取以下示例使用tsi
从 R 中的因子记录创建变量

我有点迷失了我有一个如下所示的数据框 tract ageClass count 1 0 4 71 2 0 4 192 3 0 4 81 1 5 8 9 2 5 8 86 3 5 8 42 我想要这样的结果 tract 0 4 5 8 1
ggplot2极坐标图轴标签位置

This is just a extension for a old question ggplot2 polar plot arrows https stackoverflow com questions 10515703 ggplot2
mutate rowSums 排除一列

我有一个像这样的数据框 gt df Source local data frame 4 x 4 a x y z 1 name1 1 1 1 2 name2 1 1 1 3 name3 1 1 1 4 name4 1 1 1 想要通过添加 x
如何在变成因子的变量中保留原始值？

这是一些工作代码来说明我的问题 Categorical variable recorded as numeric integer df1 lt data frame group c 1 2 3 9 3 2 9 1 9 3 2 我有一个分类变
即使设置了语言环境，data.frames中的藏文字符也无法在R控制台中显示（中文可以，矩阵中的藏文可以）

在 R 中藏文字符位于 data frames 中时无法正确显示 gt Sys setlocale LC CTYPE Tibetan 1 Tibetan China 950 gt data frame a a 1

随机推荐

如何从 CustomViewController 中更改 RootViewController（在 AppDelegate 中）？

再会我的应用程序具有在 AppDelegate 中加载的授权表单 SigninController 登录后在 SigninController m 中检查应该出现 TabBarController 作为应用程序的主视图如何将控制器从
BigQuery 数据类型

我正在开始一个新项目只是想在定义表模式之前进行验证 BigQuery 是否支持以下以外的其他功能 string integer float boolean BigQuery 数据类型官方文档 https cloud google com
python 中打印变量和字符串

好吧我知道如何打印变量和字符串但是我如何打印类似我的字符串 card price 的内容它是我的变量我的意思是这是我的代码 print I have and here I would like to print my varia
如何在 Dart 中打印美元符号 $

我实际上需要在 Dart 中在变量之前打印一个美元符号例如 void main int dollars 42 print I have dollars I have 42 我希望输出为我有 42 美元我怎样才能做到这一点谢谢飞镖弦
Java：删除链表中的所有元素

Java中如何删除链表中的所有元素without使用已经可用的clear 方法这项练习的灵感来自于电话采访中收到的一个问题说我可以用 C 来做这个 void DeleteAllElement ListElement head ListE
用于分享帖子的 Yammers REST API

我想使用 REST API 从我的业务应用程序共享帖子不是发布新消息而是共享现有帖子有谁知道要使用哪个端点以及如何实现它当您使用 Yammer API 创建新帖子时请将参数 shared message id 与要共享的消息的 m
为什么 justify-content 不以我的 div 为中心？

我试图将两个 div 水平居中放在爸爸 div 内爸爸 div 设置为flex direction column因为我希望子 div 一个在另一个之下但位于页面的中心 justify content center 应该做但不起作用我终
如何注释 .tsx 文件中的属性？

给出以下 JSX 代码 div div 我怎样才能注释掉className my class className my class 不起作用 className my class 不起作用 TS1005 expected className
如何在Azure数据工厂中传递不记名令牌API

我有一个 API 它具有授权和不记名令牌我在邮递员中进行了测试它正在工作但是当我在 ADF 中使用 Web 活动时它不起作用我在 URL 部分传递 url 创建新标头输入授权并指定值 Bearer token 出现以下错误 E
有没有办法找到哪些 .NET 类实现了某个接口？

例如如果我想查看我的 NET 选项用于实现 IList 或 IDictionary 有没有办法找到它例如在 MSDN 文档中我认为可以使用反射器 http www red gate com products reflector
玩笑测试因 refs 和 Form 失败

我有一个搜索栏组件如下所示 render const onChangeTextInput this props return
如何在 TargetFrameworks 标记中每个框架运行一次的目标之前创建仅运行一次而不是一次的 MSBuild 目标？

我有一个我部分拥有的代码生成器工具现在 csproj 文件可以在其中列出多个目标框架并构建所有这些框架我试图弄清楚如何使 MSBuild 目标仅在每个目标中生成一次代码无论列出了多少个目标框架都将运行构建并让每个目标框架的编译等待代
web请求超时处理？

HttpWebRequest request HttpWebRequest WebRequest Create url request Timeout 20000 using WebResponse response request Get
Gradle 环境变量。从文件加载

我是 Gradle 新手目前我有这个任务 task fooTask doLast exec environment FOO KEY 1234567 Load from file here commandLine fooScript sh
使用 WGET 运行 cronjob PHP

我尝试执行一个 cron 并每 5 分钟运行一个 url 我尝试使用 WGET 但我不想下载服务器上的文件我只想运行它这是我使用的 crontab 5 wget http www example com cronit php 除了 wg
Material UI 自动完成弹出窗口自定义在单击时关闭

我正在尝试通过覆盖来向 Material UI 自动完成纸张添加一个按钮PaperComponentprop并在论文的按钮处添加了一个按钮但是点击该按钮会自动关闭自动完成搜索结果如何防止自动完成搜索结果 Paper 在单击时关闭这是一
为什么要在注释中声明 PHP 变量类型？

我对 PHP 还很陌生我刚刚开始使用 NetBeans 来开发我的 PHP 代码出乎意料的是当我在查询中输入变量时会弹出一个对话框要求我完成注释以保存变量类型我做了一些调查发现这似乎是 NetBeans 的一个流行功能但我找
快速 shell 命令删除文本文件中的停用词

我有一个 2GB 的文本文件我正在尝试从此文件中删除经常出现的英语停用词我有 stopwords txt 包含这样的 a an the for and I 使用 shell 命令例如 tr sed 或 awk 执行此操作的快速方法是什
可重复的随机数系列

如何在 PHP 中获得一系列可重复的伪随机数在旧版本的 PHP 中我只需在RNG http en wikipedia org wiki Random number generation 但它不再起作用了因为 PHP 改变了 rand
R中几个big.matrix对象的逐元素平均值

我有 17 个文件支持的 big matrix 对象暗淡 10985 x 52598 每个 4 3GB 我想计算其中的元素平均值结果可以存储在另一个big matrix gcm res outputM 中 biganalytics ap

R中几个big.matrix对象的逐元素平均值

R中几个big.matrix对象的逐元素平均值 的相关文章

随机推荐

热门标签

R中几个big.matrix对象的逐元素平均值的相关文章