如何在R中的“foreach”循环中转换“for循环”？

2024-04-05

我正在处理一个需要并行计算以获得比经典“for 循环”更快的结果的问题。

问题是这样的：

我需要为列表对象内的数据帧中包含的 198135 个结果变量生成线性模型。我必须将模型中每个预测变量的所有 beta 和 p 值以及它们的拟合优度度量存储在数据框中。

我编写了一个功能性“for 循环”，可以正确完成该任务，但完成它需要超过 35 个小时。我知道 R 使用了我的 8 核 CPU 的不到 20%，但我想全部使用。问题是我不知道如何将 for 循环转换为 foreach 循环以利用并行计算。

这是我的问题的一些较小规模的示例代码：

library(tidyverse)
library(broom)

## Example data 

outcome_list <- list(as.data.frame(cbind(rnorm(32), dataframe_id = c(1))),
                     as.data.frame(cbind(rnorm(32), dataframe_id =  c(2))),
                     as.data.frame(cbind(rnorm(32), dataframe_id =  c(3)))) ## This represents my list of 198135 dataframes

mtcars <- mtcars #I will use the explanatory variables from here



## Below this line is my current solution with a for loop that works fine

x <- list()
results_df <- as.data.frame(cbind(dataframe_id = c(0), intercept = c(0),
                                b_mpg = c(0), p_mpg = c(0),
                                b_cyl = c(0), p_cyl = c(0),
                                p.model = c(0), AIC = c(0),
                                BIC = c(0)))

for(i in 1:3){
  x[[i]] <- lm(outcome_list[[i]]$V1 ~ mtcars$mpg + mtcars$cyl)
  gof <- broom::glance(x[[i]])
  betas <- broom::tidy(x[[i]])
  results_df <- rbind(results_df, c(outcome_list[[i]]$V2[1], 
                                    betas$estimate[1],
                                    betas$estimate[2], betas$p.value[2], 
                                    betas$estimate[3], betas$p.value[3],
                                    gof$p.value, gof$r.squared, gof$AIC,
                                    gof$BIC))

  if(i %% i == 0){
    message(paste(i, "of 3")) # To know if my machine has not crashed
    x <- list() # To keep RAM clean of useless data
  }
  gc()
}

results_df <- results_df[-1, ]

通过上面显示的代码，我得到了我需要的结果（具有回归参数和列表中每个结果变量的拟合优度的数据框），但它非常慢，因为我无法使用我所有的计算机能力。

我知道使用“foreach”和“doParallel”包可以更快地解决这个问题，但我仍然不明白foreach循环结构背后的逻辑，因为这是我第一次需要处理这么多数据。

PS：我已经尝试了几种使用 foreach 函数的方法，但没有取得任何进展。我没有写我的 foreach 解决方案尝试，因为我不明白我在做什么。

你可以做：

## Example data 
outcome_list <- list(as.data.frame(cbind(rnorm(32), dataframe_id = c(1))),
                     as.data.frame(cbind(rnorm(32), dataframe_id = c(2))),
                     as.data.frame(cbind(rnorm(32), dataframe_id = c(3))))

## Parallel code
library(doParallel)
registerDoParallel(cl <- makeCluster(3))
results_list <- foreach(i = 1:3) %dopar% {

  mylm <- lm(outcome_list[[i]]$V1 ~ mtcars$mpg + mtcars$cyl)
  gof <- broom::glance(mylm)
  betas <- broom::tidy(mylm)

  c(outcome_list[[i]]$V2[1], 
    betas$estimate[1],
    betas$estimate[2], betas$p.value[2], 
    betas$estimate[3], betas$p.value[3],
    gof$p.value, gof$r.squared, gof$AIC,
    gof$BIC)
}
stopCluster(cl)

results_df <- setNames(as.data.frame(do.call("rbind", results_list)),
                       c("dataframe_id", "intercept", "b_mpg", "p_mpg", 
                         "b_disp", "p_disp", "p.model", "AIC", "BIC"))

您在 foreach 中返回结果（其工作方式类似于 lapply），而不是增长对象（顺便说一句，这在并行中是不可能的）。

了解有关如何使用 foreach 的更多信息there https://privefl.github.io/blog/a-guide-to-parallelism-in-r/.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

foreach

parallelprocessing

如何在R中的“foreach”循环中转换“for循环”？的相关文章

在 Shiny 应用程序中更改 bsModal 的背景

我正在开发一个 Shiny 应用程序我需要确保最终用户不会意外关闭 bsModal 因为它上面有一些操作按钮我做了一些研究并了解到我需要覆盖背景和键盘参数但即使我看到了一些建议我也不知道这到底需要放在我的代码中的哪里我不精通 Ja
如果 RCurl::getURL() 执行时间太长，如何停止执行？

有没有办法告诉 R 或 RCurl 包在超过指定时间段时放弃尝试下载网页并转到下一行代码例如 gt library RCurl gt u http photos prnewswire com prnh 20110713 NY34814 b
R 监督潜在狄利克雷分配包

我在用着这个LDA包 https cran r project org web packages lda 对于 R 具体来说我正在尝试做监督潜在狄利克雷分配 slda https www cs princeton edu blei pap
为什么表达式“1”==1 的计算结果为 TRUE？ [复制]

这个问题在这里已经有答案了 1 是字符值其他1是数字甚至当我尝试在下面执行时它给了我 TRUE as character 0 as numeric 0 谁能帮助我理解为什么来自help 如果两个参数是不同类型的原子向量则其中一
GitHub 操作 setup-r-dependency 失败，说明没有名为“digest”的包

我一直在尝试设置一些 GitHub 操作来自动检查我的 R 包并运行测试覆盖率我目前正在使用 setup r dependency v2 操作来安装依赖项但无法安装包 digest 返回以下错误 Error Error
将多个函数应用于一个向量

我正在寻找一种将多个函数应用于一个向量的选项我认为这对于逆应用函数来说是一种仁慈其中一个函数应用于许多向量或列有没有办法指定两个或多个函数例如 min 和 max 并将其应用于向量与 CathG的评论类似但没有get v lt
‘!’ 对于 R 中的因子没有意义

我需要从数据框中排除变量 PABI 所以我按如下方式进行子集化 MyData4 lt subset MyData PROV PABI newdata lt MyData MyData4 但我得到了这个错误 Error in FUN lef
如何从数据框中按降序获取前n家公司

我正在尝试从数据框中获取排名前 n 的公司下面是我的代码 data Forbes2000 package HSAUR sort Forbes2000 profits decreasing TRUE 现在我想从这个排序向量中获取前 50 个
并行 dask for 循环比常规循环慢？

如果我尝试使用 dask 并行化 for 循环它最终会比常规版本执行得慢基本上我只是按照 dask 教程中的介绍性示例进行操作但由于某种原因它在我这边失败了我究竟做错了什么 In 1 import numpy as np from
省略 RColorBrewer 调色板上较亮的颜色以在 ggplot2 中使用

我想在 RColorBrewer 的 Oranges 调色板中使用较深的颜色以便在我的 ggplot 条形图中使用然而我却做不到帮助下面是示例代码 my palette brewer pal n 9 Oranges 4 9 Bar
ggplot2以限制为中心的多边形世界地图给出了有趣的边缘

使用下面的代码我生成了一张以华盛顿特区为中心的地图解决方案基于科斯克的解决方案在这里 https stackoverflow com questions 10620862 use different center than the pri
当我添加形状时，分组哑铃图变得不稳定

我有以下数据显示白人与黑人在各个领域的一致性百分比我想创建一个分组哑铃图其中国家值和州值彼此相邻以便于比较 Domain c A B C D E F G A B C D E F G A B C D E F G A B C D E F
从 r 中的多个列表创建二进制（存在/不存在）数据矩阵

我有一系列不同长度的单独变量列表字符串我想将它们组合成一个数据帧以形成存在 1 不存在 0 矩阵鉴于它们的长度不同我什至不知道如何创建初始数据框这是我的例子 data1 lt c a b c d e f data2 lt c e
mtext：使用布局时较小的标签描述

使用 mtext 作为标签描述与使用 xlab 的作用不同如何使 mtext 标签始终与使用 xlab 时的大小相同无需始终定义 cex 参数在下面的最小示例中两个图的 cex cex lab 1 不过大小不同 layout mat
使用 R 数学独立库使用 C++ 编写矩阵/向量？

All 我一直在使用 C 中的 R 数学独立库我非常喜欢能够生成随机数并使用我熟悉的 R 分布函数我的问题是是否可以使用 R 中可用的矩阵运算乘法转置逆 Chol 等一个独立的库我在 Rmath h 中没有看到它们如果矩阵
可以使用部分名称访问列表成员吗？这是一个功能吗？

考虑这个 R 代码 gt l list key 1 gt l k 1 1 gt l ke 1 1 gt l k NULL gt names l 1 key 这是否意味着您可以使用以下方式访问列表成员及其部分名称当我在一次令人沮丧的错误搜
在 R 中将 ascii 数字转换为字符串

要将 R 中的字符串转换为 ascii 代码我通常使用 gt strtoi charToRaw abcd 16L 1 97 98 99 100 是否有一个函数可以做相反的事情即 gt myDesiredFunc c 97 98 99 1
使用条件求 R 中的累积和

我需要创建一个新变量其中包含每个 ID 过去三年金额的总和如果没有三年的数据则应显示 NA 举个例子 ID YEAR AMOUNT 1 2010 5 1 2011 2 1 2012 4 1 2013 1 1 2014 3 2 2013
如何将曲线拟合到直方图

我已经探讨了有关该主题的类似问题但在我的直方图上生成漂亮的曲线时遇到了一些麻烦我知道有些人可能会认为这是重复的但我目前还没有找到任何可以帮助解决我的问题的东西尽管数据在此处不可见但这里是我使用的一些变量以便您可以在下面的代码中看
R 中的整数或双精度列表

我有一个大约 1000 个整数的列表我需要能够进行一些数学计算但它们被困在列表或字符形式中我怎样才能切换它们以便它们可用样本数据 gt y 1 1 7 3 1 6 7 1 7 6 5 3 1 3 3 0 6 2 4 9 19 1 9

随机推荐

错误：您需要包含一些实现 __karma__.start 方法的适配器

我正在尝试向我的项目之一添加一些单元测试到目前为止我已经安装并配置了 karma 并安装了 jasmine 我的里面有一个测试文件test folder karma 服务器已启动浏览器页面已准备就绪但是karma run失败如下 k
如何翻译$url_handlers？

我遇到一个情况需要翻译以下内容 url handlers对于不同的国家因此在英文网站上 URL 如下所示 http website com gyms boston group training http website com gym
curl_multi_exec：下载的一些图像丢失了一些数据/流不完整

我已经实现了一个 PHP 函数它检查并下载大量图像 gt 1 000 使用数组传递给它使用 PHPcurl multi init method 经过几次返工后因为我得到了 0 字节文件等内容我现在有一个下载所有图像的解决方案但下载
在同一列上多次调用 Pandas df.sort_values() 会产生不同的结果？

下面的例子为什么会发生这种情况以及如何防止它 gt gt gt df pd DataFrame a list range 150 b 1 2 3 50 gt gt gt df sort values b equals df sort va
动态确定类型参数后返回通用类型

我有一个通用类如下所示 public class MyClass
在编译的 C 或 C++ 代码中加密密码

我知道如何在终端中使用 GCC 和 CC 编译 C 和 C 源文件但是我想知道编译后在这些文件中包含密码是否安全例如我检查用户输入的某个密码例如 123 但似乎已编译的 C C 程序可能会被反编译无论如何有没有办法编译 C C
React-Native 的本地 require() 路径

我正在寻找一种方便的方法来访问应用程序根目录中的文件同时避免使用如下所示的 require 字符串 require myModule 对于 Node 有一些很好的解决方案 https gist github com branneman 8
信息框上的边界检测，因此它们不会从地图上消失

以始终尝试在地图内完全绘制但不移动地图的方式重新计算信息框位置的最佳方法是什么因此如果我尝试打开靠近窗口右边缘的信息框它应该将信息框绘制到标记的左侧而不是在其顶部或左侧有一个框架吗 Thanks 我的信息框选项根据请求 var m
增长：内容宽度从中心开始之前

我最近发现了以下文本进度样式的方法并想知道是否有一种解决方法可以从中心增加元素宽度因此文本也会从中心填充而不是从左侧填充 body background color black p color rgba 255 255 255 4 f
Ingress 是直接与 Pod 通信还是通过服务与 Pod 通信？

我开始知道 Nginx Ingress 直接与 pod 对话而不是通过服务为什么是端点而不是服务 https kubernetes github io ingress nginx user guide miscellaneous why
Javascript：使用元组作为字典键

我有一种情况我想创建从元组到整数的映射在Python中我会简单地使用一个元组 a b 作为字典的关键 JavaScript 有元组吗我找到 a b 在 javascript 中作为表达式只返回 b 最后一项显然这是从C继承的所以
google-api-javascript-client ：如何使用 Drive API 获取文件内容？

首先如果有一个问题答案已经解决了我的问题那么我真诚地为创建一个新问题而道歉然而我已经找了3天了还是没有找到答案我的问题是我一生都无法弄清楚如何提取文件任何文件的内容通过阅读文档我发现我返回的文件资源对象应该有一个名为
成功后重定向到ajax表单

我有一个带有远程 gt true 的表单现在我的控制器看起来像 POST items POST items json def create item store items build params item respond to do
使用 Kotlin Android 扩展以编程方式扩展布局

我有以下布局
更新已编辑输入的值

我在用react admin框架我正在尝试动态更新我的输入值在我的自定义组件中我有onChange 方法如下所示 onChange value gt this setState currentForm this props recor
在java构造函数中传递“this”

查看以下代码 public class ClassA private boolean ClassAattr false public ClassA ClassAHandler handler new ClassAHandler this p
它是更改现有对象存储类别的计费操作吗？

我试图更改一组现有对象的存储类别超过 300 GB 正如这篇文章中所建议的 https stackoverflow com questions 40277021 change storage class of existing objec
没有名为“tensorflow.compat”的模块

我正在尝试使用来自可教机器网站 https teachablemachine withgoogle com from keras models import load model from PIL import Image ImageOps
如何在 WooCommerce 注册页面添加确认密码字段？

我正在尝试添加代码
如何在R中的“foreach”循环中转换“for循环”？

我正在处理一个需要并行计算以获得比经典 for 循环更快的结果的问题问题是这样的我需要为列表对象内的数据帧中包含的 198135 个结果变量生成线性模型我必须将模型中每个预测变量的所有 beta 和 p 值以及它们的拟合优度度量存储

如何在R中的“foreach”循环中转换“for循环”？

如何在R中的“foreach”循环中转换“for循环”？ 的相关文章

随机推荐

热门标签

如何在R中的“foreach”循环中转换“for循环”？的相关文章