给定条件并行或顺序执行 foreach 循环

2024-03-06

我经常会得到几个嵌套的结果foreach循环，有时在编写通用函数（例如，对于包）时，没有明显可以并行化的级别。有什么方法可以实现下面的模型所描述的内容吗？

foreach(i = 1:I) %if(I < J) `do` else `dopar`% {
    foreach(j = 1:J) %if(I >= J) `do` else `dopar`% {
        # Do stuff
    }
}

此外，是否有某种方法可以检测并行后端是否已注册，以便我可以避免收到不必要的警告消息？这在 CRAN 提交之前检查包时非常有用，并且不会打扰在单核计算机上运行 R 的用户。

foreach(i=1:I) %if(is.parallel.backend.registered()) `dopar` else `do`% {
    # Do stuff
}

谢谢你的时间。

Edit:非常感谢您对核心和工作人员的所有反馈，您是对的，处理上述示例的最佳方法是重新考虑整个设置。我更喜欢下面这样的东西triu想法，但本质上是相同的。当然也可以通过并行来完成tapply就像乔里斯建议的那样。

ij <- expand.grid(i=1:I, j=1:J)
foreach(i=ij$I, j=ij$J) %dopar% {
    myFuction(i, j)
}

然而，在我试图简化引发此线程的情况时，我遗漏了一些关键细节。想象一下我有两个函数analyse and batch.analyse并且并行化的最佳级别可能会有所不同，具体取决于n.replicates and n.time.points.

analyse <- function(x, y, n.replicates=1000){
    foreach(r = 1:n.replicates) %do% {
        # Do stuff with x and y
    }
}
batch.analyse <- function(x, y, n.replicates=10, n.time.points=1000){
    foreach(tp = 1:time.points) %do% {
        my.y <- my.func(y, tp)
        analyse(x, my.y, n.replicates)
    }
}

If n.time.points > n.replicates并行化是有意义的batch.analyse但除此之外，并行化更有意义analyse。关于如何解决它有什么想法吗？是否可以以某种方式检测到analyse并行化是否已经发生？

您提出的问题是 foreach 嵌套运算符“%:%”的动机。如果内部循环的主体需要大量的计算时间，那么您可以非常安全地使用：

foreach(i = 1:I) %:%
    foreach(j = 1:J) %dopar% {
        # Do stuff
    }

这将“展开”嵌套循环，从而产生可以并行执行的 (I * J) 个任务。

如果内循环体不需要太多时间，则解决方案会更困难。标准解决方案是并行化外循环，但这仍然可能导致许多小任务（当 I 较大且 J 较小时）或一些大型任务（当 I 较小且 J 较大时）。

我最喜欢的解决方案是将嵌套运算符与任务分块结合使用。这是使用 doMPI 后端的完整示例：

library(doMPI)
cl <- startMPIcluster()
registerDoMPI(cl)
I <- 100; J <- 2
opt <- list(chunkSize=10)
foreach(i = 1:I, .combine='cbind', .options.mpi=opt) %:%
    foreach(j = 1:J, .combine='c') %dopar% {
        (i * j)
    }
closeCluster(cl)

这会产生 20 个“任务块”，每个任务块由 10 次循环体计算组成。如果您想为每个工作人员分配一个任务块，则可以将块大小计算为：

cs <- ceiling((I * J) / getDoParWorkers())
opt <- list(chunkSize=cs)

不幸的是，并非所有并行后端都支持任务分块。另外，doMPI 不支持 Windows。

有关此主题的更多信息，请参阅 foreach 包中的我的小插图“嵌套 Foreach 循环”：

library(foreach)
vignette('nesting')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

给定条件并行或顺序执行 foreach 循环的相关文章

将维基百科中的表格加载到 R 中

我正在尝试从以下 URL 将最高法院法官表加载到 R 中 https en wikipedia org wiki List of Justices of the Supreme Court of the United States http
计算 R 行中的非零条目数

我有以下类型的数据 mode1 mode2 mode3 1 8 1 0 2 0 0 0 3 6 5 4 4 1 2 3 5 1 1 1 数据使用dput structure list mode1 c 8L 0L 6L 1L 1L mode2
rvest 函数 html_nodes 返回 {xml_nodeset (0)}

我正在尝试抓取以下网站的数据框 http stats nba com game 0041700404 playbyplay http stats nba com game 0041700404 playbyplay 我想创建一个表格其中包
自定义轴缩放后 ggplot2 缺少标签

我正在尝试使用我的 x 轴应用自定义缩放ggplot2 and scales trans new 但是当我这样做时一些轴标签丢失了有人可以帮我弄清楚为什么吗 Setup library tidyverse the data ds lt
将整个包传递给雪簇

我正在尝试并行化使用snow parLapply 一些依赖于包即除snow 调用函数中引用的对象parLapply必须使用显式传递给集群clusterExport 有没有办法将整个包传递到集群而不必显式命名每个函数包括用户函数调用的
在 RGL 中将立方体绘制到 3D 散点图中

我正在尝试向 3D 散点图添加较小的立方体网格具有指定边长我希望立方体位于原点我该怎么做呢我已经玩过cube3d 但我似乎无法将立方体正确定位也无法使其成为网格因此我可以看到它包含的数据点这是我所拥有的 library rg
R：改变堆积条形图的颜色

library ggplot2 df2 lt data frame supp rep c VC OJ each 3 dose rep c D0 5 D1 D2 2 len c 6 8 15 33 4 2 10 29 5 head df2 g
如何使用plotmath更新ggplot图例标签

我正在尝试更新ggplot要使用的图例标签plotmath但是当我这样做时它将之前组合的图例分成两部分通过一个例子可能更容易理解 test data and the default plot gives the correct col
R 中图周围的圆形边框

我需要在情节周围放置平滑的边框代码 plot 0 10 0 10 type n xlab X ylab Y box figure col blue 除了简单的蓝线我如何放置带有圆角的平滑灰线非常感谢 library grid plot
devtools::test() 有效，但 devtools::check() 无效。为什么？

我正在测试this https github com beanumber etlR 包以下三件事就可以正常工作 devtools test devtools test file tests testthat R Travis CI 与 R
计算字符串向量中连续数字的函数

我想创建一个函数它接受至少 1 个元素的字符串对象并包含数字 2 到 5 并确定是否存在至少 N 长度的连续数字其中 N 是实际数字值如果是则返回字符串 true 否则返回字符串 false 例如 Input 555123 Outp
R：根据列名部分匹配计算行平均值

我有一个看起来像这样的表 er er 1 as as 1 as 2 rt op a 1 6 90 8 6 4 87 b 1 8 56 7 5 5 9 c 8 7 6 4 5 9 6 d 1 0 8 6 4 3 6 e 9 7 2 4 3 8
上传到 Shiny 服务器后在 R 中解压文件

我正在尝试在我们的本地服务器上使用 Shiny 来构建一个应用程序允许用户上传包含 ESRI shapefile 和关联文件的 zip 文件 Shiny 服务器的 fileInput 可以获取数据并且当它这样做时它会将其存储在临时目录
rPlot 工具提示问题

我有一个使用 rCharts 工具提示的简单示例但似乎不起作用 set seed 1 test lt data frame x rnorm 100 y rnorm 100 rPlot y x data test type point to
如何在 R 中 fork 进程

我试图了解 R 多核包实现的分叉系统包的例子是 p lt fork if inherits p masterProcess cat I m a child Sys getpid n exit I was a child cat I m t
如何使用合并或替换来更新 R 中具有多列的表

我想做一些与这个问题非常相似的事情如何使用 merge 更新 R 中的表 https stackoverflow com questions 3190118 how to use merge to update a table in r
通过消除嵌套的 for 循环来改进此代码

R 包corrplot除其他内容外还包含这个漂亮的功能 cor mtest lt function mat conf level 0 95 mat lt as matrix mat n lt ncol mat p mat lt lowCI
并行化斐波那契序列生成器

我正在学习并行化在一项练习中我得到了一些我应该提高性能的算法其中之一是斐波那契数列生成器 array 0 0 array 1 1 for q 2 q lt MAX q array q array q 1 array q 2 我怀疑这
聚合函数在数据框中创建不需要的向量

我在函数中创建数据帧时遇到了一个奇怪的问题但是在 data frame 之外使用相同的方法效果很好这是基本函数我用它来计算数据集的平均值标准差和标准误差 aggregateX lt function formula dataset
用于安装 R 软件包的备用编译器：clang：错误：不支持的选项“-fopenmp”

我正在尝试在 OS X 10 11 6 上使用 R 版本 3 4 0 安装 rJava 包 install packages rJava type source 我收到以下错误 clang o libjri jnilib Rengine o

随机推荐

SwiftUI ForEach 'identified(by:)' 已弃用。使用 ForEach(_:id:) 或 List(_:id:)

在 XCode 11 beta 4 上以下内容似乎已被弃用我不知道如何重写它有谁知道如何使用ForEach id State private var showTargets id 1 state false x 109 28 y 10
永远的nodejs：如何运行我的npm应用程序

现在我正在运行我的 Node js 应用程序npm start 我想在后台运行它我发现forever包但不知道如何运行我通常运行的应用程序npm start 那么我怎样才能使用它来运行它forever 我跟随this SO https
jqGrid 有 CDN 吗？

谁知道有没有CDNjqGrid http www trirand com blog Thanks Here is JQgrid 的 CDN http www jsdelivr com jqgrid 不过不是最小版本 http www js
Laravel 上的 Amazon S3 ERR_INSECURE_RESPONSE

我在我的子域上使用 Laravel 框架sub example com尝试为我网站的所有图片实现与 Amazon S3 的连接这是我的存储桶政策 bucket 1 Id Policy Version 2012 10 17 Statemen
在 Woocommerce 的某些页面上添加产品 ID 的星级评级

有没有办法在自定义页面自定义位置调用特定产品的星级换句话说我是否可以添加特定 T 恤的星级以显示在主页上该 T 恤图片的下方我想我需要向编辑器添加某种 php 然后通过某种 html 调用它我看见这个回答的话题 https st
python 阿拉伯语编码问题

我有一个带有 windows 1256 编码的文本现在我想将文本从阿拉伯语 windows 1256 转换为utf 8 示例文本 result 我用这个代码来解码和编码为utf 8 coding utf 8 data print data
使用 pcapdotnet 将数据包拆分为 2 个数据包

如何使用 pcapdotnet 将一个数据包分成两个数据包这是我尝试过的但不知道是否正确 public IEnumerable
通过 JIRA REST API 从自定义字段获取值

我想获取自定义字段的所有下拉选项对于系统字段我使用以下 URI http localhost 8080 rest api 2 project XXXX components http localhost 8080 rest api 2
Flutterfire 抛出 dart not found 错误

我正在关注 flutter firebase codelab 并且我一直在我的 android 应用程序中配置 firebase 我已经在我的计算机上全局安装了 flutterfire cli 并将 bin 导出到我的路径中 export
获取R中的所有组合，允许重复

内置的combn只给出一半的组合 gt t combn 1 5 2 1 2 1 1 2 2 1 3 3 1 4 4 1 5 5 2 3 6 2 4 7 2 5 8 3 4 9 3 5 10 4 5 例如没有 1 1 也没有 2 1 我怎样
Azure Webjobs 与 Azure Functions：如何选择

我创建了一些Azure 网络作业 https azure microsoft com en us documentation articles websites webjobs resources 使用触发器我刚刚了解到Azure 函数
正则表达式在最后一个冒号之后查找字符串

以下是一些示例输入 lt 210 gt DW AT name indirect string offset 0x55 double
C#，使用 OpenXmlWriter 和 Open XML SDK 编写 XLSX

在 C 中以下程序编译并运行但它不会在 Excel 输出文件中写入任何内容我让它工作没有OpenXmlWriter但我开始内存不足所以我必须切换到OpenXmlWriter根据这个http blogs msdn com b bria
Python 虚拟环境 (venv)：使用和开发/测试环境中的共享库

我是 python venv 的新手很抱歉可能提出愚蠢的问题我正在开发一个小型图书馆我已经创建了开发虚拟环境其中包含库使用所需的所有包并将所有版本的需求冻结到requirements txt 我还想创建requirements t
从异步 F# 在主线程上执行代码

我正在 F 中实现以下 Swift 方法 func downloadCachedImage url URL if let cachedImage imageCache object forKey url absoluteString as
从 URL 检索参数

给定如下 URL 如何解析查询参数的值例如在这种情况下我想要的值some key some path some key some value 我在我的环境中使用 Django 有没有一种方法request可以帮助我的对象吗我尝试使用s
使用 JavaScript 将带有时区的日期字符串转换为本地时间的日期对象

我的日期字符串的格式如下所示 yyyy MM ddTHH mm ss 0Z00 实施例1 2010 03 05T07 03 51 0800 实施例2 2010 07 01T20 23 00 0700 我需要使用这些日期字符串创建一个日期对象
以编程方式为 UITableViewController 设置 UIActivityIndicatorView

我有一个常规的UITableViewController and a UITableView作为它唯一的观点我想要一个UIActivittyIndicatorView除了表视图之外所以我需要一个像这样的视图结构 view UIView
仅从我的应用程序访问私有 S3 内容

我有一个在 AWS S3 中存储图像的应用程序这就像一个个人资料图片上传案例上传个人资料图片后图像将存储在AWS S3中并且S3链接将存储在数据库中然后应用程序将使用数据库中的该链接显示个人资料图片目前由于存储桶是私有的因
给定条件并行或顺序执行 foreach 循环

我经常会得到几个嵌套的结果foreach循环有时在编写通用函数例如对于包时没有明显可以并行化的级别有什么方法可以实现下面的模型所描述的内容吗 foreach i 1 I if I lt J do else dopar forea

给定条件并行或顺序执行 foreach 循环

给定条件并行或顺序执行 foreach 循环 的相关文章

随机推荐

热门标签

给定条件并行或顺序执行 foreach 循环的相关文章