同时将 r 与 foreach 和 mclapply 并行

2024-02-06

我正在实现一个并行处理系统，该系统最终将部署在集群上，但我无法弄清楚并行处理的各种方法如何交互。

我需要使用 for 循环来运行一大段代码，其中包含几个大的矩阵运算列表。为了加快速度，我想使用 foreach() 并行化 for 循环，并使用 mclapply 并行化列表操作。

示例伪代码：

cl<-makeCluster(2)
registerDoParallel(cl)

outputs <- foreach(k = 1:2, .packages = "various packages") {

    l_output1 <- mclapply(l_input1, function, mc.cores = 2)
    l_output2 <- mclapply(l_input2, function, mc.cores = 2)
    return = mapply(cbind, l_output1, l_output2, SIMPLIFY=FALSE)
}

这似乎有效。我的问题是：

1）这是一个合理的方法吗？他们似乎在我的小规模测试中一起工作，但感觉有点笨拙。

2）在任何给定时间它将使用多少个核心/处理器？当我将其升级为集群时，我需要了解可以将其推送多少（foreach 仅循环 7 次，但 mclapply 列表最多可达 70 个左右的大矩阵）。它似乎创建了 6 个“核心”（大概是 foreach 2 个，每个 mclapply 2 个）。

我认为这是集群上非常合理的方法，因为它允许您使用多个节点，同时仍然使用更高效的节点mclapply跨各个节点的核心。它还允许您对工作人员进行一些后处理（调用cbind在这种情况下）这可以显着提高性能。

在一台机器上，您的示例将创建总共 10 个附加进程：两个由makeCluster每个调用mclapply两次 (2 + 2(2 + 2))。然而，一次只有四个应该使用大量的 CPU 时间。您可以通过重组调用的函数将其减少到八个进程mclapply这样你只需要打电话mclapply一旦进入 foreach 循环，这可能会更有效。

在多台计算机上，您将创建相同数量的进程，但每个节点一次只有两个进程会使用大量 CPU 时间。由于它们分布在多台机器上，因此应该可以很好地扩展。

意识到mclapply如果您使用 MPI 集群，可能效果不佳。 MPI 不喜欢您分叉进程，因为mclapply做。它可能只是发出一些严厉的警告，但我也看到了其他问题 https://stackoverflow.com/a/19844099/2109128，所以我建议使用 PSOCK 集群，它使用 ssh 在远程节点上启动工作程序，而不是使用 MPI。

Update

看来调用有问题mclapply来自由“parallel”和“snow”包创建的集群工作人员。欲了解更多信息，请参阅我的对问题报告的答复 https://stackoverflow.com/a/35509767/2109128.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

同时将 r 与 foreach 和 mclapply 并行的相关文章

如何使用 sprintf 函数在字符中添加前导“0”而不是空格？

我正在尝试使用sprintf函数为字符添加前导 0 并使所有字符长度相同然而我得到的是领先空间 My code a lt c 12 123 1234 sprintf 04s a 1 12 123 1234 我试图得到什么 1 0012 0
R：如何找到向量的模式[重复]

这个问题在这里已经有答案了下面是我的data frame我想知道每个内存类别 1 到 8 的模式是什么 gt dput d structure list MEMORY1 c 5 5 7 1 5 6 4 5 4 5 5 4 1 5 5 2
将不同的 grViz 组合成一个图

我想结合不同的DiagrammeR绘制成一个图形生成的图如下例所示 library DiagrammeR pDia lt grViz digraph boxes and circles a graph statement graph ov
如何使用 R 中的函数 sqlSave() 将数据附加到具有 IDENTITY 主键的 SQL Server 表？

我在SQL Server中创建了一个表如下所示 CREATE TABLE testPK ID INT NOT NULL IDENTITY 1 1 PRIMARY KEY NumVal NUMERIC 18 4 现在我想使用 RODBC 函
如何在基数 R 中进行分组

我想使用以下 SQL 查询来表达base R 没有任何特定的包 select month day count as count avg dep delay as avg delay from flights group by month d
R：ifelse 中的字符串列表

我正在寻找与 MySQL 中的 where var in 语句类似的东西我的代码如下 data lt data frame id 10001 10030 cc1 rep c a b c 10 attach data data new lt
如何读取 R 中的每个 .csv 文件并将其导出到单个大文件中

你好我有以下格式的数据 101 20130826T155649 3 1 round 0 10552 180 yellow 12002 1 round 1 19502 150 yellow 22452 1 round 2 28957 130
dplyr 中的标准评估：全局环境中的函数出现“无法找到函数”错误

我试图在 dplyr 中对全局环境中的函数使用标准评估但出现无法找到函数错误这是一些代码 create data frame df lt data frame x rnorm 10 y rnorm 10 define arbitra
R参考类问题

我正在尝试在 R 中创建一个简单的参考类这是我的代码 R 初学者 MyClass lt setRefClass MyClass fields list a numeric b numeric methods list initialize
在 R 中使用逻辑 grep 抓取文本

下午好谢谢你帮我解答这个问题我有兴趣抓取一组超过 5000 个 URL 的列表我使用 lapply 和 readLines 使用下面的示例代码提取这些网页的文本 multipleURL lt c http dailymed nlm n
Perl Parallel::Forkmanager 不允许收集变量值

也许因为子进程不知道我的散列请参阅下面的代码散列输出没有收集任何内容除了写入 tmp 文件之外还有其他方法来收集该值吗 foreach Item AllItems pid pm gt start Item and next Tem
rvest 和 NHL 统计数据的 CSS 选择器问题

我想从 hockey reference com 中抓取数据特别是从以下链接中抓取数据 https www hockey reference com leagues NHL 1991 html https www hockey refer
更改 pander 中的默认对齐方式 (pandoc.table)

我目前正在切换到pander对于我的大部分时间knitr markdown格式化因为它提供了如此出色的pandoc支持我不太满意的一件事是默认的居中对齐营销人员可能会喜欢它但对于技术报告来说这是一个可怕的事情使用的最佳选择Hmis
R 中的龙卷风图

我正在尝试在 R 中绘制龙卷风图又名敏感性图目标是可视化某些变量增加 10 和减少 10 的效果到目前为止我已经得到这个结果这是我正在使用的代码 Tornado plot data lt matrix c 0 02 0 02 0 0
R 编程常用工具

如果已经以不同的方式问过这个问题我深表歉意但我找不到任何达到我想要的东西我真的是从其他软件包 SPSS 开始接触 R 的当我了解真正可以做什么时我意识到我还需要其他工具这让我想到了我的问题您有哪些用于开发 R 代码的设置我
如何将同一行中以逗号分隔的值拆分到R中的不同行

我有一些数据来自谷歌表格 https forms gle rGQQL3tvA1PrE4dD8我想拆分以逗号分隔的答案 and 复制参与者的 ID 数据如下 gt head data names Q2 Q3 Q4 1 PART 1 fruit
如何定义“f_n-chi-square”函数并使用“uniroot”求置信区间？

I want to get a 95 confidence interval for the following question 我已经写了函数f n在我的 R 代码中我首先使用 Normal 随机采样 100 个样本然后定义函数h
合并数据框而不重复行

我想合并两个数据框但如果有多个匹配项则不想重复行相反我想总结一下那天的观察结果来自合并提取两个数据框中与指定列匹配的行并将其连接在一起如果有多个匹配项则所有可能的匹配项各贡献一行这是一些示例代码 days lt as d
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个
如何绘制大时间序列（数千次给药次数/药物剂量）？

我正在尝试绘制医院中如何开出单一药物的图解在这个虚拟数据库中我在 2017 年 1 月 1 日之后遇到了 1000 名患者绘图的目的是了解该药物的给药模式在接近入院出院或患者住院期间是否更频繁高剂量给药 Get random d

随机推荐

Windows Phone 8 中的设备方向

我想在使用 PhotoCaptureDevice 选项拍摄快照时根据 Windows Phone 8 中的设备方向旋转图像当设备方向为 LandscapeLeft Image to be rotated to 90 LandscapeRi
有人能解释一下吗：0.2 + 0.1 = 0.30000000000000004？ [复制]

这个问题在这里已经有答案了重复项浮点数是如何存储的什么时候重要 https stackoverflow com questions 56947 how is floating point stored when does it mat
如何对 numpy 字符串数组的每个元素进行切片？

Numpy 有一些非常有用的字符串操作 http docs scipy org doc numpy reference routines char html 它将常用的 Python 字符串操作向量化与这些操作相比pandas str n
来自带有列表的字典的 Pandas DataFrame

我有一个 API 它以 Python 字典的形式返回一行数据大多数键都有一个值但有些键的值是列表甚至是列表的列表或字典的列表当我将字典放入 pd DataFrame 并尝试将其转换为 pandas DataFrame 时它会抛出
使用 FPDF 使文本在单元格中换行？

现在当我使用带有文本的单元格时它全部保留在一行上我知道我可以使用写入功能但我希望能够指定高度和宽度这就是我现在所拥有的但正如我所说文本不会换行以保留在尺寸中 pdf gt Cell 200 40 reportSubtitle
为什么我们在 Hibernate 中使用 @Embeddable

有什么用 Embedded and Embeddable处于休眠状态因为我在互联网上找到的每个示例都是在单个表中插入数据并使用两个不同的类来执行此操作我的观点是如果我使用单个表那么我可以映射单个类内的所有列那么为什么我应该使用不同
关闭mysql连接重要吗？

关闭mysql连接效率是否至关重要或者在php文件运行后它会自动关闭吗来自文档 http us php net function mysql connect 注意脚本执行结束后到服务器的链接将立即关闭除非通过显式调用 mysql
Xcode 4.4 约束错误

我正在使用 Xcode 4 4 并在界面生成器中创建视图当我运行我的应用程序时我始终收到以下约束错误 Unable to simultaneously satisfy constraints
Realm React-Native：从 JS（反应本机代码）和 android（java）访问相同的领域

我有一个用例我在 android 代码本机中接收一些数据我想将此数据插入到由我的反应代码打开或创建的同一领域中或者在同一个领域写作我怎样才能实现这个目标感谢所有的帮助附我知道我可以以某种方式制作一个本机模块并将数据发送回我
如何使用 JMH 按顺序运行基准测试中的方法？

在我的场景中基准测试中的方法应该在一个线程中顺序运行并按顺序修改状态例如有一个List
在 API 网关路径中引用授权者定义

我在我的 cloudformation 模板中定义了一个自定义授权者 MyCustomAuthorizer Type AWS ApiGateway Authorizer Properties Name MyCustomAuthorizer
MongoDB 中的多语言属性

我正在尝试在 MongoDB 中设计一个模式范例它将支持文档中变量属性的多语言值例如我有一个产品目录其中每个产品可能需要以各种语言存储其名称标题或任何其他属性同样的范例可能也适用于其他特定于区域设置的属性例如价格货币变化我
jquery数组分组依据

我有这样的数组 abcArr A 10 B 20 A 30 C 40 如何按 A B C 对值进行分组和求和 each abcArr function if this 0 this 0 this 1 this 1 I know this w
如何考虑标签将多行合并为一行

我有一个数据框每一行都包含一个句子我想将这些行合并在一起以便每行包含每个作者的 4 个句子我有类似这样的数据框 text author sent1 x sent2 x sent3 x sent1002 x sent1 y sent2
如何从一个表中选择另一表中不存在的所有记录？

表1 ID 名称表2 ID 名称 Query SELECT name FROM table2 that are not in table1 already SELECT t1 name FROM table1 t1 LEFT JOIN t
两个linux内核模块之间是否可以通过netlink进行通信？

众所周知 netlink是用户内核空间的通信机制我想从我的内核模块与另一个内核模块进行通信另一个内核模块已经具有 netlink 接口是否可以像我们在用户空间中那样从内核模块到 netlink 建立连接简短回答不如果要在两个内
证书颁发：来自 P7B 和 CRT 的 KEY 或 PFX

我对证书很陌生这是我第一次购买它我生成了 CSR 文件在 IIS 中并使用 GoDaddy 网站购买了证书他们给我发了两个文件 P7B 和 CRT 由于我将使用 Azure Web 角色的证书因此我需要 PFX 如何仅使用 CS
将 svn 存储库数据库格式从 1.6 降级到 1.5

我确实遇到了一个不寻常的情况因为我必须将 svn 存储库从 svn server 1 6 迁移到 svn server 1 5 问题是没有可用的降级工具有人知道一些脚本或者有降级 svn 存储库的经验吗 Cheers Kevin 除了
有没有办法预先缓存网页以便使用 Android WebView 查看？

我读过有关 HTML5 缓存清单的内容并且我看到 Android 确实支持使用缓存清单来缓存网站我想使用缓存清单下载我的网站所需的所有资源以进行预加载然后打开 WebView 并使用预缓存的资源显示远程网站我想以某种方式预先缓存我的
同时将 r 与 foreach 和 mclapply 并行

我正在实现一个并行处理系统该系统最终将部署在集群上但我无法弄清楚并行处理的各种方法如何交互我需要使用 for 循环来运行一大段代码其中包含几个大的矩阵运算列表为了加快速度我想使用 foreach 并行化 for 循环并使用 m

同时将 r 与 foreach 和 mclapply 并行

同时将 r 与 foreach 和 mclapply 并行 的相关文章

随机推荐

热门标签

同时将 r 与 foreach 和 mclapply 并行的相关文章