我在办公室使用Pentium 4 HT机器来运行R,一些代码需要plyr包,我通常需要等待6-7分钟才能完成脚本运行,而我看到我的处理器只使用了一半。
我听说在 R 中使用多核包可以更好地利用多核处理器,我的情况适合吗?
Thanks!
有很多软件包可以进行多核处理。看doMPI
, doSNOW
, doMC
and doSMP
。它们都是运行并行化的其他程序的前端(例如 MPI/OpenMPI、多核包...)。在 Windows 上,我有很好的经验doSMP http://www.r-statistics.com/2010/04/parallel-multicore-processing-with-r-on-windows/而在 Linux 上 doMC 看起来很有前途(对 Windows 的一些支持正在出现,但有些人对“fork”的模拟有疑问)。
话虽这么说,我同意文斯关于需要写的评论plyr
函数以利用并行计算的能力。您可以编写自己的函数来模拟plyr
(或编辑plyr
)使用%dopar%
(see foreach
包也是如此)。
两个“CPU 使用历史记录”窗口可能意味着两个核心或多线程。例如,我有一个 4 核的 i7-920 处理器,但我看到 8 个历史窗口,因为每个核都是多线程的。
请原谅我的词汇和/或逻辑,但当涉及到这类事情时,我会是文斯帖子中的那条鱼。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)