如何让R使用更多的CPU和内存？ [复制]

2024-03-15

无论 R 计算多么密集，它使用的 CPU 都不会超过 25%。我尝试过设置优先级rsession.exe to High乃至Realtime但用法保持不变。有什么方法可以增加 R 的 CPU 使用率以充分利用我的系统的潜力，或者我对这个问题的理解是否有任何误解？先谢谢您的帮助。

P.S.: Below is a screenshot of the CPU usage.

Base R 是单线程的，因此 4 核 CPU 上的使用率预计为 25%。在一台 Windows 机器上，可以使用以下任一方法将处理分散到集群（或核心，如果您愿意）parallel包和foreach包裹。

首先，并行包（R 2.8.0+中包含，无需安装）提供了基于snow包的功能——这些功能是lapply()。 foreach 包提供了 for 循环结构的扩展 - 请注意，它必须与并行包裹。

下面是使用这两个包进行 k 均值聚类的快速示例。思路很简单，就是（1）拟合kmeans()在每个集群中，(2) 结合结果和 (3) 选择最小值tot.withiness.

library(parallel)
library(iterators)
library(foreach)
library(doParallel)

# parallel
split = detectCores()
eachStart = 25

cl = makeCluster(split)
init = clusterEvalQ(cl, { library(MASS); NULL })
results = parLapplyLB(cl
                      ,rep(eachStart, split)
                      ,function(nstart) kmeans(Boston, 4, nstart=nstart))
withinss = sapply(results, function(result) result$tot.withinss)
result = results[[which.min(withinss)]]
stopCluster(cl)

result$tot.withinss
#[1] 1814438

# foreach
split = detectCores()
eachStart = 25
# set up iterators
iters = iter(rep(eachStart, split))
# set up combine function
comb = function(res1, res2) {
  if(res1$tot.withinss < res2$tot.withinss) res1 else res2
}

cl = makeCluster(split)
registerDoParallel(cl)
result = foreach(nstart=iters, .combine="comb", .packages="MASS") %dopar%
  kmeans(Boston, 4, nstart=nstart)
stopCluster(cl)

result$tot.withinss
#[1] 1814438

这些包的更多详细信息和更多示例可以在以下帖子中找到。

单机并行处理Ⅰ http://jaehyeon-kim.github.io/2015/03/Parallel-Processing-on-Single-Machine-Part-I
单机并行处理二 http://jaehyeon-kim.github.io/2015/03/Parallel-Processing-on-Single-Machine-Part-II
单机并行处理Ⅲ http://jaehyeon-kim.github.io/2015/03/Parallel-Processing-on-Single-Machine-Part-III

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

cpuusage

如何让R使用更多的CPU和内存？ [复制] 的相关文章

warnings() 在函数内不起作用？如何解决这个问题？

op lt options warn 0 although doesn t work for any value of warn assign last warning NULL envir baseenv thisDoesntWork l
R：编写抛硬币的随机采样程序

假设我们有以下情况有一枚硬币如果它正面朝上那么下一次抛掷正面的概率是 0 6 如果是反面那么下一次抛掷反面的概率也是 0 6 一个班有100名学生每个学生随机抛掷硬币几次 Student n 的最后一次抛硬币不会影响 Studen
使用滑动窗口动画 ggplot 时间序列图

我正在寻找在不失去分辨率的情况下对长时间序列图进行动画处理的方法我希望视图能够平移数据显示从开始到结束的滑动子集假设我有以下内容 library ggplot2 library dplyr library gganimate df
如何从R中的日期中提取月份

我正在使用lubridate封装并应用month从日期中提取月份的函数我在日期字段上运行了 str 命令得到了 Factor w 9498 levels 01 01 1979 01 01 1980 5305 1 1 1 1 1 1 1
如何在 R 中为回归量创建“宏”？

对于长且重复的模型我想创建一个宏在 Stata 中称为宏并通过以下命令完成 global var1 var2 其中包含回归量的模型公式例如来自 library car lm income education prestige d
如何使用 sprintf 函数在字符中添加前导“0”而不是空格？

我正在尝试使用sprintf函数为字符添加前导 0 并使所有字符长度相同然而我得到的是领先空间 My code a lt c 12 123 1234 sprintf 04s a 1 12 123 1234 我试图得到什么 1 0012 0
使用 readHTMLTable 从 https 网页读取表格

我安装了 R 3 3 1 并使用 RStudio 0 99 903 我正在尝试从以下 URL 将表格读入 R https www fantasypros com nfl rankings consensus cheatsheets php
R：如何找到向量的模式[重复]

这个问题在这里已经有答案了下面是我的data frame我想知道每个内存类别 1 到 8 的模式是什么 gt dput d structure list MEMORY1 c 5 5 7 1 5 6 4 5 4 5 5 4 1 5 5 2
ggplot 图例标签内的希腊字母、符号和换行符

我在尝试着有换行符自动或强制对齐文本左对齐或左右对齐有希腊字母和百分号在 gglot 图例标签内我尝试了几种方法但我似乎无法将我读到的所有技巧结合起来我可以通过插入来换行 n进入标签但这似乎不适用于希腊字母不适用于图例
如何使用 R 中的函数 sqlSave() 将数据附加到具有 IDENTITY 主键的 SQL Server 表？

我在SQL Server中创建了一个表如下所示 CREATE TABLE testPK ID INT NOT NULL IDENTITY 1 1 PRIMARY KEY NumVal NUMERIC 18 4 现在我想使用 RODBC 函
如何有效地将多个光栅 (.tif) 文件导入 R

我是 R 新手尤其是在空间数据方面我正在尝试找到一种方法来有效地将多个 600 单波段栅格 tif 文件导入到 R 中所有文件都存储在同一文件夹中不确定这是否重要但请注意在我的 Mac 和 Windows 并行 VM 上的文件夹
在 R 中导入 csv 文件时如何保留前导零？

当我写一个 csv来自 R 的文件其中我的组名称以前导零值开头前导零被保留但是当我导入 csv前导零被删除组名称被转换为整数当我导入一个组时如何保留组名称中的前导零 csvR 中的文件 Example df lt data fr
R data.table 多个条件连接

我设计了一种解决方案用于从两个单独数据表的多个列中查找值并添加基于新列的值计算多个条件比较代码如下它涉及在计算两个表中的值时使用 data table 和联接但是这些表没有联接在我正在比较的列上因此我怀疑我可能无法获得 da
R：ifelse 中的字符串列表

我正在寻找与 MySQL 中的 where var in 语句类似的东西我的代码如下 data lt data frame id 10001 10030 cc1 rep c a b c 10 attach data data new lt
R 错误：无法更改锁定绑定的值

我试图估计无限数字流的平均值和标准差当我运行代码时出现错误消息无法更改锁定绑定的值我做了一些研究发现这个错误与我使用全局变量有关但我无法弄清楚任何帮助将非常感激在此先感谢您的帮助 define global variable
如何总结此R问题中的销售数量、售出酒类数量和花费金额

我使用以下代码在 R 上上传我的数据 if file exists ames liquor rds url lt https github com ds202 at ISU materials blob master 03 tidyvers
如何从数据框中删除少于 5 个观察值的个体 [重复]

这个问题在这里已经有答案了为了澄清这个问题我将简要描述数据中的每一行data frame是一个观察值列代表与该观察值相关的变量包括观察到什么个体观察时间观察地点等我想排除过滤观察值少于 5 个的个体换句话说如果 in
通过 r markdown 中的循环创建代码片段

如同如何使用R中的knitr创建一个包含代码块和文本的循环 https stackoverflow com questions 36373630 how to create a loop that includes both a code
R 中使用 `UseMethod()` 与 `inherits()` 来确定对象的类

如果我需要根据 R 对象的类以不同的方式处理它们我可以使用if and else在单个函数内 foo lt function x if inherits x list Foo the list else if inherits x num
如果条目出现次数少于 x 则删除数据框中的行

我有以下数据框称之为 df 它是由三个向量组成的数据框姓名年龄和邮政编码 df Name Age ZipCode 1 Joe 16 60559 2 Jim 20 60637 3 Bob 64 94127 4 Joe 23 9412

随机推荐

将 DateTimePicker 值设置为 null

我正在开发一个 WinForms UI 有两个DateTimePicker控制最初我想将控件的值设置为 null 直到用户选择日期如果用户没有选择日期则会将 null 值传递给数据库默认情况下它采用当前日期您能否提出一些建议或
检测实时应用程序中死锁的方法

在实时多线程应用程序中检测死锁的方法有哪些如果我们发现存在死锁是否有任何方法可以解决它而无需关闭重新启动应用程序有两种流行的方法来检测死锁一种是让线程设置检查点例如如果您有一个具有工作循环的线程您可以在开始工作时设置一个计
Scala 脚本无法在 Ubuntu 上运行

我有一个以前可以工作的 Scala 脚本当我尝试在新 PC 上运行它时编译失败所以我做了简单的脚本来测试 bin sh exec scala J Xmx2g 0 println test 尝试运行它我得到 test scala err
从谷歌地图中的纬度和经度获取位置地址

我想在点击谷歌地图并获取纬度和经度后从他们那里获取位置并将其地址放入字段中input searchTextField 我该怎么办我尝试过但不适合我 DEMO http jsfiddle net DXkZJ http jsfiddle
批量更新 Excel 文件连接字符串

我们最近更改了 SQL 数据库服务器我想知道是否有脚本或更简单的方法来更新所有 Excel 文件连接字符串如果他们使用连接文件会容易得多但不幸的是它们都是手动设置的我们有大约 600 份报告任何帮助深表感谢 Thanks Nick
将多边形转换为网格

我有很多多边形理想情况下所有多边形不得相互重叠但它们可以彼此相邻但实际上我必须考虑到slight多边形重叠由一定的公差定义因为所有这些多边形都是从用户手绘输入获得的这并不像我希望的那样机器精确我的问题是是否有任何软件库组
MicroMeter：删除/禁用某个标签

我正在使用默认的 MicroMeter 活页夹其中之一用于创建仪表jvm memory used 问题是它带有 2 个可用标签 area 和 id 这实际上生成了 6 个我不感兴趣的仪表我能够做到这一点 Bean public Mete
如何检查 Botframework 上的对话框堆栈

我正在实现一个反馈对话框并且想使用IScorable然后关掉反馈这个词并推动我的FeedbackDialog到堆栈上我不希望在收集用户反馈时出现这种行为有没有办法确定我的FeedbackDialog已经在堆栈上了吗那么我不会不小
Python 中的数据结构

names Peter John size X M L list price 1 2 3 4 5 6 There are 2 people will buy 3 size of shirt 我想将我的数据结构创建为 name u Peter
CakePHP 通过 Auth 记住我

我已经成功使用了 Auth 但不幸的是它似乎只适用于 Session 我希望如果用户选中记住我复选框我将使用 Cookie 并且他将登录 2 周我在官方书籍中找不到任何内容在谷歌中我只找到了很少而且不是很好的博客文章有没有办法
领域驱动设计和 IoC/依赖注入

我现在正在尝试应用我学到的有关 DDD 的知识但我对域模型中的依赖关系流有点困惑我的问题是实体是否应该了解域中的工厂存储库服务存储库应该了解域中的服务吗另一件困扰我的事情是当我想向集合添加实体时如何处理集合假设我正在开发一个
如何使用 Owin Katana 记录器

我在 Microsoft Owin 项目中的此类文件中看到正在调用记录器 https github com aspnet AspNetKatana blob dev src Microsoft Owin Security OpenIdCon
分割字符串并修剪每个元素

是否有任何库 API 或正则表达式模式可以在某些分隔符上拆分字符串并自动修剪每个元素的前导和尾随空格而无需循环元素例如在分割时 A B C D E on 所需的输出是 A B C D E 我得到的最接近的是str split s s
如何在创建帐户时向用户分配角色

我正在使用 ASP NET 内置成员资格和角色提供程序在我的应用程序中管理员为用户创建帐户目前我正在通过访问 ASP NET 配置网站来分配角色请告诉我如何在创建用户帐户 API 中添加选择角色的额外步骤 Thanks 您只是问如何
429 请求太多 - Angular 7 - 多个文件上传

当我尝试同时上传数百个以上的文件时我遇到了这个问题 API 接口仅适用于一个文件因此我必须调用发送每个文件的服务现在我有这个 onFilePaymentSelect event void if event target files l
当我使用模板时，我的文字方向写错了

我想使用 Rails 在现有 PDF 上添加文本所以我这样做了 filename Rails root app assets images sample pdf Prawn Document generate Rails root app
选择器无效：xpath 表达式“//*[@id='topstuff']/div/div/p[1]/text()[2]”的结果是：使用 XPath 和 Selenium 的 [object Text]

我在理解如何执行此操作时遇到很多问题我需要做的很简单就是每当我的自动谷歌搜索无法找到任何搜索结果时进行标记我的代码示例 driver webdriver Chrome executable path driver get https
VS2010无法添加服务引用

我有一个最初是用 VS2008 专业编写的项目我已经从 VS2008 解决方案中的项目创建了一个 vs2010 解决方案使用 VS2010 professional 但无法从解决方案的域层类库项目添加服务引用我检查过域层项目的目
从 azure 搜索返回仅与确切搜索词匹配的记录

所以我是 Azure 搜索的新手我才刚刚开始了解它我有一个搜索索引用于查询一个非常简单的 sql 视图以查找匹配的记录我在获得与我搜索的单词完全匹配时遇到了很大的困难每当我搜索时我都会得到仅包含确切单词的记录但是我也会得到包含
如何让R使用更多的CPU和内存？ [复制]

这个问题在这里已经有答案了无论 R 计算多么密集它使用的 CPU 都不会超过 25 我尝试过设置优先级rsession exe to High乃至Realtime但用法保持不变有什么方法可以增加 R 的 CPU 使用率以充分利用我的系

如何让R使用更多的CPU和内存？ [复制]

如何让R使用更多的CPU和内存？ [复制] 的相关文章

随机推荐

热门标签