并行运行多个 R 函数

2024-03-01

我有一个数据集，其中包含很少的数字列和超过 1 亿行的 data.table 对象。我想根据其他列对某些列进行分组操作。例如，对“d”列中每个类别的“a”列的唯一元素进行计数。

my_data[, a_count := uniqueN(col_a), col_d]

我有许多彼此独立的操作，并行运行它们会很棒。我发现以下代码片段将并行运行不同的函数。

fun1 = function(x){
  x[, a_count := uniqueN(col_a), col_d]
  return(x[, .(callId, a_count)])
}
fun2 = function(x){
  x[, b_count := uniqueN(col_b), col_d]
  return(x[, .(callId, b_count)])
}
fun3 = function(x){
  x[, c_count := uniqueN(col_c), col_d]
  return(x[, .(callId, c_count)])
}

tasks = list(job1 = function(x) fun1(x),
             job2 = function(x) fun2(x),
             job3 = function(x) fun3(x))

cl = makeCluster(3)
clusterExport(cl, c('fun1', 'fun2', 'fun3', 'my_data', 'data.table', 'uniqueN'))

out = clusterApply( 
  cl,
  tasks,
  function(f) f(my_data)
)
stopCluster(cl)

我该如何改进这个解决方案？例如，如果只将必要的列传递给每个函数而不是整个数据框，那就太好了。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

foreach

dataTable

doparallel

并行运行多个 R 函数的相关文章

ggplot 图例标签内的希腊字母、符号和换行符

我在尝试着有换行符自动或强制对齐文本左对齐或左右对齐有希腊字母和百分号在 gglot 图例标签内我尝试了几种方法但我似乎无法将我读到的所有技巧结合起来我可以通过插入来换行 n进入标签但这似乎不适用于希腊字母不适用于图例
R闪亮主面板显示样式和字体

我正在学习闪亮的应用程序并且有一些关于调整布局的基本问题特别是样式和字体希望得到指点或明确的答案谢谢考虑一个基本的输入输出应用程序用户在 sidebarPanel 中输入数据然后在 mainPanel 中反应性地输出结果如何
如何使用 R 中的函数 sqlSave() 将数据附加到具有 IDENTITY 主键的 SQL Server 表？

我在SQL Server中创建了一个表如下所示 CREATE TABLE testPK ID INT NOT NULL IDENTITY 1 1 PRIMARY KEY NumVal NUMERIC 18 4 现在我想使用 RODBC 函
R：ifelse 中的字符串列表

我正在寻找与 MySQL 中的 where var in 语句类似的东西我的代码如下 data lt data frame id 10001 10030 cc1 rep c a b c 10 attach data data new lt
根据 R 数据框中的名称对列进行平均

我想知道是否有一种有效的方法来获取每组的平均值类似命名的列谁的名字结尾为 1S and 2S ex ex1S ex2S at time 1并取每组的平均值类似命名的列谁的名字结尾为 1C or 2C ex ex1C ex2C at time
R 错误：无法更改锁定绑定的值

我试图估计无限数字流的平均值和标准差当我运行代码时出现错误消息无法更改锁定绑定的值我做了一些研究发现这个错误与我使用全局变量有关但我无法弄清楚任何帮助将非常感激在此先感谢您的帮助 define global variable
如何总结此R问题中的销售数量、售出酒类数量和花费金额

我使用以下代码在 R 上上传我的数据 if file exists ames liquor rds url lt https github com ds202 at ISU materials blob master 03 tidyvers
函数“[<-”将_替换_一个元素，但不会追加_元素_

我在使用时注意到以下几点 lt 我成功于替换元素但不位于追加向量的一个元素例子 VarX lt integer VarX 1 lt 11 lt VarX 2 22 VarX 1 11 Expected the value of VarX
在 Lavaan 生长曲线模型中提取个体轨迹

我已经使用 R 的 Lavaan 包中的 Growth 函数成功地对一项研究的纵向数据进行了建模我找不到任何关于如何提取每个参与者的预测轨迹的记录我只能找到整个组的预测轨迹在摘要输出的拦截部分下给出使用 lavPredict m
rvest 和 NHL 统计数据的 CSS 选择器问题

我想从 hockey reference com 中抓取数据特别是从以下链接中抓取数据 https www hockey reference com leagues NHL 1991 html https www hockey refer
汇总表中各列的字符值比例

在这种数据框中 df lt data frame w1 c A A B C A w2 c C A A C C w3 c C A B C B 我需要计算所有列中字符值的列内比例有趣的是以下代码适用于大型实际数据集但对上述玩具数据会引发错
如何绘制每条线之间具有特定距离的图形

实际上我尝试绘制一个图形但它将所有列线放在一起并显示因此它不具有代表性我尝试制作模拟数据并向您展示我如何绘制它并向您展示我想要的内容我不知道如何制作像下面所示的示例的数据但我在这里做了什么 set seed 1 M lt
如何从 R 数据框中提取关键字

我是 R 中文本挖掘的新手我想从数据框的列中删除停用词即提取关键字并将这些关键字放入新列中我尝试制作一个语料库但它对我没有帮助 df C3是我目前拥有的我想添加栏目df C4 但我无法让它工作 df lt structure l
使用 pkg:sjPlot 函数创建一个生成部分斜体单元格的数据框

我正在尝试创建一个简单的数据表其中 Coral taxon 列中的属名称为斜体而 spp 列中的属名称为斜体属名后面的部分不大写我尝试使用 expression 函数对 Coral taxon 的每一行进行编码但没有成功 sum
如何在 R 中绘制一列与其余列的关系图

我有一个数据集其中 1 是时间接下来的 14 个是幅度我想在一张图表上散布所有大小与时间的关系其中每个不同的列都是网格化的分层在另一个之上我想使用原始数据来制作这些图表并单独制作它们但只想执行此过程一次数据集A 唯一的自变
C# 数据表来保存表格（无限嵌套）

我相对较新C 但来自C C 背景我需要一个类似于的数据类型类 DataTable 但允许存储的列保存简单类型 int float boolean string 以及相同类型的数据以便一个列可以保存另一个表该表也具有存储表等的列
如何定义“f_n-chi-square”函数并使用“uniroot”求置信区间？

I want to get a 95 confidence interval for the following question 我已经写了函数f n在我的 R 代码中我首先使用 Normal 随机采样 100 个样本然后定义函数h
合并数据框而不重复行

我想合并两个数据框但如果有多个匹配项则不想重复行相反我想总结一下那天的观察结果来自合并提取两个数据框中与指定列匹配的行并将其连接在一起如果有多个匹配项则所有可能的匹配项各贡献一行这是一些示例代码 days lt as d
WPF ListBox - 如何从数据表中放入值？

I have ListBox并希望将值放入此列表框中DataTable listBoxVisibleFields DataContext SelectedFields Where SelectedFields is a DataTable充
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor

随机推荐

元数据集合中已存在标识为“Id”的项目。参数名称：项目

我的所有实体都有一个基类 public class Entity
使用 Django 创建可编辑的 HTML 表格

我正在尝试创建一个 Django 应用程序用户可以在其中创建电影列表每次用户登录时他们的电影列表都会以表格形式呈现给他们该表将包含三列一列用于电影名称一列用于类型另一列包含删除按钮允许用户删除与该按钮对应的行用户可以通过在
Tensorflow 2.1.0 错误，模块“tensorflow”没有属性“GraphKeys”

我今天刚刚安装了新的 tf 和 cuda 但是当我运行之前与 tf 1 4 一起使用的代码时在新的 tensorflow 2 1 0 和 cuda 10 1 下将无法工作如何解决这个问题为了社区的利益在答案部分提及解决方案即使它出
如何避免 getter 和 setter

我在很多地方读到过 getter 和 setter 是邪恶的我明白为什么会这样但我不知道如何完全避免它们 Say Item 是一个包含有关商品名称数量价格等信息的类 ItemList 是一个类它有一个项目列表要查找总计 int
提供隐藏内部函数的 C API 的最佳实践[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我编写了一个 C 库其中包含一些 h 文件和 c 文件我将其编译为 a 静态库我想只向用户公开某些功能并使其余功能尽可能模糊以使逆向
由于关系，DataMapper 无法删除记录

我使用 Torrent 和 Tag 设置了多对 DataMapper MySQL 如下所示 class Torrent include DataMapper Resource property id Serial property name
Sendgrid 返回 202 但不发送电子邮件

我正在尝试让 sendgrid 的基本 hello world 正常工作但到目前为止还没有成功响应返回代码 202 表明它将发送电子邮件但电子邮件从未发送出去有谁知道发生了什么事吗 import sendgrid sg sendgr
这段C代码是如何工作的？

What is a b a define f a b a b define g a a define h a g a main printf s n h f 1 2 how should I interpret this line 1 pr
React Native：触摸时更改 ListView 项目的样式

我想在按下 ListView 项目时更新该项目的样式以便最终用户知道他她选择了一个项目列表显示
iOS - 如何在我的应用程序中集成蓝牙设备

我正在尝试创建一些连接到蓝牙设备的应用程序一个简单的东西比如蓝牙条形码扫描仪可以扫描并将数字发送到我的应用程序我想知道在我的应用程序中使用哪个框架或其他东西可以将条形码扫描仪与我的应用程序集成是否有任何 API 或示例或教程等可以
如何使用 Android 的 NDK 使用 mkfifo

最近我升级了 NDK 现在我的应用程序因缺少符号而崩溃mkfifo E dalvikvm 2031 dlopen data app lib mylib so failed Cannot load library soinfo relocat
如何使用JS获取h1标签的值？

我有 3 个页面其中 2 个页面是 WordPress 页面另外 1 个是带有表单的自定义页面模板这两个页面是使用 wp job manager 插件创建的第一页有一个下拉菜单并包含职位列表第二页是职位描述现在我想在用户单击输
获取oracle中索引的完整ddl

我使用的是 Oracle 11g 12c 我想获取数据库中索引的 ddl 为此我使用了查询 SELECT DBMS METADATA GET DDL INDEX SYS IL0000091971C00001 CCEEXPERTS FROM
我如何要求此 Django 视图使用 HTTPS？

r login django contrib auth views login template name login html authentication form CustomAuthenticationForm 如何添加所需的 HT
使 Moose 构造函数忽略 undef 参数

哈希表是 Perl 对象的典型初始化器现在您的输入是不可靠的因为您不知道对于任何给定的键是否有定义的值也不知道该键是否存在现在您想要将此类不可靠的输入提供给 Moose 对象虽然缺少键完全没问题但您确实希望摆脱未定义的值这样
平台调用语句中 DLL 的相对路径

我正在使用 VS 2008 开发一个使用 dll 和 P Invoke 的应用程序当我使用绝对路径时我可以成功使用该dll 例如这确实有效 DllImport C myDLL dll 内部静态外部布尔 isReady 这不起作用 Dl
我的 openssl 和 ssl 默认 CA 证书路径是什么？

背景我正在尝试与外部供应商创建 SSL 上下文连接以进行握手然后通过该连接使用 xml 进行通信 clientCert path cert path clientKey path key path PROTOCOL ssl PROTOC
在组件中的“伪构造函数”与“函数 init()”中使用 CFML 代码时

给定例如的伪构造函数在 CFML 中 component Pseudo Constructor start here comes some cfml scripting code Pseudo Constructor end functio
“IconDefinition”类型的参数不可分配给“IconDefinitionOrPack”类型的参数

我在用着Angular 6 角度启动器 https github com gdi2290 angular starter和fontawesome 跟随here https github com FortAwesome angular fon
并行运行多个 R 函数

我有一个数据集其中包含很少的数字列和超过 1 亿行的 data table 对象我想根据其他列对某些列进行分组操作例如对 d 列中每个类别的 a 列的唯一元素进行计数 my data a count uniqueN col a co

并行运行多个 R 函数

并行运行多个 R 函数 的相关文章

随机推荐

热门标签

并行运行多个 R 函数的相关文章