在 R 中更新数据集的最快方法是什么？

2023-12-03

我有一个 20000 * 5 的数据集。目前它正在以迭代方式进行处理，并且数据集在每次迭代中不断更新。

data.frame 中的单元格每次迭代都会更新，并寻求一些帮助来更快地运行这些东西。由于这是一个小的 data.frame，我不确定 data.table 是否可以正常工作。

以下是 data.frame 子分配的基准：

sessionInfo()
R version 3.2.4 Revised (2016-03-16 r70336)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows Server >= 2012 x64 (build 9200)
set.seed(1234)
test <- data.frame(A = rep(LETTERS  , 800), B = rep(1:26, 800),    C=runif(20800), D=runif(20800) , E =rnorm(20800))
microbenchmark::microbenchmark(test[765,"C"] <- test[765,"C"] + 25)
Unit: microseconds
                                  expr     min       lq     mean   median       uq      max neval
 test[765, "C"] <- test[765, "C"] + 25 112.306 130.8485 979.4584 186.3025 197.7565 44556.15   100}

有没有办法比我发布的更快地实现上述功能？

有趣的是，如果您使用 data.table，乍一看似乎并没有更快。当在循环内部使用赋值时，也许它会变得更快。

library(data.table)
library(microbenchmark)
dt <- data.table(test)

# Accessing the entry
dt[765, "C", with = FALSE] 

# Replacing the value with the new one
# Basic data.table syntax
dt[i =765, C := C + 25 ]

# Replacing the value with the new one
# using set() from data.table
set(dt, i = 765L, j = "C", value = dt[765L,C] + 25)

microbenchmark(
      a = set(dt, i = 765L, j = "C", value = dt[765L,C] + 25)
    , b = dt[i =765, C := C + 25 ]
    , c = test[765, "C"] <- test[765, "C"] + 25
    , times = 1000       
  )

微基准测试结果：

                                                   expr     min      lq     mean  median       uq      max neval
 a = set(dt, i = 765L, j = "C", value = dt[765L, C] + 25) 236.357 46.621 266.4188 250.847 260.2050  572.630  1000
 b = dt[i = 765, `:=`(C, C + 25)]                         333.556 345.329 375.8690 351.668 362.6860 1603.482  1000
 c = test[765, "C"] <- test[765, "C"] + 25                73.051  81.805 129.1665  84.220  87.6915 1749.281  1000

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

performance

DataFrame

dataTable

在 R 中更新数据集的最快方法是什么？的相关文章

使用 rvest 进行抓取 - 当标签不存在时，使用 NA 完成抓取

我想解析这个 HTML 并从中获取这个元素 a p标签与class normal encontrado b div with class price 有时 p某些产品中不存在标签如果是这种情况 NA应添加到从该节点收集文本的向量中这个
将 SAS sas7bdat 数据读入 R

R 有哪些选项可以读取本机 SAS 格式的文件 sas7bdat 进入R The NCES 共同核心 https nces ed gov ccd pubschuniv asp例如包含以此格式保存的大量数据文件存储库为了具体起见让我们集
在两个向量之间交换元素（交叉）

假设我有 chromosome 1 lt c 0010000001010000 chromosome 2 lt c 0100000001001010 我该如何实施step 3 5 Evaluate NC1 否中 1 个chromosome
计算网格中物种的出现次数

我有大约500 000点R美国各地候鸟物种的出现数据我试图在这些点上覆盖网格然后计算每个网格中出现的次数统计完计数后我想将它们引用到网格单元 ID 在 R 中我使用了over 函数只获取范围图中的点这是一个形状文件 Read i
改进C++逐行读取文件的能力？

我正在解析大约 500GB 的日志文件我的 C 版本需要 3 5 分钟我的 Go 版本需要 1 2 分钟我正在使用 C 的流来流式传输文件的每一行以进行解析 include
IN 运算符对 SQL 查询性能的影响有多大？

我的 SQL 查询需要 9 个小时才能执行见下文 Select Field1 Field2 From A Where Field3 IN 45 unique values here 当我将此查询拆分为 3 个完全相同的查询仅每个 IN
如果 RCurl::getURL() 执行时间太长，如何停止执行？

有没有办法告诉 R 或 RCurl 包在超过指定时间段时放弃尝试下载网页并转到下一行代码例如 gt library RCurl gt u http photos prnewswire com prnh 20110713 NY34814 b
数据框中按行相关

我正在尝试计算大型数据帧的所有行之间的相关性到目前为止已经提出了一个有效的简单 for 循环例如 name lt c a b c d col1 lt c 43 78 43 84 37 92 31 72 col2 lt c 43 80 4
Mono 实现 CLR 吗？或者至少有一些非托管的内部调用？或无？

我们知道 C 使用非托管代码如 P Invoke 或 CLR 实现的代码如 InternalCall 我想知道的是 mono 它自己实现了一个完整的 CLR 还是只是一些非托管代码或者什么都没有我可以使用 Net Reflactor或
应用程序在加载 xml 布局文件的主线程中做了太多工作

我正在制作一个 9x9 数独网格其中 81 个单元格本身就是一个 3x3 网格单个细胞看起来像这样 1 2 3 4 5 6 7 8 9 每个数字代表该单元格的铅笔注释我有一个名为 cell layout xml 的文件表示这种 3x
R：适合显示具有倾斜计数的数据的图

我有这样的数据 Name Count Object1 110 Object2 111 Object3 95 Object4 40 Object2000 1 因此只有前 3 个物体的计数较高其余 1996 个物体的数量少于 40 个其中
如何从数据框中按降序获取前n家公司

我正在尝试从数据框中获取排名前 n 的公司下面是我的代码 data Forbes2000 package HSAUR sort Forbes2000 profits decreasing TRUE 现在我想从这个排序向量中获取前 50 个
为什么在 R 中绘图时，hovertemplate 无法正确显示某些数据点

mydat2 lt data frame subject c math english chemistry score c 80 50 65 class c A B A count c 50 60 70 library plotly plo
Dplyr 过滤多个类似条件

我正在尝试在 dplyr 中做一个过滤器其中的列就像某些观察结果我可以使用 sqldf 作为 Test lt sqldf select from database Where SOURCE LIKE ALPHA OR SOURCE LI
如何使用 Rcpp 将 C 结构从 C 库公开到 R

我正在尝试将 C 结构从 C 库公开到 R 中例如 struct A int flag 库提供 API 来构造和销毁是很常见的A A initA void freeA A a 感谢RCPP MODULE 很容易暴露它而不考虑析构函数 in
LEFT JOIN 比 INNER JOIN 快得多

我有一张桌子 MainTable 有超过 600 000 条记录它通过第二个表连接到自身 JoinTable 在父子类型关系中 SELECT Child ID Parent ID FROM MainTable AS Child JOIN
有没有一种明智的方法可以在 R 中执行诸如文档字符串之类的操作？

这不仅仅是一个编码风格问题如果您了解 python 我认为 Ruby 也有类似的东西您可以在函数中拥有文档字符串这样您就可以通过发出 help 命令轻松获取该字符串例如 def something t None Do somethi
缩放geom_密度以将geom_bar与y上的百分比相匹配

因为我对数学感到困惑上次我尝试问这个问题 https stackoverflow com questions 32412805 ggplot2 histogram with density curve that sums to 1 这是另一
了解日期并使用 R 中的 ggplot2 绘制直方图

主要问题当尝试使用 ggplot2 制作直方图时我无法理解为什么日期标签和中断的处理无法像我在 R 中预期的那样工作我在找我的约会频率的直方图刻度线位于匹配条下方的中心日期标签在 Y b format 适当的限制最小化网格空
记录类名、方法名和行号的性能影响

我正在我的 java 应用程序中实现日志记录以便我可以调试应用程序投入生产后可能出现的潜在问题考虑到在这种情况下人们不会奢侈地使用 IDE 开发工具以调试模式运行事物或单步执行完整代码因此在每条消息中记录类名方法名和行号将非常有

随机推荐

npm 相当于纱线分辨率？

有没有一个npm相当于纱线分辨率功能 npm package json 中没有提及它docs 例如我想安装 email protected 以及 3 3 2 中的依赖项之一 lerna publish 目前正在这样做yarn像这样但更喜欢
如何在python中修改指定位置添加多行？

我有一个数据框我想按以下方式复制和行 d pd DataFrame col1 a b c d col2 12 13 14 16 所需输出想要复制行 a1 a2 b1 b2 col1 col2 a 12 a1 12 a2 12 b 12
Pythonic 自定义排序字母等级“D”、“C-”、...、“A+”？

有没有比这更 Pythonic 紧凑直观的方法来对字母等级进行排序不使用自定义字典 grades B C B C A D B C A D A sorted grades key lambda g g 0 index g 1 A A A
在 C++11 中使用智能指针包装旧的 C 结构并自动释放它们

我在用着Word Net 一个由普林斯顿大学在九十年代开发的旧 C 库该库是用 C 编写的仅显示标头但不显示其实际实现我使用的唯一结构是 SynsetPtr 我调用的两个函数是 findtheinfo ds traceptrs ds
通过添加 List() 和另一个模型类来执行迁移

我有以下型号 class Area Object Specify properties to ignore Realm won t persist these override static func ignoredProperties g
如何强制表格单元格内容换行？

这是整个页面 wrappable 在 main css 文件中定义 Wrappable cell Add this class to make sure the text in a cell will wrap By default dat
用其复选框包装一些输入并发送到数据库

重点是如何选择与选中的复选框同一行中的所有输入元素 MARK NAME QUANTITY PRICE inputForName1 inputForQuantity1 inputForPrice1
按短语列表过滤 pandas 列

我有一串叙述专栏每个叙述基本上都是一篇文章我想获取存在某些短语的 df 的子集当前的方法没有按预期工作我正在过滤不完全包含该短语或仅包含该短语的子集的行我尝试过以下方法 phrase went to the store to bu
多线程应用程序中的静态计数器线程安全吗？

public class counting private static int counter 0 public void boolean counterCheck counter if counter 10 counter 0 方法 c
基于 Altair 中的 alt.Color 字段排序

我正在尝试根据水平条形图所属的组对其进行排序我已经包含了数据框我认为可以进行分组排序的代码和图像该图表目前是根据物种列按字母顺序排序的但我希望它按组排序以便所有坏都在一起同样所有好都在一起理想情况下我想更进一步以
Symfony：PHP 致命错误：允许的内存大小

我尝试运行此命令在我的 symfony 项目 1 4 中构建模型 php symfony propel build model or all 我有这个错误 PHP Fatal error Allowed memory size of 335
关于刷新令牌的一些问题

当我使用 jsonwebtokens 时我对刷新令牌的使用和或背后的原因有一些疑问更令人困惑首先为什么需要它我完全理解用于获取新访问令牌的短期访问令牌和长期刷新令牌的全部内容但我觉得这使得刷新令牌同样容易受到攻击甚至可能比普
如何使用 Parcel 从 @font-face 加载字体？

我正在使用 Parcel 进行捆绑并且我想将自定义字体包含到我的项目中在我的 SCSS 中 font face font family Storytella src url fonts Storytella otf format otf
Neo4j 嵌入式数据库在应用程序异常终止后挂起

我打算公开我的第一个基于 Neo4j 嵌入式数据库的应用程序但遇到了严重的阻塞问题这是我之前遇到的数据库删除问题有效清理Neo4j数据库 I use OS Windows 8 1 jdk1 8 0 51 neo4j version 2
mysqli_affected_rows 和 mysqli_num_rows 有什么区别？

The mysqli num rows 的 PHP 文档 says 返回结果集中的行数 The mysqli affected rows 的 PHP 文档 says 返回受最后一个 INSERT UPDATE REPLACE 或 DELET
如何在 MVC3 中的 JQuery ajax 调用上重定向到新页面（以及模型）

我忘记了密码页面用户在其中输入用户名并单击验证按钮来检查他所在的组根据组我们需要显示不同的部分视图现在假设它是电话号码这一页填写有效信息后如果成功我将重定向到一个新页面他将在其中更新他的密码如果失败我需要显示错误消
新值仅在 sendAsynchronousRequest 中可用 - Swift

var arrayData String let bodyData parameter test let URL NSURL NSURL string Link to php file let request NSMutableURLReq
表达式树 lambda 不能包含 null 传播运算符

线路price co price 0 下面的代码给了我上面的错误但是如果我删除 from co 效果很好我试图跟随这个 MSDN 示例他们在哪里使用在线的select new person FirstName PetName subp
自（iOS 7 发布）以来，有没有办法在 PC/Mac 上无需使用 iTunes 即可获取 UDID？

我正在为我的公司开发一款应用程序我们正在经历通过将人们的 iPad 添加到公司的 iOS 开发中心帐户来慢慢让人们进入测试版的过程从那里我们为本地 Intranet 分发进行临时构建在我的最后一次演出中我会引导人们使用其中一个
在 R 中更新数据集的最快方法是什么？

我有一个 20000 5 的数据集目前它正在以迭代方式进行处理并且数据集在每次迭代中不断更新 data frame 中的单元格每次迭代都会更新并寻求一些帮助来更快地运行这些东西由于这是一个小的 data frame 我不确定 dat

在 R 中更新数据集的最快方法是什么？

在 R 中更新数据集的最快方法是什么？ 的相关文章

随机推荐

热门标签

在 R 中更新数据集的最快方法是什么？的相关文章