由于 data.table 被引用更改，微基准测试结果检查失败

2023-12-05

SO 有一些答案，其中比较了时间without检查结果。不过，我更喜欢看看表达式是否正确and fast.

The microbenchmark包支持这一点check范围。不幸的是，对改变 a 的表达式的检查失败data.table 引用，即检查无法识别结果不同。

情况 1：data.table 表达式，其中 check 按预期工作

library(data.table)
library(microbenchmark)

# minimal data.table 1 col, 3 rows
dt <- data.table(x = c(1, 1, 10))

# define check function as in example section of help(microbenchmark)
my_check <- function(values) {
  all(sapply(values[-1], function(x) identical(values[[1]], x)))
}

基准案例旨在返回不同的结果。因此，

microbenchmark(
  f1 = dt[, mean(x)],
  f2 = dt[, median(x)],
  check = my_check
)

按预期返回错误消息：

错误：输入表达式不等效。

情况 2：检查失败的 data.table 表达式

现在，表达式被修改为改变dt引用。请注意，使用了相同的检查功能。

microbenchmark(
  f1 = dt[, y := mean(x)],
  f2 = dt[, y := median(x)],
  check = my_check
)

现在返回

 expr     min      lq     mean   median       uq     max neval cld
   f1 576.947 625.174 642.9820 640.7110 661.1870 732.391   100  a 
   f2 602.022 658.384 684.7076 678.9975 694.0825 978.600   100   b

因此，尽管这两个表达式对结果的检查在这里失败了are不同的。（时间无关紧要。）

我了解检查确定失败是因为dt通过引用更改。因此，当比较每个表达式的结果时，总是在最后更改的状态下引用相同的对象。

Question

如何修改检查函数和/或表达式，以便即使在出现以下情况时检查也能可靠地检测到不同的结果data.table通过引用改变？

最简单的方法是使用copy():

microbenchmark(
    f1 = copy(dt)[, y := mean(x)],
    f2 = copy(dt)[, y := median(x)],
    check = my_check, times=1L
)
# Error: Input expressions are not equivalent.

Adding copy(dt)混合后可以了解复制所花费的时间（如果有必要，人们总是可以从运行时中减去该时间）f1 and f2).

microbenchmark(
    f1 = copy(dt)[, y := mean(x)],
    f2 = copy(dt)[, y := median(x)],
    f3 = copy(dt),
    times=10L
)
# Unit: microseconds
#  expr     min      lq     mean   median      uq     max neval cld
#    f1 298.690 306.508 331.6364 315.1400 347.788 414.264    10   b
#    f2 319.075 322.475 373.3873 329.3895 336.268 746.134    10   b
#    f3  19.180  19.750  28.3504  25.1745  26.111  70.016    10   a

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

microbenchmark

由于 data.table 被引用更改，微基准测试结果检查失败的相关文章

闪亮的如何阻止用户访问选项卡？

我需要阻止用户访问其他选项卡直到完成某些操作在这个可重现的示例中我想阻止用户访问Tab 2直到他按下按钮该应用程序如下所示这是该应用程序的代码 library shiny ui lt shinyUI navbarPage tabP
带频率图的 R 热图类型图

I am trying to create a plot like the following 我已经使用 ggplot2 中的 geom tile 粗略地得到了左侧图但我无法弄清楚如何生成右侧图以及如何将两个图放在一起 Example
无法使用include_graphics在Rmarkdown中插入png（错误：文件不是PNG格式）

这个错误很奇怪当我编织文档时出现以下错误 Quitting from lines 42 43 sigminer doc Rmd Error in png readPNG path native TRUE info TRUE file i
通过非 sf 列内连接两个 sf 对象

我尝试使用内连接或左连接连接两个 sf 数据帧这些数据框内部都有几何列我不断收到错误 check join x y 中的错误 y 应该是一个数据框对于空间连接请使用 st joinFALSE 下面的可重现示例 df1 lt data
如何在 dplyr 中使用切片来保留 R 中具有 NA 值的行

我有以下数据集我想知道每个组的最小单词如果没有最小单词它是 NA 我仍然想显示它 df data frame key c A A B B C word c 1 2 3 5 NA df gt group by key gt slice
R 中的优化函数可以接受目标、梯度和粗麻布吗？

我有一个想要优化的复杂目标函数优化问题需要相当长的时间来优化幸运的是我确实有可用的函数的梯度和粗麻布 R 中是否有一个优化包可以接受所有这三个输入 optim 类不接受 Hessian 矩阵我已经扫描了用于优化的 CRAN 任务页面
计算分组序列中两个值之间的差异

这是这篇文章的后续问题循环遍历 R 中的数据帧并测量两个值之间的时间差 https stackoverflow com questions 44885856 loop through dataframe in r and measure
R 中多类分类的 ROC 曲线

我有一个包含 6 个类别的数据集我想绘制多类别分类的 ROC 曲线 Achim Zeileis 给出的第一个答案非常好 R中使用rpart包的ROC曲线 https stackoverflow com questions 30818188
从 foreach 循环赋值

我想并行化一个循环例如 td lt data frame cbind c rep 1 4 2 rep 1 5 rep 1 10 2 names td lt c val id res lt rep NA NROW td for i in l
将值添加到 rCharts hPlot 工具提示

我想通过 rCharts 向标准 Highcharts 工具提示添加一些额外的值示例代码 require rCharts df lt data frame x c 1 5 y c 5 1 z c A B C D E name c K L
R：如何添加具有从矩阵的每一行中随机选择的值的列？

我会先说我是一个 R 菜鸟我认为这可能有一个简单的解决方案但我正在努力寻找它我有一个 2 列 1 000 行的矩阵保持行固定我想创建一个新变量从两列中随机选择一个元素例如制作一个简单的矩阵 matrix c 1 1 4 6 1
当按多列分组时，如何命名 dplyr 中的 group_split 列表

我在 dplyr 中使用 group split 在分割了多个列后我很难命名列表当我们按一列分组时我知道该怎么做here https stackoverflow com questions 57107721 how to name t
R 中有没有快速替换列值的方法？

假设我们有一个包含数值的数据框如下所示 Temperature Height 32 157 31 159 33 139 我想更换Height价值观与pic 00001 pic 00002等等最终结果是 Temperature Heigh
从 data.frame 创建新列

我有一个长格式的数据集其中测量时间嵌套在 Networkpartners NP 中而 Networkpartners NP 又嵌套在人员 ID 中下面是它的示例真实数据集有数千行 ID NP Time Outcome 1 11
使用facet时ggplot2控制每行的面板数量？

Is it possible to control the number of panels per row in a ggplot I can only get an equal number of panels on each row
在 R 中使用 gamlss::lms 选择百分位数曲线

我正在使用 gamlss 包中的示例代码来绘制百分位数曲线 library gamlss data abdom lms y x data abdom n cyc 30 它正在绘制自己的一组百分位数曲线如何选择只绘制第 10 50 和 90
如何在ggplot2中使用希腊符号？

我的类别需要用希腊字母命名我在用ggplot2 并且它与数据配合得很好不幸的是我无法弄清楚如何将这些希腊符号放在 x 轴上在刻度线处并使它们出现在图例中有什么办法可以做到吗更新我看了一下link https github c
R 的 dplyr 切片中的奇怪行为

打电话时slice df i 在 R 的 dplyr 包中如果我要求的行索引不存在 nrows lt i 它似乎返回除组中的第一行之外的所有行就像我调用的那样slice df 1 例如 library dplyr c1 lt c a b
R：邻接表到邻接矩阵

Bonjour 我想将邻接列表 3 列转换为邻接矩阵在这个论坛中我找到了多个有关如何将边列表转换为邻接矩阵的示例我成功地为两列列表做到了这一点我已经尝试了在网上可以找到的所有解决方案但似乎我错过了一小步我尝试过的我的变量是用
如何更改 Quarto pptx 中的字体格式

我正在 R 中使用 Quarto 创建 pptx 要更改我尝试更改的默认字体格式mainfont范围但是当我渲染它时最终的 pptx 文件具有默认字体 Calibri 这是我的文件 YAML 将 Quarto 文件渲染为 pptx 时如

随机推荐

使用 ref setAccessibilityFocus 不起作用

我正在使用ref支柱连同findNodeHandle在一堆组件上以便能够触发AccessibilityInfo setAccessibilityFocus 然而它并不总是按预期工作有时参考是null虽然componentDidMount
将所有列（表中）的所有零（如果有）更改为...例如 1

我有一个包含 18 列均为整数和 1040 行的表如果任何值为零我想将其更改为 1 我正在使用 Postgresql 做这个的最好方式是什么我无法想出一个简单的更新语句而且我是数据库新手关于我应该看什么来学习如何实现这样的事情
AspectJ - 使用类型间声明创建全局记录器字段

我想创建一个类型间声明在每个类中声明一个静态最终 Logger 实例构造函数应该传递给封闭类Klazz class value Aspect public class LoggerAspect public interface Log
安装 Gulp 后：“找不到命令‘gulp’”

安装后gulp js通过 npm 我收到了no command gulp found运行时出错gulp来自安装到的同一目录的命令当查看下方时node modules bin 目录我可以看到gulp在那里可执行我的npm安装有问题吗这
C# 中何时使用“using”块？如何在 C# 中使用“using”块？

我在大多数样本中看到SqlCommand像这样使用 using SqlConnection con new SqlConnection CNN STRING using SqlCommand cmd new SqlCommand Selec
jQuery 对话框中的单击事件发生两次？

我一直在处理一个奇怪的问题 click 每当放置在 jQuery 对话框中时事件就会发生两次我的简单测试用例如下活生生的例子在这里 div style display none a href Test Link a div
使用 foreach 而不是 while 循环循环 mysql_fetch_assoc [关闭]

Closed 这个问题需要细节或清晰度目前不接受答案我有一个 mysql 查询 result mysql query my query 有没有办法让这样的事情发挥作用 results mysql fetch assoc result f
Emacs 23、OS X、multi-tty 和 emacsclient

如何让 emacs 23 在 OS X 上的多 tty 模式下正常工作我已经添加 server start 到我的 emacs 并发现运行 Applications Emacs app Contents MacOS bin emacscl
什么“类型”是从选择标签中选择的选项

我是 PHP 新手正在尝试获取从 select 标签中选择的选项的值我熟悉某些类型的输入例如单选文本复选框等我的问题是类型是从选择标签中选择的选项前三种形式工作得很好但第四种则不行这是我的代码
Akka 路由：回复发送到路由器最终成为死信

我正在使用 Actor 路由但无法将回复发送回路由器以便路由列表中的另一个 Actor 可以接收到此消息我在用着 sender tell Message context parent 为了根据 akka 文档回复路由器路由参与者将发
带有 .htaccess 的 SEO 友好 URL

有人可以帮我重写一些 URL 吗我有例如这些页面 www mydomain com test gallery asp id 2 www mydomain com test gallery asp id 3 并希望他们被要求为 www
html onchange 事件不起作用

我正在尝试做一些实验我想要发生的是每次用户在文本框中输入内容时它都会显示在对话框中我用的是onchangeevent 属性来使其发生但它不起作用我仍然需要按提交按钮才能使其正常工作我读到了有关 AJAX 的内容并且正在考虑了
哪些 lua 功能可以用作 python 或 tcl Expect 中的 pexpect？

我有一些 shell 脚本它们将一些消息打印到 stdout 并且如果输出与某些正则表达式匹配我想生成一些其他进程我可能还想将 shell 挂起一段时间直到其他进程给出一些反馈我的要求基本上表现得像shell中的pipe和tcle
mongoDB 中的嵌套对象文本搜索

我不确定如何解决这个问题我想在 mongoDB 集合中搜索并仅返回适合搜索查询的嵌套对象在所有字段上使用文本搜索该集合中的所有文档都具有以下格式 arr id 1 name Random description Hello world
在 RealityKit 中启用手势

我有一个自定义的 usdz 文件不是通过代码创建的而是一把真正的椅子我将其保存在Entity 一旦我有了它这就是我的代码 func updateUIView uiView ARView context Context if let
XSLT-标准化不间断空白字符

我有一个像这样的示例 xml 文件
Azure 门户错误：无法启动虚拟机“xxxx”。错误：URL“xxxx”引用的 Key Vault 机密不存在

在假设我的配置中的任何地方都没有使用这些密钥保管库并且这些是我的测试留下的一些内容之后我从资源管理器中删除了一些密钥保管库现在我无法启动虚拟机并出现此错误消息无法启动虚拟机 xxxx 错误 Key Vault 机密使用 URL xx
使用套接字连接 nat 后面的 ip

考虑一部通过电话 A 连接到 wifi 的电话地址为动态 Ipex 192 168 0 34及其监听服务器套接字port 7567 如果我有另一部电话 B 来连接公共 ip 上的电话我可以通过什么方式使用任何编程语言连接到该套接字10
Orderby ACF 自定义字段日期不起作用

我查看了另一篇文章但什么也没找到我已经上线 3 天了我想按顺序显示 3 个事件 ASC但2018年总是在2017年之前 auj date Ymd queryEvent new WP Query array category name
由于 data.table 被引用更改，微基准测试结果检查失败

SO 有一些答案其中比较了时间without检查结果不过我更喜欢看看表达式是否正确and fast The microbenchmark包支持这一点check范围不幸的是对改变 a 的表达式的检查失败data table 引用即

热门标签