向量上的修改时复制语义不会在循环中追加。为什么？

2023-11-23

这个问题听起来似乎得到了部分回答here但这对我来说还不够具体。我想更好地理解何时通过引用更新对象以及何时复制对象。

更简单的例子是向量增长。下面的代码在 R 中效率极低，因为在循环之前没有分配内存，并且在每次迭代时都会创建一个副本。

  x = runif(10)
  y = c() 

  for(i in 2:length(x))
    y = c(y, x[i] - x[i-1])

分配内存可以保留一些内存，而无需在每次迭代时重新分配内存。因此，这段代码的速度要快得多，尤其是对于长向量。

  x = runif(10)
  y = numeric(length(x))

  for(i in 2:length(x))
    y[i] = x[i] - x[i-1]

我的问题来了。实际上当向量更新时does移动。有一个副本，如下所示。

a = 1:10
pryr::tracemem(a)
[1] "<0xf34a268>"
a[1] <- 0L
tracemem[0xf34a268 -> 0x4ab0c3f8]:
a[3] <-0L
tracemem[0x4ab0c3f8 -> 0xf2b0a48]:

但在循环中这个副本不会发生

y = numeric(length(x))
for(i in 2:length(x))
{
   y[i] = x[i] - x[i-1]
   print(address(y))
}

Gives

[1] "0xe849dc0"
[1] "0xe849dc0"
[1] "0xe849dc0"
[1] "0xe849dc0"
[1] "0xe849dc0"
[1] "0xe849dc0"
[1] "0xe849dc0"
[1] "0xe849dc0"
[1] "0xe849dc0"

我理解为什么代码作为内存分配的函数而慢或快，但我不理解 R 逻辑。为什么以及如何，对于同一个语句，在一种情况下通过引用进行更新，在另一种情况下通过副本进行更新。在一般情况下，我们如何知道会发生什么。

Hadley 的《Advanced R》一书中对此进行了介绍。在其中他说（这里解释一下）每当两个或多个变量指向同一个对象时，R 将创建一个副本，然后修改该副本。在进入示例之前，哈德利的书中也提到了一个重要的注意事项，即当您使用RStudio

环境浏览器会引用您在命令行上创建的每个对象。

鉴于您观察到的行为，我假设您正在使用RStudio我们将看到这将解释为什么实际上有 2 个变量指向a而不是您可能期望的 1。

我们将用来检查有多少变量指向一个对象的函数是refs()。在您发布的第一个示例中，您可以看到：

library(pryr)
a = 1:10
refs(x)
#[1] 2

这表明（这就是你发现的）有两个变量指向a因此任何修改a将导致 R 复制它，然后修改该副本。

检查for loop我们可以看到y总是有相同的地址refs(y) = 1在 for 循环中。y没有被复制，因为没有其他引用指向y在你的函数中y[i] = x[i] - x[i-1]:

for(i in 2:length(x))
{
  y[i] = x[i] - x[i-1]
  print(c(address(y), refs(y)))
}

#[1] "0x19c3a230" "1"         
#[1] "0x19c3a230" "1"         
#[1] "0x19c3a230" "1"         
#[1] "0x19c3a230" "1"         
#[1] "0x19c3a230" "1"         
#[1] "0x19c3a230" "1"         
#[1] "0x19c3a230" "1"         
#[1] "0x19c3a230" "1"         
#[1] "0x19c3a230" "1"

另一方面，如果引入一个非原始的的函数y在你的for loop你会看到这个地址y每次都会发生变化，这更符合我们的期望：

is.primitive(lag)
#[1] FALSE

for(i in 2:length(x))
{
  y[i] = lag(y)[i]
  print(c(address(y), refs(y)))
}

#[1] "0x19b31600" "1"         
#[1] "0x19b31948" "1"         
#[1] "0x19b2f4a8" "1"         
#[1] "0x19b2d2f8" "1"         
#[1] "0x19b299d0" "1"         
#[1] "0x19b1bf58" "1"         
#[1] "0x19ae2370" "1"         
#[1] "0x19a649e8" "1"         
#[1] "0x198cccf0" "1"

注意强调非原始的。如果你的函数是y是原始的，例如- like: y[i] = y[i] - y[i-1]R 可以对此进行优化以避免复制。

感谢@duckmayr 帮助解释了 for 循环内的行为。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

passbyreference

passbyvalue

向量上的修改时复制语义不会在循环中追加。为什么？的相关文章

安装 gplots 时出错

我正在 OSX v 10 9 2 上运行 R v 3 0 3 当尝试使用以下命令在 R studio 中安装 gplots 包时出现错误 gt library gplots Error in library gplots there is
收集四列，其中两个键中包含值

已经提出了类似的问题但它们都涉及在一个关键列中收集多个列我需要两个键中的多个列这是我的数据框 ID measure A 1 measure A 2 measure B 1 measure B 2 1 8 25 23 5 4 5 2 8
ess-rdired：我收到此错误“现在没有 ESS 进程与此缓冲区关联”

To use ess rdired为了浏览对象我按照 ESS 手册并将以下内容添加到我的 emacs autoload ess rdired ess rdired View R objects in a dired like buffer
tidyverse 干扰 ggplot2 吗？无法访问map_data

在控制台中运行这些命令输出为 gt cty0 ggplot2 map data county gt library tidyverse Loading tidyverse ggplot2 Loading tidyverse tibble
距数据帧中最近的非 NA 值的距离

我有以下数据帧 df 我想添加一列其中包含与每行最接近的非 NA 值的距离 df lt data frame x 1 20 df c 1 3 4 5 11 14 15 16 x lt NA 换句话说我正在寻找以下值 df distanc
mlogit：需要 TRUE/FALSE 时缺少值

我有来自离散选择实验 DCE 的数据该实验研究了来自不同行业的个人的招聘偏好我已经格式化为长格式我想使用 mlogit 进行建模我已导出数据并且可以使用 asclogit 命令在 Stata 中成功运行模型但在 R 中运行时遇到
在 R 中使用深度网络和 MNIST 数据读取手写数字第 3 部分

我尝试编写一个基于深度网络的程序来读取手写数字我在 Youtube 上找到了一个代码 https www youtube com watch v 5bso 5X7Zu4 https www youtube com watch v 5bso
R - 通过合并和超过 2 个后缀进行减少（或者：如何合并多个数据帧并跟踪列）

我正在尝试基于 2 列合并 4 个数据帧但要跟踪列源自哪个数据帧我在跟踪列时遇到问题参见 dput dfs 帖子末尾 df example df1 Name Color Freq banana yellow 3 apple red 1
行方向变异的有效方法

我有两个数据框 dfUsers and purchases使用以下代码生成 set seed 1 library data table dfUsers lt data table user letters 1 5 startDate sam
R 中的点图每行有多个值

我有以下 R 输入文件 car 1 car 2 car 3 car2 1 car2 2 car2 3 然后我使用以下命令来绘制图表 autos data 点图 autos data V2 autos data V1 但这将每个汽车和 ca
跨类别和列自动化卡方

我有一个调查数据框其中包含几个问题列编码为 1 同意 0 不同意受访者行根据年龄年轻中年老年地区东中西等指标进行分类大约有30个类别总共 3个年龄 3个地区 2个性别 11个职业等在每个指标中类别不重叠且
Shiny ：针对所有错误显示一条消息

我在 R 的 Shiny 中有一个应用程序我想处理消息以便用户看不到发生了什么错误我知道通过 tags style type text css shiny output error visibility hidden shiny ou
使用 R Markdown 文档作为函数源

我正在研究 R Markdown 来记录我经常使用的功能我会将它们放入 R Markdown 文件中以记录它们然后如果我几个月后回来查看它就能够阅读我在函数背后的想法我的问题是如果我开始一个新的 R 项目是否可以获取 r mar
如何不显示 ggplot 轴上的所有标签？

I m trying to using ggplot2 to plot this But as you can see on the x axis you can t read anything 那么如何在 x 轴上显示每 10 年的值呢
如何创建 highcharter 事件函数以在 Shiny R 中创建“下拉函数”

我正在建造一个shiny应用程序我想要完成的事情之一是创建一个下拉菜单我想将劳动力变量绘制为不同级别的年份变量的函数请参阅下面的示例数据框 year level 2 level 3 labour 1 2013 10 101 1 2 2
使用 R 将日期格式的字符串列表/向量转换为 posix 日期类

我有一个日期格式的字符串列表我想将其转换为可以使用 R 操作的 posix 日期列表我该怎么做这就是我所拥有的但我最终得到了一个列表 a lt c 2009 01 01 00 00 00 2009 01 01 00 00 00 z
如何对范围内的行进行分组并考虑第三列？

我有一个遗传数据集我想对基因组中物理上靠近的遗传变异行进行分组我想对每条染色体基因组中某些点范围内的基因进行分组 chrom 我的点数据集包含变体行需要在一定范围内的位置如下所示 chrom low high 1 500 17
使用矢量相应地更改传单线条的颜色

无论如何是否可以根据某些变量的值更改传单线条的颜色我用谷歌搜索发现了这个link http hgoebl github io Leaflet MultiOptionsPolyline demo 然而我想知道是否有一种简单的方法可以在
按名称包含在单个对象中的多个列对 data.frame 进行排序？

我想排序一个data frame由多列组成理想情况下使用基础 R 无需任何外部包尽管如果有必要就这样吧读过如何按列对数据框进行排序 https stackoverflow com questions 1296646 how to s
SparkR 和 Sparklyr 之间导入 parquet 文件所需的时间差异

我正在使用 databricks 导入镶木地板文件SparkR and sparklyr data1 SparkR read df dbfs data202007 source parquet header TRUE inferSchema

随机推荐

安卓模拟器有电话号码吗？

我正在开发一个客户端服务器 Android 应用程序并试图找出如何明确识别服务器的不同手机用户我的第一次尝试是使用 SIM 卡上的电话号码尽管现在我想起来了现在你的电话号码发生变化是多么普遍例如当你更换运营商我想这取决于国
在 Qt 中的两个不同布局中使用相同的小部件

我想在 Qt 的两个不同布局中使用相同的小部件这是我的代码 QWidget myWidget new QWidget QFormLayout layout1 new QFormLayout layout1 gt addWidget myW
Winsock2 - 如何在客户端使用 IOCP

我最近开始学习 Windows 上的 IOCP 并阅读了以下文章 http www codeproject com Tips 95363 Another TCP echo server using IOCP 您可以从以下位置下载本文的示例
ASP.Net Core + Angular 2 应用程序 /home 路由

我已经为此奋斗了一段时间并决定写一篇文章我正在 ASP NET Core 5 0 和 Angular 2 上使用 VS2017 通过从 ASP NET Core 模板包获取的模板构建一个简单的单页应用程序该应用程序应该管理联系人列表数
javascript中的蓝牙耳机按钮事件检测

我正在构建一个网络应用程序在其中检测耳机按钮事件我成功地捕获了插入耳机时的按钮事件现在我正在尝试捕获蓝牙耳机的下一个按钮事件请问对此有什么帮助吗耳机按钮检测代码 document addEventListener volumeup
为什么允许在带有某些 Unicode 字符的注释中执行 Java 代码？

以下代码生成输出 Hello World 不真的尝试一下 public static void main String args The comment below is not a typo u000d System out prin
密集型 PHP 脚本失败并出现“指定的超时已过期”错误 / ap_content_length_filter

运行 MySQL 密集型 PHP 脚本失败 Apache 日志报告了这一点 Wed Jan 13 00 20 10 2010 error client xxx xx xxx xxxx 70007 The timeout specified
如何使用 javascript 将 json 从服务器“流”到客户端

我对 Ajax 和 JSON 非常熟悉可以发送请求并解析 JSON 请求理想情况下我希望收到多个响应以定期更新进度栏这样客户就可以获得积极的反馈我听说过 JSON 流但还没有找到关于如何实现它的好资源有谁知道一个好的资源或如何
Keras 中基于输入数据的自定义损失函数

我正在尝试使用 Keras 创建自定义损失函数我想根据输入计算损失函数并预测神经网络的输出我尝试使用 Keras 中的 customloss 函数我认为 y true 是我们为训练给出的输出 y pred 是神经网络的预测输出下面的
在 Capistrano 3 中永久切换用户（单独授权和部署）

我们在服务器管理中有以下模式所有用户都有自己的用户但部署完全由特殊的部署用户执行无法直接登录我们在 Capistrano 2 x 中使用了这个方法 default run options shell sudo u deploy ba
使用Unity将对象注入到IValueConverter实例中

我在 Silverlight 5 项目中有一个 IValueConverter 实例它将自定义数据转换为不同的颜色我需要从数据库中读取实际的颜色值因为这些值可以由用户编辑由于 Silverlight 使用异步调用通过实体框架从数据库
如何使元素水平和垂直居中

我试图将选项卡内容垂直居中但是当我添加 CSS 样式时display inline flex 水平文本对齐消失如何为每个选项卡同时进行 x 和 y 文本对齐 box sizing border box leftFrame backgro
Flutter 中已弃用“canLaunch”

我用过网址启动器包裹 String query Uri encodeComponent Utils getSelectedStoreAddress var appleUrl maps q query var googleUrl https
Primefaces p:fileUpload 在 IE 10 中不起作用

p fileUpload 中的更新属性和 onComplete 在 IE10 中不起作用在 IE 9 中 sizeLimit 属性被忽略有谁遇到过这种情况吗我尝试通过在 p fileUoload 上使用 onComplete 属性来调
如何在Python中查找两个日期之间的星期一或任何其他工作日的数量？

我有两个日期我需要找出有多少个周一至周五到来除周六周日每天都应该计算在内目前我在想 import calendar import datetime start date datetime datetime strptime 01
如何在带有 Entity Framework Core 1.0 (EF7) 的脚手架 DbContext 中使用数据库视图

很遗憾实体框架核心 1 0 以前称为实体框架 7 尚不支持视图我正在尝试使用表来伪造它然而脚手架dotnet dbcontext ef scaffold命令当前无法识别或生成视图我想要一个允许查询视图和更新表的 DbContext
在 getStaticProps 函数中序列化 Next.js 时出错？

我在用着getStaticProps 函数我无缘无故地收到此错误错误序列化错误 posts 0 从返回getStaticProps在原因 object object Object 无法序列化为 JSON 请仅返回 JSON 可序列化
使用 php 获取 mysql 表中记录总数的最佳方法是什么？

从大表中选择记录总数的最有效方法是什么目前我只是在做 result mysql query SELECT id FROM table total mysql num rows result 有人告诉我如果表中有很多记录这不是很有效或
stringByAppendingPathComponent，它是如何工作的？

编辑 v002 我看了所有的评论我开始明白我应该做什么为此我修改了我的代码见下文我将 newPath 更改为 NSString 删除了 alloc init 和结束 release 因为它现在由系统处理我正在使用 stringB
向量上的修改时复制语义不会在循环中追加。为什么？

这个问题听起来似乎得到了部分回答here但这对我来说还不够具体我想更好地理解何时通过引用更新对象以及何时复制对象更简单的例子是向量增长下面的代码在 R 中效率极低因为在循环之前没有分配内存并且在每次迭代时都会创建一个副本 x ru

向量上的修改时复制语义不会在循环中追加。为什么？

向量上的修改时复制语义不会在循环中追加。为什么？ 的相关文章

随机推荐

热门标签

向量上的修改时复制语义不会在循环中追加。为什么？的相关文章