R data.frame 从另一个变量选择的变量中获取值，向量化

2024-05-04

我收到的数据包含许多类似的变量，还有一个附加变量指示哪些变量one我真正想要的那些类似的变量。使用循环我可以查找正确的值，但是数据很大，循环很慢，而且看起来这应该是可矢量化的。我只是还没弄清楚怎么做。

编辑：所选变量将用作同一数据框中的新变量，因此顺序很重要。还有许多其他变量未在下面给出的示例中显示。

示例数据集：

set.seed(0)
df <- data.frame(yr1 = sample(1000:1100, 8),
                 yr2 = sample(2000:2100, 8),
                 yr3 = sample(3000:3100, 8),
                 yr4 = sample(4000:4100, 8),
                 var = paste0("yr", sample(1:4, 8, replace = TRUE)))
# df
# 
#    yr1  yr2  yr3  yr4 var
# 1 1090 2066 3050 4012 yr3
# 2 1026 2062 3071 4026 yr2
# 3 1036 2006 3098 4038 yr1
# 4 1056 2020 3037 4001 yr4
# 5 1088 2017 3075 4037 yr3
# 6 1019 2065 3089 4083 yr4
# 7 1085 2036 3020 4032 yr1
# 8 1096 2072 3061 4045 yr3

这个循环方法可以达到目的，但速度慢且笨拙：

ycode <- character(nrow(df))
for(i in 1:nrow(df)) {
 ycode[i] <- df[i, df$var[i]]
}
df$ycode <- ycode

# df
#    yr1  yr2  yr3  yr4 var ycode
# 1 1090 2066 3050 4012 yr3  3050
# 2 1026 2062 3071 4026 yr2  2062
# 3 1036 2006 3098 4038 yr1  1036
# 4 1056 2020 3037 4001 yr4  4001
# 5 1088 2017 3075 4037 yr3  3075
# 6 1019 2065 3089 4083 yr4  4083
# 7 1085 2036 3020 4032 yr1  1085
# 8 1096 2072 3061 4045 yr3  3061

看来我应该能够对其进行矢量化，如下所示：

df$ycode <- df[, df$var]

但我发现结果令人惊讶：

#    yr1  yr2  yr3  yr4 var ycode.yr3 ycode.yr2 ycode.yr1 ycode.yr4 ycode.yr3.1 ycode.yr4.1 ycode.yr1.1 ycode.yr3.2
# 1 1090 2066 3050 4012 yr3      3050      2066      1090      4012        3050        4012        1090        3050
# 2 1026 2062 3071 4026 yr2      3071      2062      1026      4026        3071        4026        1026        3071
# 3 1036 2006 3098 4038 yr1      3098      2006      1036      4038        3098        4038        1036        3098
# 4 1056 2020 3037 4001 yr4      3037      2020      1056      4001        3037        4001        1056        3037
# 5 1088 2017 3075 4037 yr3      3075      2017      1088      4037        3075        4037        1088        3075
# 6 1019 2065 3089 4083 yr4      3089      2065      1019      4083        3089        4083        1019        3089
# 7 1085 2036 3020 4032 yr1      3020      2036      1085      4032        3020        4032        1085        3020
# 8 1096 2072 3061 4045 yr3      3061      2072      1096      4045        3061        4045        1096        3061

我还尝试了 *apply 的多种变体，但没有一个能够接近。一些尝试：

> apply(df, 1, function(x) x[x$var])
Error in x$var : $ operator is invalid for atomic vectors
> apply(df, 1, function(x) x[x[var]])
Error in x[var] : invalid subscript type 'closure'

有任何想法吗？非常感谢..

我们可以使用行/列索引。与循环相比，它应该很快。

 df[-ncol(df)][cbind(1:nrow(df),match(df$var,head(names(df),-1)))]
 #[1] 3050 2062 1036 4001 3075 4083 1085 3061

只是为了一些多样性，data.table解决方案是（与上面的索引相比应该慢）。将“data.frame”转换为“data.table”（setDT(df)），按行的顺序分组，我们get转换后'var'的值character class.

library(data.table)
setDT(df)[, ycode := get(as.character(var)) , 1:nrow(df)]
df
#    yr1  yr2  yr3  yr4 var ycode
#1: 1090 2066 3050 4012 yr3  3050
#2: 1026 2062 3071 4026 yr2  2062
#3: 1036 2006 3098 4038 yr1  1036
#4: 1056 2020 3037 4001 yr4  4001
#5: 1088 2017 3075 4037 yr3  3075
#6: 1019 2065 3089 4083 yr4  4083
#7: 1085 2036 3020 4032 yr1  1085
#8: 1096 2072 3061 4045 yr3  3061

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R data.frame 从另一个变量选择的变量中获取值，向量化的相关文章

R中整数类和数字类有什么区别

我想先说我是一个绝对的编程初学者所以请原谅这个问题是多么基本我试图更好地理解 R 中的原子类也许这适用于一般编程中的类我理解字符逻辑和复杂数据类之间的区别但我正在努力寻找数字类和整数类之间的根本区别假设我有一个简单的向量x
在 igraph 中为社区分配颜色

我在 igraph 中使用 fastgreedy community 检测算法在 R 中生成社区代码返回 12 个社区但是在绘图时很难识别它们因为它返回的图的颜色数量有限我怎样才能用十二种不同的颜色绘制这个图表 l2 lt layo
手动设置scale_fill_distiller()的比例

我正在尝试制作一系列图表进行比较举例来说我想使用iris数据集来制作这样的图其中我已过滤以仅查看 setosa 物种 library ggplot2 library dplyr iris gt filter Species setos
如何自动启动我的 ec2 实例、运行命令然后将其关闭？

我想每周对 redshift postgres 数据库中的数据运行一次机器学习模型我使用以下命令将 R 脚本设置为休息 apiplumbr然后我将其设置为一项任务来管理pm2 我有它所以任务会在ec2实例启动然后继续运行要让 R 脚本
当有很多列时，使用 readr::read_csv() 导入数据时覆盖列类型

我正在尝试使用 R 中的 readr read csv 读取 csv 文件我导入的 csv 文件大约有 150 列我只包含示例的前几列我希望将第二列从默认类型我执行 read csv 时为日期覆盖为字符或其他日期格式 GIS Jo
按特定样本前缀对列名称向量进行子集化

假设我有一个如下所示的数据框 ca01 lt c 1 10 ca02 lt c 2 11 ca03 lt c 3 12 stuff 1 lt rep test 10 other lt rep 9 10 data lt data frame
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
R 中按时间划分的平均值

我每秒测量一次化合物浓度我想求 30 秒和 60 秒的平均值我一直在阅读这里的帖子我尝试过lubridate and dplyr 但没有运气我正在努力完成这项工作但我一直没能做到我正在从 SAS 过渡到 R 所以请耐心等待这是
如何在knitr和RStudio中为word和html设置不同的全局选项？

我正在使用 RStudio 0 98 932 和 knitr 1 6 想要为word和html设置不同的全局knitr选项例如想要将word的fig width和fig height设置为6 html的fig width和fig hei
一段 R 代码会影响 foreach 输出中的随机数吗？

我使用运行模拟foreach and doParallel并与随机数名为random在代码中简而言之我模拟一个足球联赛随机生成所有比赛的获胜者以及相应的结果在dt base没有比赛进行在dt ex1 and dt ex24场比赛
获取函数的命名空间

我正在开发一个包我希望在其中向对象添加编辑历史记录该包允许其他包注册用于编辑对象的函数我正在寻找一种方法来记录注册用于编辑的函数的包的版本问题是给定一个函数如何从导出的位置获取包我的想法是调查它的搜索路径但是search 仅
如何在 R 中合并同名列表中的数据框？

我有一个包含很多数据框的列表如果它们具有相同的名称我想合并它们即合并所有具有相同名称 a 和 b 的数据框像这样 a lt aaaaa b lt bbbbb c lt ccccc g lt list df1 lt data fram
如何对数字进行四舍五入并使其显示零？

R 中将数字四舍五入到小数点后 2 位的常用代码是 gt a 14 1234 gt round a digits 2 gt a gt 14 12 但是如果该数字的前两位小数位为零则 R 会在显示中抑制零 gt a 14 0034 gt
将字符串列拆分为多个虚拟变量

作为 R 中 data table 包的相对缺乏经验的用户我一直在尝试将一个文本列处理为大量指示符列虚拟变量每列中的 1 表示特定的子字符串是在字符串列中找到例如我想处理这个 ID String 1 a b 2 b c 3 c 进入
尝试使用 JRI 将 R 与我的 Java 应用程序集成，但出现错误。谁能解释一下原因和解决办法吗？

我需要将 Java 与 R 集成来运行一些数学命令并使用 R 的功能进行绘图以下部分代码给出了错误 public static void main String args HelloRWorld r new HelloRWorld r h
R - 计算 bin 中特定值的数量

我有一个如下所示的数据框 df Value lt c 1 1 0 2 1 3 4 0 0 1 2 0 3 0 4 5 2 3 0 6 Sl lt c 1 20 df lt data frame Sl Value gt df Sl Value
使用officer R导出时如何提高ggplots的分辨率

我想将图表导出到 PPT 并使用Officer 包来实现相同的目的但是图表的默认分辨率较低我想更改它我目前正在使用以下电话 ph with gg p1 type chart res 1200 其中 p1 是 ggplot 对象运行
访问或解析 R 中的 summary() 中的元素

我运行以下 R 命令来进行 Dunnett 测试并获取摘要如何访问下面线性假设的每一行这是摘要输出的一部分基本上我不知道摘要的结构我尝试使用名称但它似乎不起作用因为我没有看到任何命名属性来提供这一点 library multco
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
picker输入字体或背景颜色

我在闪亮的仪表板中使用 pickerInput 这很好除了一个问题背景颜色和字体颜色太相似使得过滤器选择难以阅读有什么办法可以改变背景或字体颜色吗如果可能的话我想继续使用 pickerInput 但如果有一个带有 selectI

随机推荐

用于解析网页链接的正则表达式？

我正在寻找一个 NET 正则表达式来从网页中提取所有 URL 但还没有找到一个足够全面的表达式来涵盖指定链接的所有不同方式还有一个附带问题有没有一个正则表达式来统治它们或者我最好使用一系列不太复杂的正则表达式并且只对原始 HTML
.NET、C#、LINQ、SQL 和 OR 映射 - 我只是不明白:(

我只是不明白我什至不确定我是否在寻找正确的方向问题这就是我的 C 应用程序我通过 SSH 连接到在线 MySQL 数据库现在我可以使用 MySQL Connector Net 驱动程序 http dev mysql com dow
valgrind 检测到分离 pthread 的数据争用

我正在创建两个detached线程 pthread attr t tha1 void fun1 void return 0 void fun2 void return 0 int main pthread t th1 th2 pthread
Common Lisp——为什么这个符号不是外部的？

我正在尝试在 ASDF 中运行测试如下所示 foo asd defsystem foo tests depends on foo fiveam components module tests components file main pe
delphi中生成随机数

我想在delphi中创建一个随机数并将其分配给文件作为文件名我设法做到了这一点但是当我单击按钮生成数字时它总是以 0 开头知道如何修复它 procedure TForm1 Button1Click Sender TObject va
在 AIX 中启动 C++ 可执行文件时出错

在我们的应用程序从 HP 迁移到 AIX 的过程中我遇到了一个独特的问题以下模拟代码在 HP 和 AIX 中产生不同的结果是的即使您不打算调用代码不使用库函数仍然可能是一个错误它可以将某些组件的加载推迟到稍后因此它可能不会导
序列化文件类型 jQuery

我正在尝试使用序列化我的表单数据包括文件图像字段jquery form jsjQuery API 该 API 正在帮助我序列化数据字段包括图像并返回图像对象 object file 这是我的序列化代码 var data js form
使用 R 从 Microsoft Outlook 发送电子邮件时的 Html 表输出格式

我正在尝试使用以下方法将数据框转换为 html 表htmlTable打包然后使用 Microsoft Outlook 作为电子邮件客户端发送电子邮件RDCOMClient通过附加 html 表作为电子邮件正文来进行打包我是 HTML 编
为什么android SQLite可以将双精度值（java 8字节）存储到float列中

Create Table db execSQL CREATE TABLE PERSONS TABLE PersonsColumns ID INTEGER PRIMARY KEY AUTOINCREMENT PersonsColumns HE
由于辅助功能设置而未检测到 iOS 手势

我正在开发的应用程序需要三点滑动手势我已经成功地实现了这个使用UIGestureRecognizer大多数情况下它工作得很好但是如果您打开设备的缩放辅助功能设置设置 gt 常规 gt 辅助功能 gt 缩放则会停止识别该手势缩
具有重复名称的 WSDL — 如何强制 Java 类名称

背景我们正在开发一个与多个第三方网络服务通信的应用程序遗憾的是其中一个使用糟糕的命名约定定义了 WSDL 文件响应元素及其使用的复杂类型经常重复使用相同的名称下面的代码片段显示了这样一个例子
在注释处理器中获取字段类

我正在编写我的第一个注释处理器并且遇到了一些看似微不足道的问题但我找不到有关它的任何信息我有一个用我的注释注释的元素 MyAnnotation String property 当我将此属性作为处理器中的元素获取时我似乎无法以任何方式
使用 React 更新关于 props 变化的 C3 图表

我试图在数据更改时美化作为 React 组件编写的 C3 图表的更新数据通过父组件的 props 流向组件我现在拥有的解决方案有效但似乎并不是最优的当新数据进入时整个图表都会重新生成我想过渡到新状态线条移动而不是整个图表眨眼
如何在 UIStackView 中垂直和水平居中

I have a simple UIImageView with 50x50 size If I had a UIView of size 100x100 and I wanted to center the image inside of
如何以编程方式滚动面板

我有一个System Windows Forms Panel有一些内容我正在尝试以编程方式向上或向下滚动面板垂直我尝试过设置AutoScrollPosition属性为新的Point在面板上但这似乎并没有做到这一点我有AutoScr
UIView的setNeedsLayout、layoutIfNeeded和layoutSubviews之间有什么关系？

谁能对两者之间的关系给出明确的解释UIView s setNeedsLayout layoutIfNeeded and layoutSubviews方法以及一个使用所有三个的示例实现谢谢让我感到困惑的是如果我将自定义视图发送给set
带填充零的十六进制格式

将整数类型格式化为十六进制字符串时我无法让它用零填充数字 println 4x 0x0001 as u16 gt 0x1 but expected 0x0001 println 02x 0x0001 as u16 gt 0x1 same
Angular js中两个$scope数组的区别

有没有办法返回 angularjs 范围内存在的两个数组之间的差异例如 scope user1 a b scope user2 a b c d 这两者的区别应该给我另一个 scope user3 c d Underscore js对此有不
使用主题函数在 body 标记后插入代码

我试图在开头添加一段代码everyDrupal 站点中的页面因为我有不止一个page模板我想以编程方式执行此操作但没有成功我还是个新手虽然我了解了钩子主题函数等的要点但我只是想不出实现这一目标的正确方法到目前为止我已经覆盖了
R data.frame 从另一个变量选择的变量中获取值，向量化

我收到的数据包含许多类似的变量还有一个附加变量指示哪些变量one我真正想要的那些类似的变量使用循环我可以查找正确的值但是数据很大循环很慢而且看起来这应该是可矢量化的我只是还没弄清楚怎么做编辑所选变量将用作同一数据框中的新变量

R data.frame 从另一个变量选择的变量中获取值，向量化

R data.frame 从另一个变量选择的变量中获取值，向量化 的相关文章

随机推荐

热门标签

R data.frame 从另一个变量选择的变量中获取值，向量化的相关文章