根据匹配的列标题名称开头组合 R 中的列

2024-03-28

我有一个看起来有点像下面的数据框。 A1U_sweet 实际上是真实数据帧中的第 19 列，C1U_sweet 是真实数据帧中的第 39 列。有 20 个以 A## 开头的列和 20 个以 C## 开头的列。

A1U_sweet  A2F_dip  A3U_bbq  C1U_sweet  C2F_dip  C3U_bbq
1          2        1        NA         NA       NA
NA         NA       NA       4          1        2
2          4        7        NA         NA       NA

我想制作结合 A 值和 C 值的附加列。生成的数据框将包括类似于 B1U_sweet 和 B2F_dip 的列。

A1U_sweet  A2F_dip  A3U_bbq  C1U_sweet  C2F_dip  C3U_bbq  B1U_sweet  B2F_dip
1          2        1        NA         NA       NA       1          2
NA         NA       NA       4          1        2        4          1
2          4        7        NA         NA       NA       2          4

有人建议我尝试以下代码。前两行有效，但在实现其余部分后，我收到一条错误消息。

types <- grep('^A([0-9]|[12][0-9])[A-Z]_[a-z]+', names(df)) ## Get all "A" 
patterns
types <- substr(types, 2, Inf) ## Remove the "A"
for (tp in types) {
  aa <- df[[paste0('A', tp)]] ## "A" column
  cc <- df[[paste0('C', tp)]] ## "C" column
  df[[paste0('B', tp)]] <- ifelse(is.na(aa), aa, cc)
}

这是错误消息：

Error in `[[<-.data.frame`(`*tmp*`, paste0("B", tp), value = logical(0)) : 
  replacement has 0 rows, data has 94
In addition: Warning message:
In is.na(aa) : is.na() applied to non-(list or vector) of type 'NULL'

数据确实有 94 列，但我不明白为什么这可能会触发此错误。如果您能帮助使该代码正常运行，我将不胜感激！

编辑：这就是我到目前为止一直在做的事情。我必须进入并手动更改我想要组合的每组列的列名称。一定有更好的方法！

df$B1U_sweetnsour<-A1U_sweetnsour
df$B1U_sweetnsour[is.na(df$B1U_sweetnsour)]<- C1U_sweetnsour[is.na(A1U_sweetnsour)]

考虑mapply比较A列和C按元素列并分配所有B立即列。并使用sub这不像gsub, sub仅当列标题中其他地方有 A 时才替换第一次出现的情况。

new_B_cols <- sub("A", "B", names(df)[grep("^A", names(df))])

replace_na <- function(aa, cc) {
     aa[is.na(aa)] <- cc[is.na(aa)]
     return(aa) 
}

df[new_B_cols] <- mapply(replace_na, df[grep("^A", names(df))], df[grep("^C", names(df))])

df[order(names(df))]
#   A1U_sweet A2F_dip A3U_bbq B1U_sweet B2F_dip B3U_bbq C1U_sweet C2F_dip C3U_bbq
# 1         1       2       1         1       2       1        NA      NA      NA
# 2        NA      NA      NA         4       1       2         4       1       2
# 3         2       4       7         2       4       7        NA      NA      NA

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

forloop

根据匹配的列标题名称开头组合 R 中的列的相关文章

替换向量中非 %in% 向量的值

简短的问题我可以像这样替换某些变量值 values lt c a b a b c a b df lt data frame values 将 df values 的所有值替换为 x 其中值是neither a 或 b 输出应该是 c a
用于带有嵌套子图的图的 r 包？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个用于图形网络的 r 包它可以处理嵌套子图 Graphviz 做到了这一点但只提供可
如何使用 RODBC 将数据帧保存到数据库生成的主键表

我想使用 R 脚本将数据框输入到数据库中的现有表中并且希望数据库中的表具有顺序主键我的问题是 RODBC 似乎不允许主键约束这是创建我想要的表的 SQL CREATE TABLE dbo results ID INT IDENTITY
r caret 包中的 train 函数的模型输出尺寸巨大

我正在使用 bagFDA 模型进行训练train r caret 包中的函数并将模型输出保存为 Rdata 文件输入文件大约有 300k 条记录有 26 个变量但输出 Rdata 大小为 3G 我只是运行以下命令 modelout
mclapply 调用应该嵌套吗？

正在筑巢parallel mclapply是个好主意吗 require parallel ans lt mclapply 1 3 function x mclapply 1 3 function y y x unlist ans Outpu
如何加速 R for 循环？

我正在为 R 中 GWmodel 包中的 gwr basic 函数运行以下 for 循环我需要做的是收集任何给定带宽的估计参数的平均值代码如下 library GWmodel data DubVoter Dub voter LARent
R：为什么 kable 不在 for 循环内打印？

我正在使用 rmarkdown 和 Latex 编写报告我需要使用打印一组表格knitr kable 但在 for 循环内时不会打印这是我的代码 title project title author Mr Author date 201
无重叠的抖动点

My data a lt sample 1 5 100 replace TRUE b lt sample 1 5 100 replace TRUE c lt sample 1 10 100 replace TRUE d lt sample
带有nearPoints()的动态ggplot图层闪亮

我熟悉闪亮的基础知识但在这里遇到了一些困难我希望能够在单击某个点以突出显示该点时添加 ggplot 图层我知道 ggvis 可以做到这一点并且画廊中有一个很好的例子但我希望能够使用nearPoints 捕获点击作为 ui 输入我
Plotly 绘图不会在 RMarkdown 文档的 for 循环内渲染

我正在尝试动态构建一个需要运行循环的报告并为每次迭代打印一些消息表格和绘图我可以让一切正常运转except为了情节示例 rmd r echo FALSE results asis fig keep all message FALSE
如何在 R 中的另一个函数中使用 `sink` 函数？

我有一个函数fun依赖于外部函数external 即来自某个包我如何收集来自的所有警告external在字符向量中这是一个最小的设置 External function from another package external lt
R Data.Table 创建带有条件的变量

我需要在下面的数据集中创建一个新变量 A X a 1 b 2 c 3 d 4 e 5 f 6 g 7 h 8 i 9 j 10 The newvar如果X等于 2 5 7 或 9 否则 newvar应该是 0 Code dt1 lt dat
如果条件长度 > 1 并且仅使用第一个元素，为什么我会在 R 中收到此警告

我有下面的源代码这if is na monthData 用于检查是否monthData is NA 如果是则为其分配一个初始值 monthData lt NA if category QUARTER for m in c rep 1 4
当测试集中不存在响应变量时，h2o 预测有时会失败

当在不存在响应变量的测试集上进行预测时如果在训练中对因子变量使用一种热编码则 h2o 会以各种不同的方式失败无论是在训练 GLM 时隐式指定还是在其他方法中显式指定时 R 3 4 0 和 h2o 3 12 0 1 中存在此错误我们还
优化 R 中的嵌套 for 循环

我尝试加速下面的代码但没有成功我读到Rfast https cran r project org web packages Rfast Rfast pdf包但我也未能实现该包有没有办法优化R中的以下代码 RI lt function
使用 R 从字符串中提取函数参数

最好使用stringr包我想创建一个函数extract 以字符串向量作为参数 vec lt c div span icon hospital user i18n t Enrolments or i18n t Paper a string
编写健壮的 R 代码：命名空间、屏蔽和使用 `::` 运算符

简洁版本对于那些不想阅读我的案例的人来说这就是本质最小化新包破坏现有代码即编写您编写的代码的机会的推荐方法是什么尽可能坚固充分利用该功能的推荐方法是什么命名空间机制 when a just using贡献的软件包比如在一
R lubridate：当地语言的工作日

如何获取本地语言的工作日和月份 My code library lubridate data lt c 10 02 2015 11 03 2015 data lubri lt dmy data wday data lubri label T
Shiny可以识别用鼠标选择的文本（突出显示的文本）吗？

我需要用户将文本片段分配给 Shiny 中的类别或代码基本上我希望用户突出显示输出中的文本在下面的示例中来自table or text输出然后按一个按钮 code 并将选定的文本分配给应用程序内的对象在下面的应用程序中所选文
无法在 Document-Term-Matrix 中看到 `RTextTools::toLower()` 文本的结果

我尝试创建一个矩阵为此我想降低文本为此我使用此 R 指令 matrix create matrix tweets 1 toLower TRUE language english removeStopwords FALSE remove

随机推荐

Python ord 函数中的多个字符

编程初学者在这里 Python 2 7 是否有解决方法可以在 Python 的 ord 函数中使用多个字符例如我有一个十六进制字符串 xff x1a 我想要它的十进制值以便我可以将其与其他十六进制字符串求和但是 ord 只接受单个十
在C中从键盘获取输入而不用“return”

在 C Mac OS 中如何在不按 return 的情况下从键盘获取输入在带有终端的类 Unix 系统上我认为 MacOS X 符合要求那么您需要将终端设置为所谓的 cbreak 模式重点是terminal保留数据直到按下 ret
尽管导入了类，但未定义类

我似乎遇到了一个非常令人困惑的错误尽管导入了包含我的类的 py 文件 Python 仍然坚持认为该类实际上并不存在 testmodule py中的类定义 class Greeter def init self arg1 None self
在我的 android studio 模拟器中元素相互重叠

我是新来的Android Studio 当我创建应用程序时所有元素都相互重叠我不知道如何编辑这段代码请给我详细的描述布局编辑器和模拟器结果布局代码
Spark 执行器上的对象缓存

对于 Spark 专家来说这是一个很好的问题我正在处理数据map操作 RDD 在映射器函数中我需要查找类的对象A用于处理 RDD 中的元素由于这将在执行器上执行并创建类型的元素A 将被查找恰好是一个昂贵的操作我想在每个执行器上预
PHP：如何检查 URL 是 Youtube 还是 vimeo

如何编写一个函数来检查提供的 URL 是 youtube 还是 vimeo 例如我将这两个 URL 作为字符串存储在数据库中 http vimeo com 24456787 http www youtube com watch v rj1
使用 groupby 和 Mean() 在 Pandas 中保留一个包含分类变量的列

有没有办法在之后保留分类变量groupby and mean 例如给定数据框df ratio Metadata A Metadata B treatment 0 54265 937500 B10 1 AB cmpd 01 11 10736
如何在内容可编辑 iframe 内创建非内容可编辑 div？

我需要将内容可编辑的 iframe 内的某些部分设置为不可编辑我怎么做下面的代码在 Chrome 中有效但在 Firefox 中无效一切都可以在 Firefox 中编辑我需要复选框不可编辑 Editable text div di
Azure 中虚拟机和应用服务之间的 Vnet

我不知道如何连接网络应用程序应用服务 to a 虚拟机在蔚蓝中我已从 Web 应用程序配置面板创建了 VNet 所有项目都是使用创建的资源管理型号都在同一个订阅并且至少是Standard定价层显然 Web 应用程序无法连接到 V2
警告会话 0x0 服务器为空、意外错误、关闭套接字连接并尝试重新连接

我有两个节点每个节点上都安装了带有Mesos marathon和zookeeper的docker 这是我在主节点上的 docker compose 文件 version 3 7 services zookeeper image ubunt
SQL Server 锁解释

下面是 SQL Server 2000 支持的锁列表我对意图锁的实际含义有点困惑我在网上查了一下答案似乎有点神秘为了进一步获得我的具体问题的答案我希望将此问题用作 Wiki 了解每个锁的含义以及在什么情况下将获取该类型的锁 S
pandas.groupby 对象上尊重时间的移动平均值

给定一个以下格式的 pandas 数据框 toy pd DataFrame id 1 2 3 1 2 3 1 2 3 date 2015 05 13 2015 05 13 2015 05 13 2016 02 12 2016 02 12 2
在 JavaFX 上的按钮中加载 SVG 文件

我在 Inkscape 中创建了一个 SVG 图像我把它放在与我的班级相同的目录中有没有办法加载该图像并将其转换为 SVG 路径这背后的想法是获得该图像getClass getResource image svg toExternal
如何在 Jetpack Compose 中创建垂直无限轮播？

我正在尝试构建一个可滚动列最好是 LazyColumn 它将在滚动到末尾后再次开始重新显示第一个项目例如看看这个闹钟它将从 00 59 开始循环然后再次从 0 开始平滑滚动我尝试过一个普通的 LazyColumn 它会显示 58
线程安全的向量和字符串容器？

我之前发过一个问题在嵌入式 Linux 平台上使用 std string 时出现段错误 https stackoverflow com questions 2412667 seg fault when using stdstring on
获取所有Android版本中来电的电话号码

我正在尝试获取来电的来电号码我搜索并找到了这个在 Android 中检索来电的电话号码 https stackoverflow com questions 1853220 retrieve incoming calls phone num
如何包装 OAuth2 异常？

我们有一个 REST API 使用Spring OAuth2 用户通过身份验证后所有 JSON 响应均采用以下格式 code 12345 data 但是身份验证失败的 JSON 响应与上述格式不相符因为这是由 Spring 处理的例如
get_class() 期望参数 1 为对象，给定为 null

当我尝试在新的本地计算机上部署 Symfony 2 8 项目时我在代码的多个位置遇到此错误 Warning get class expects parameter 1 to be object null given 在stackoverf
如何清理（用随机字节覆盖）std::string 内部缓冲区？

考虑一个场景其中std string用于存储a secret 一旦它被消耗并且不再需要最好清理它即覆盖包含它的内存从而隐藏它secret std string提供一个函数const char data 返回指向 C 11 起连续内
根据匹配的列标题名称开头组合 R 中的列

我有一个看起来有点像下面的数据框 A1U sweet 实际上是真实数据帧中的第 19 列 C1U sweet 是真实数据帧中的第 39 列有 20 个以 A 开头的列和 20 个以 C 开头的列 A1U sweet A2F dip A3U

根据匹配的列标题名称开头组合 R 中的列

根据匹配的列标题名称开头组合 R 中的列 的相关文章

随机推荐

热门标签

根据匹配的列标题名称开头组合 R 中的列的相关文章