根据原始列名称重命名列 R

2024-02-12

我有一个与此类似的数据框:(事实上,for 循环中有 16 个)

head(data)
# A tibble: 1 x 4
    AAA   AAC    AB    AC
1    18    25    39     9
2    20    25    30     7

我想根据列的原始名称动态更改所有列名称,如下所示(我尝试过str_glue,但我收到错误):

### I have a for-loop: (NOT WORKING) (this is a part of the loop)

assign(str_glue("df_{str_sub(data[i], 23, - 5)}"),
           read.delim(data[i], sep = ",", header = T) %>% 
             mutate(ID = Participants,
             str_glue("New_{str_sub(data[i], 23, - 5)}_AAA") = AAA,
             str_glue("New_{str_sub(data[i], 23, - 5)}_AAB") = AAC,
             str_glue("New_{str_sub(data[i], 23, - 5)}_AB") = AB,
             str_glue("New_{str_sub(data[i], 23, - 5)}_AC") = AC) 

期望的输出:

### Note:
### depending on the index-i, 
### str_glue("New_{str_sub(data[i], 23, - 5)}_AAA") will get me either 50,100 or 150

### desired output for i = 1 
    New_50_AAA   New_50_AAC    New_50_AB    New_50_AC
1    18    25    39     9
2    20    25    30     7

我确信有一种优雅的方法可以做到这一点。我看过一些相关的帖子,但似乎没有一个对我有帮助。有任何想法吗?谢谢 :)

PS:如果还有一种方法可以动态重复原始列的名称而不用 str_ 重复它,那将是完美的,它会节省我 4 行

EDIT

整个循环如下所示:

“data”是 16 个 .txt 文件的列表,每个文件名为“xxxxxxxxx_xx_50.txt”、“xxxxxxxxx_xx_100.txt”(依此类推)

for (i in 1:length(data)) {
  
  if (grepl("xxxxxxxxx_x1_.txt$", data[i])) {
    
    assign(str_glue("df_narr{str_sub(data[i], 23, - 5)}"),
           read.delim(data[i], sep = ",", header = T) %>% 
           mutate(ID = Participants,
             str_glue("New_1{str_sub(data[i], 23, - 5)}_AAA") = AAA,
             str_glue("New_1{str_sub(data[i], 23, - 5)}_AAB") = AAC,
             str_glue("New_1{str_sub(data[i], 23, - 5)}_AB") = AB,
             str_glue("New_1{str_sub(data[i], 23, - 5)}_AC") = AC) %>%
             mutate_if(is.numeric, round, digits = 2)) 

} else if (grepl("xxxxxxxxx_x2_.txt$", data[i])) {

assign(str_glue("df_narr{str_sub(data[i], 23, - 5)}"),
           read.delim(data[i], sep = ",", header = T) %>% 
           mutate(ID = Participants,
             str_glue("New_2{str_sub(data[i], 23, - 5)}_AAA") = AAA,
             str_glue("New_2{str_sub(data[i], 23, - 5)}_AAB") = AAC,
             str_glue("New_2{str_sub(data[i], 23, - 5)}_AB") = AB,
             str_glue("New_2{str_sub(data[i], 23, - 5)}_AC") = AC) %>%
             mutate_if(is.numeric, round, digits = 2)) 
  }
}

最好将数据集保存在list并重命名它们 - 获取文件夹中的文件list.files,然后提取数字(\\d+- 之前的一位或多位数字).txt从文件('nm1')中,循环遍历文件和提取的名称Map,读取数据并修改列名pasteing'New_',相应的数字('nm')和原始列名

files <- list.files(path = 'path/to/your/folder', pattern = "\\.txt$", 
     full.names = TRUE)
nm1 <- sub(".*_(\\d+)\\.txt", "\\1", basename(files))
lst1 <- Map(\(x, nm) {

        tmp <- read.table(x) 
        num_cols <- sapply(tmp, is.numeric)
        tmp[num_cols] <- lapply(tmp[num_cols], round, digits = 2)
        cols_to_rename <- names(tmp) != "Participants"
         names(tmp)[cols_to_rename] <- paste0("New_", nm, "_", 
               names(tmp)[cols_to_rename])
         names(tmp)[!cols_to_rename] <- "ID"
        tmp
    }, files, nm1)

或者使用tidyverse

library(dplyr)
library(readr)
library(purrr)
library(stringr)
lst2 <- imap(setNames(files, nm1), ~ {
      nm <- .y
      read_table(.x) %>%
       rename_with(~ str_c("New_", nm, "_", .x), -Participants) %>%
      mutate(across(where(is.numeric), round, digits = 2)) %>%
      rename(ID = Participants)
    })

or in a for loop

# for storing the output from the `for` loop
lst3 <- vector('list', length(files))
# loop over the sequence of files
for(i in seq_along(files)) {
   tmp <- read.table(files[i])
   cols_to_rename <- names(tmp) != "Participants"
    names(tmp)[cols_to_rename] <- paste0("New_", nm1[i], "_", 
               names(tmp)[cols_to_rename]) 
    names(tmp)[!cols_to_rename] <- "ID"
   num_cols <- sapply(tmp, is.numeric)
   tmp[num_cols] <- lapply(tmp[num_cols], round, digits = 2)
   lst3[[i]] <- tmp
  }
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

根据原始列名称重命名列 R 的相关文章

  • 将列表中的每个元素转换为数据框中的一列

    假设我有以下列表 d library combinat d permn c a b c 这看起来如下 1 1 a b c 2 1 a c b 3 1 c a b 4 1 c b a 5 1 b c a 6 1 b a c 是否可以将此列表的
  • `as.matrix` 和 `as.data.frame` S3 方法与 S4 方法

    我注意到定义as matrix or as data frame作为 S4 类的 S3 方法 使例如lm formula objS4 and prcomp object 开箱即用 如果它们被定义为 S4 方法 则这不起作用 为什么将方法定义
  • R Shiny:如何将无功值从闪亮模块返回到主服务器功能?

    我有一个简单的玩具示例 它使用 add removeBtn 模块在 第一个 模块中添加和删除 UI 我需要跟踪单击 添加 删除 的次数 如果我不使用模块 这很容易 但我试图在嵌套模块的上下文中执行此操作 代码如下 但基本上 我似乎无法访问主
  • 如何(重新)命名 pandas 数据框中的空列标题而不导出到 csv

    我有一个熊猫数据框df1带有一个索引列和一系列未命名的值 我想为未命名的系列指定一个名称 到目前为止 我知道的唯一方法是导出到df1 csv using df1 to csv df1 csv header Signal 然后使用以下命令重新
  • 在 R 中提取 data.frames 列表的名称以及 data.frame 中的值

    在下面的代码中 j是 data frames 的命名列表 我想知道是否有办法 a 提取变量的数值 即one short and one long 在 data frames 内并附加它们的相关名称 即 AAA or BBB or CCC 到
  • 在包加载之前如何知道 R 中特定函数属于哪个包?

    例如 我知道许多流行的功能 例如tbl df 我通常不记得它属于哪个包 即data table or dplyr 所以我必须始终记住并加载一个包 但我做不到 tbl df除非我加载了正确的包 在 R 控制台本身加载或安装包之前 有没有办法知
  • data.table 抛出“找不到对象”错误[重复]

    这个问题在这里已经有答案了 我有一个数据表 library data table mydt lt data table index 1 10 当我在全局环境中尝试它时 我可以让它工作 但当我在调试器中或在包测试中使用它时却无法工作 问题是我
  • 使用选定因子水平的值向 ggplot-barchart 添加水平线

    在这个情节中 df lt data frame factor as factor c rep A 3 rep B 3 Treatment c rep c A B C 2 values runif 6 0 1 ggplot df aes Tr
  • ggplot:如何限制条形图中的输出,以便仅显示最频繁出现的情况?

    我几个小时以来一直在寻找这个简单的东西 但没有结果 我有一个数据框 其中一列为变量 国家 地区 我想要两件事以下 绘制最常见的国家 地区 最常见的位于顶部 找到部分解决方案EDIT找到完整的解决方案 gt gt 重点问题是根据频率限制条形图
  • 平滑连续 2D 点

    UPDATE 感谢 user20650和 李哲源Zheyuan Li 这是我想出的解决方案 Example data set df 3600 observations points Create a vector of the cumula
  • 使用数据帧的 R 中的 EWMA 波动性

    我正在尝试从一系列股票每日收益中获取 EWMA 波动性 这些收益来自一个名为base retorno diario Data IBOV ABEV3 AEDU3 ALLL3 BBAS3 BBDC3 BBDC4 1 2000 01 04 0 0
  • 如何在Rstudio中快速给几个单词加上引号?

    如何将 MI ID FL 转换为 MI ID FL 而无需键入每个双引号 Hmisc 包有一个函数 Cs 它将评估逗号分隔的文本是否带有引号 Cs MI ID FL becomes MI ID FL
  • R 改变构面的顺序

    我正在尝试将方面的顺序从 BA SLG 更改为 SLG BA 我发现了与此类似的问题 但我认为我的解决方案可能不起作用 因为我已经在Excel中汇总了数据 因此 我的数据框可能会有所不同 无论如何 我尝试实现这个但无济于事 df2 lt f
  • 如何像在facet_grid中一样在facet_wrap中定位条带标签

    我想在使用时删除多余的条带标签facet wrap 并用两个变量进行分面 并且都是自由尺度的 例如 这个facet wrap下图的版本 library ggplot2 dt lt txhousing txhousing year in 20
  • StatET调试工具

    我想我只是很密集 但我似乎无法弄清楚如何在 Eclipse 中的 R 中使用调试工具 StatET 插件 有人有关于这个主题的任何提示或教程吗 StatET 2 00 现在对高级 可视化调试提供实验性支持 需要 Eclipse 3 6 或
  • 在 RGL 中将立方体绘制到 3D 散点图中

    我正在尝试向 3D 散点图添加较小的立方体 网格 具有指定边长 我希望立方体位于原点 我该怎么做呢 我已经玩过cube3d 但我似乎无法将立方体正确定位 也无法使其成为网格 因此我可以看到它包含的数据点 这是我所拥有的 library rg
  • ggplot2:带有 geom_line 的 x 轴因子不起作用

    我想要一个线图 其中value绘制为函数expt每级一行var 这是我的数据 lines lt expt var value 1 none p 0 183065327746799 2 none p 0 254234138384241 3 n
  • 斯皮尔曼相关性和联系

    我正在一小组配对排名上计算斯皮尔曼的 rho 斯皮尔曼因处理领带不当而闻名 例如 取2组8个排名 即使两组中有6个是平局 相关性仍然很高 gt cor test c 1 2 3 4 5 6 7 8 c 0 0 0 0 0 0 7 8 met
  • 如何在R中实现countifs函数(excel)

    我有一个包含 100000 行数据的数据集 我尝试做一些countifExcel 中的操作 但速度慢得惊人 所以我想知道R中是否可以完成这种操作 基本上 我想根据多个条件进行计数 例如 我可以指望职业和性别 row sex occupati
  • 闪亮井板宽度

    library shiny library shinydashboard ui lt dashboardPage dashboardHeader dashboardSidebar dashboardBody wellPanel tags d

随机推荐

  • Flutter - 英雄动画不适用于选项卡导航器

    我是颤振新手 我正在使用英雄小部件为浮动按钮制作动画 我有底部导航 我必须使用选项卡导航器打开页面 但英雄动画不起作用 我使用了所有可能的解决方案 但英雄动画仍然不适用于页面路由 这是我的代码片段 FloatingActionButton
  • 无法删除全局包

    尝试删除全局包 但似乎没有删除它 eslint v v1 10 3 npm uninstall eslint g sudo npm uninstall eslint g eslint v v1 10 3 sudo eslint v v1 1
  • 如何使用之前输入的值填充自定义结帐字段,例如默认的 WooCommerce 结帐字段?

    我使用以下代码添加了一个自定义字段 add action woocommerce before order notes bbloomer add custom checkout field function bbloomer add cus
  • 在python中读取15M行csv文件的有效方法

    对于我的应用程序 我需要读取多个文件 每个文件有 15 M 行 将它们存储在 DataFrame 中 并将 DataFrame 保存为 HDFS5 格式 我已经尝试过不同的方法 特别是具有 chunksize 和 dtype 规范的 pan
  • 获取调用者类

    我正在编写 Logger 并在自动添加类名时遇到问题 我从中调用了 print log 方法 例如这样的事情 class Logger def self print log string puts Time now strftime T c
  • 美国电话号码验证

    我有一个网站表单 需要输入美国电话号码以供后续使用 在这种情况下这是非常有必要的 我想尝试消除用户输入垃圾数据330 000 0000 我已经看到了第三方为您验证电话号码的一些选项 但是我不知道这是否是这种情况的最佳选择 但是 如果您使用过
  • PyQt 项目视图自定义拖放

    我正在 QTableView 中进行自定义拖放实现 当我拖动一个单元格并将其放在另一个单元格上时 我想根据拖动的内容和放置的位置手动更改模型中的一些数据 我怎样才能做到这一点 我已经阅读了所有 Qt 文档 但我完全迷失了 特别是通过拖放 C
  • Couchbase 中的存储桶密码

    我正在创建一个使用 springboot 和 Couchbase 进行反应式编程的演示项目 我在 application properties 文件中设置了以下属性 spring couchbase bootstrap hosts loca
  • APK 0(零)设备兼容性

    我正在生成一个要在商店上发布的 APK 它是现有应用程序的更新 上传到 Google Play Console 后 支持的 Android 设备 0 台设备 这是我的清单
  • vue js如何使用方法将数据从父组件、v-for循环列表传递到子组件

    我试图实现在子组件 模态组件 中显示每个项目收据数组的项目列表 但一直无法这样做 方法display receipts 是将receipts modal的数据值改为true 我可以在哪里放置 v bind 来传递数组 任何帮助深表感谢 Pa
  • 使用networkx从图中删除边

    我正在尝试转换DiGraph成n叉树并按层序或BFS显示节点 我的树与此类似 但更大 为简单起见 使用以下示例 G networkx DiGraph G add edges from n n1 n n2 n n3 G add edges f
  • 是否可以使用服务帐户访问Provisioning API?

    我的服务帐户范围是 https apps apis google com a feeds user https apps apis google com a feeds user 和 DriveScope DRIVE 我在我的服务帐户 ID
  • VS2015:警告MSB3884:找不到规则集文件

    将我的 WinForms VS2013 项目升级到 VS2015 后 我开始看到 MSB3884 找不到规则集文件 警告 Google 搜索发现了一篇 MSDN 文章 Stack Overflow 文章以及许多其他网站都指向了该文章 类似问
  • R可以识别Excel文件是否有注释单元格吗?

    我有一张 Excel 表格 xlsx 其中有一些注释的单元格 导入R后 R有什么办法可以识别注释的单元格吗 因为我必须仅对注释的单元格使用一些 if else 条件 Let s say we have this file test xlsx
  • 以逗号或分号分隔的自动完成文本框

    我想要一个TextBox支持自动完成 并允许用户输入以逗号或分号分隔的多个单词 并为每个单词提供建议 我有一个标准TextBox with textBox AutoCompleteCustomSource AddRange new appl
  • Haskell、通道、STM、线程、消息传递

    我正在尝试使用 Channels STM 在 Haskell 中实现消息传递 也许这是一个糟糕的想法 并且有更好的方法在 Haskell 中实现 使用消息传递 如果是这种情况 请告诉我 然而 我的探索提出了一些关于并发 Haskell 的基
  • Firebase Chrome 扩展 Javascript content_security_policy 清单 3

    我刚刚开始工作chrome extensions and javascript看到每个人都建议使用Manifest version 3开始 我想实施firebase进入我的扩展和旧的Manifest version 2我需要输入这个 con
  • 使用 R 和 tidyverse 将 tidy 表转换为深度嵌套列表

    我正在尝试使用 R tidyverse 将整洁的表 例如下面的示例 转换为嵌套列表 使用一些 tidyverse 魔法 我能够将其转换为深度为三的嵌套列表 但我不知道如何将其嵌套得更深 采用以下示例输入 library tidyverse
  • TFS 构建:以管理员身份运行 Powershell 脚本

    我为我们的夜间构建服务器创建了一个构建定义 构建项目 Windows 服务 后 我需要执行 Powershell 脚本来安装并启动该服务 因此 我添加了一个构建步骤来运行特定的 Powershell 脚本 然后我在 很快 夜间构建服务器上安
  • 根据原始列名称重命名列 R

    我有一个与此类似的数据框 事实上 for 循环中有 16 个 head data A tibble 1 x 4 AAA AAC AB AC 1 18 25 39 9 2 20 25 30 7 我想根据列的原始名称动态更改所有列名称 如下所示