使用 R 迭代读取、操作多个 Excel 文件并将它们附加到一个数据帧中

2024-05-08

在一个目录下，我有多个具有相似格式的excel文件（您可以从以下位置下载示例文件）here https://www.dropbox.com/s/ho3visres55kpoy/test.zip?dl=0):

我需要

循环文件和read_excel(),
变异一个新列name与第二列名称，
将第一列和第二列重命名为date and value分别删除最后一列（其原始列名是1);
使用以下命令将所有 dfs 附加到一个数据帧do.call(rbind, df.list)

我做了什么：

循环并获取文件路径：

library(fs)
folder_path <- './test/'
file_paths <- dir_ls(folder_path, regexp = ".xlsx")

读取excel的函数：

read_excel_file <- function(path) {
  df <- read_excel(path = path, header = TRUE)
}

lapply read_excel()每个 Excel 文件的函数：

df.list = lapply(file_paths, function(file) read_excel(file, skip = 2, col_names = FALSE))
df <- do.call(rbind, df.list)

预期结果将是这样的数据框：

         date  value    name
2  2021-01-07  -76.5 J05-J01
3  2021-01-08  -93.5 J05-J01
4  2021-01-15   -305 J05-J01
5  2021-01-22    289 J05-J01
6  2021-01-29  242.5 J05-J01
7  2021-02-05    266 J05-J01
8  2021-02-10  239.5 J05-J01
9  2021-02-19  305.5 J05-J01
10 2021-01-07    323 J01-J09
11 2021-01-08  317.5 J01-J09
12 2021-01-15  527.5 J01-J09
13 2021-01-22    -51 J01-J09
14 2021-01-29  -58.5 J01-J09
15 2021-02-05    -76 J01-J09
16 2021-01-07   76.5 J01-J05
17 2021-01-08   93.5 J01-J05
18 2021-01-15    305 J01-J05
19 2021-01-22   -289 J01-J05
20 2021-01-29 -242.5 J01-J05
21 2021-02-05   -266 J01-J05
22 2021-02-10 -239.5 J01-J05

我如何使用 R 来实现这一目标？提前非常感谢。

library(dplyr)
library(readxl)

files <- list.files()

combined <- bind_rows(
  lapply(
    files,
    function(f) {
      df <- read_xlsx(f) 
      df %>%
        select(date = 1, value = 2) %>%
        mutate(name = colnames(df)[2])
    }
  ) 
)

@ah bon 的替代方案：

read_file <- function(file) {
  df <- read_xlsx(file) 
  df <- df %>%
    select(date = 1, price = 2) %>%
    mutate(name = colnames(df)[2])
  return(df)
}

df <- bind_rows(
  lapply(
    files,
    read_file
  ) 
)

# or `df <- do.call(rbind, lapply(files, read_file))`

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

lapply

readxl

使用 R 迭代读取、操作多个 Excel 文件并将它们附加到一个数据帧中的相关文章

如何在ubuntu的conda环境中更改Rstudio中的R版本

我在基本系统中安装了 R 4 3 和 Rstudio 在 conda 环境中安装了旧版本的 R 4 2 3 命令which R返回环境中安装的 R 的目录 home 用户 miniconda3 envs anndata2ri pip bin
使用字符串中的变量名称访问变量值，R

Intro 一个数据集有大量的age year变量 age 1990 age 1991 etc 我有一个字符串值数组length age years 表示这些变量使得age years 1 回报 age 1990 etc Need 我想搜
rpart“as.character(x) 中的错误：无法强制类型 'builtin' 为类型 'character' 的向量”消息是什么意思？

我一直在用头撞rpart几天了尝试为我拥有的这个数据集制作分类树我认为现在是时候询问生命线了我确信这是我没有看到的愚蠢的事情但这里是我一直在做什么 EuropeWater lt read csv file paste Users a
如何在 Caret 中绘制随机森林（护林员）树

我生成了如下所示的随机森林树并尝试绘制它但出现错误我在哪里犯了错误我怎样才能以正确的方式绘制它 Actmodel lt train Activity Section Author data CB1 method ranger trC
将字符串列拆分为多个虚拟变量

作为 R 中 data table 包的相对缺乏经验的用户我一直在尝试将一个文本列处理为大量指示符列虚拟变量每列中的 1 表示特定的子字符串是在字符串列中找到例如我想处理这个 ID String 1 a b 2 b c 3 c 进入
R 可以创建带有可单击条形图的条形图图像以插入网页吗？

我知道如何创建条形图以及如何将其粘贴在网页上例如使用hwriteImage in the 作家包 http www embl de gpau hwriter 我想要的是每个栏都是一个在鼠标悬停时突出显示的区域并且每个栏在单击时都有不
R - 计算 bin 中特定值的数量

我有一个如下所示的数据框 df Value lt c 1 1 0 2 1 3 4 0 0 1 2 0 3 0 4 5 2 3 0 6 Sl lt c 1 20 df lt data frame Sl Value gt df Sl Value
Quantmod 的简单功能不再起作用

我明天要交论文我收到了一条关于 quantmod 的非常奇怪的错误消息这是我在过去几周使用这个包时从未遇到过的我无法导入特定于道琼斯指数 DJI 的数据我收到以下错误消息 getSymbols DJI src yahoo from
使用officer R导出时如何提高ggplots的分辨率

我想将图表导出到 PPT 并使用Officer 包来实现相同的目的但是图表的默认分辨率较低我想更改它我目前正在使用以下电话 ph with gg p1 type chart res 1200 其中 p1 是 ggplot 对象运行
如何在 data.table 中分组后使用条件计算行数

我有以下数据框 dat lt read csv s1 s2 v1 v2 a b 10 20 a b 22 NA a b 13 33 c d 3 NA c d 4 5 NA c d 10 20 dat gt A tibble 6 x 4 gt
picker输入字体或背景颜色

我在闪亮的仪表板中使用 pickerInput 这很好除了一个问题背景颜色和字体颜色太相似使得过滤器选择难以阅读有什么办法可以改变背景或字体颜色吗如果可能的话我想继续使用 pickerInput 但如果有一个带有 selectI
如何纠正 data.frame 上的字符编码

我有一个像这样的数据框 data names lt data frame DATA c 1 5 rownames data names lt c IV xc1N JOS xc9 LUC xcdA RAM xd3N TO xd1O data
`dplyr::_join` 函数的命名向量“by”参数[重复]

这个问题在这里已经有答案了我正在写一个函数dplyr join两个数据框by不同的列第一个数据帧的列名称动态指定为函数参数我相信我需要使用rlang准引用元编程但未能找到可行的解决方案我很感激任何建议 library dplyr
在 RcppArmadillo 中将列向量乘以数值标量

我在编译这个简单的程序时遇到一些麻烦c 代码使用Rcpp和RcppArmadillo包裹采用以下简单示例将矩阵的每一列乘以数值标量 code lt arma mat out Rcpp as
闪亮的应用程序包：css 和所有 www/ 目录内容

我正在尝试将 Shiny 应用程序转换为 R 包但我在处理有关 www 目录以及松散文件的所有问题时遇到了问题我闪亮的应用程序运行得很好但是当我尝试打包它时它不起作用我闪亮的应用程序目录 my shiny app R ut
如何声明包含 M 个元素的列表对象

我想声明一个包含 M 3 x 3 矩阵的列表如果我事先知道数字 M 那么我可以通过以下方式声明这样的列表 elm lt matrix NA 3 3 Say M 7 myList lt list elm elm elm elm elm el
使用选定因子水平的值向 ggplot-barchart 添加水平线

在这个情节中 df lt data frame factor as factor c rep A 3 rep B 3 Treatment c rep c A B C 2 values runif 6 0 1 ggplot df aes Tr
dplyr：连接中的 NSE (by)

我很难弄清楚如何使用 dplyr left join 和 NSE 连接两个表问题是我无法为 by 提供正确的值我想我现在已经找到了解决方案但感觉我正在以一种额外复杂的方式来做因此如果您知道更简单更优雅的解决方案请告诉我这就是
如何根据 ggplot2 中的汇总数据创建堆积条形图

我正在尝试使用 ggplot 2 创建堆积条形图我的宽格式数据如下所示每个单元格中的数字是响应的频率 activity yes no dontknow Social events 27 3 3 Academic skills works
case_when 与部分字符串匹配和 contains()

我正在使用一个数据集其中有许多名为 status1 status2 等的列在这些列中它表示某人是否豁免完整注册等不幸的是豁免投入并不一致这是一个示例 library dplyr problem lt tibble perso

随机推荐

Bash 中 $() 和 () 之间的区别

当我打字时ls l echo file 支架的输出这只是简单的回显被获取并传递到外部ls l命令就等于简单的ls l file 当我打字时ls l echo file 我们有错误因为不能嵌套内部外部命令有人可以帮助我理解之间的区
如何将 JAVAX-WS 端点绑定更改为 SOAP 1.2？

我正在使用发布测试 WS 实现Endpoint publish 用于在 Visual Studio 中使用根据文档 http metro java net nonav 1 2 docs endpoint html默认的 SOAP 绑定是1
如何使用 PowerShell 使用 C# DLL 中存在的类的 New-Object

例如我有一个 C 类 public class MyComputer PSObject public string UserName get return userName set userName value private strin
从 Linux 命令行发送 SNMP 陷阱消息

Folks 我需要从 Linux 命令行使用此命令 snmptrap 将自定义消息发送到陷阱侦听器我需要根据用户设置在 v1 和 v2c 中发送相同的消息这是我发现的 For v1 snmptrap v 1 c Tas hostname
Android Studio (Intellij Idea) - 运行/调试配置 - 记住在哪个设备上运行

我想这有点不太可能但是对于 Eclipse 如果您使用的 Android 模拟器不是附带的例如 VirtualBox 您可以在第一次运行程序时选择它然后勾选一个复选框说使用此设备进行未来的发布但Android Studio Int
使用服务器 java api 从 jasperserver 存储库检索资源

我正在尝试使用其 java API 从 Jasperserver 存储库检索资源根据jasper 报表服务器终极指南 https community jaspersoft com documentation jasperreports s
.NET Core - 解决方案、框架、导入、运行时

我正在开始重新设计一组框架库以使用 NET Core 我想我会等待 RC2 并热衷于投入其中我借此机会近距离接触构建系统配置从头开始编写所有内容以获得更深入的理解并且没有我不想要不需要的不必要的包袱然而缺乏文档使得这变得相当
来自异常导入 PendingDeprecationWarning ModuleNotFoundError：没有名为“异常”的模块

我正在尝试使用Python 创建一个word 文档我在终端中 pip install python docx 我的代码如下所示 from docx import Document document Document document sa
如何获取嵌套类型内部结构的所有类型？

我有一个函数如下 public void park List
使用 Python gdata 和 oAuth 2 对日历进行身份验证

我正在将一个 Python 应用程序从 oAuth 1 迁移到 oAuth 2 该应用程序读取用户的 Google 日历提要使用 oAuth 1 如果用户可以使用他的 GMail 进行身份验证我的应用程序将打开浏览器帐户并授权访问我
使用 Sequelize 计算关联条目数

我有两张桌子 locations and sensors 每个条目在sensors有一个外键指向locations 使用 Sequelize 如何获取所有条目locations以及条目总数sensors与每个条目相关联locations R
c++1y 模式下的 Clang >= 3.3 无法解析标头

我有一个项目可以在 g 4 8 1 和 c 11 模式下 clang gt 3 3 下正确编译和运行然而当我切换到实验时 std c 1y模式下 clang 3 3 但不是 g 在
在 RealityKit 中更改对象的枢轴点

我希望立方体仅在 z 轴正方向上缩放现在当我缩放它时它总是围绕其中心缩放因此为此我必须更改对象的锚点我知道在 SceneKit 中有一个可以使用的枢轴属性在 RealityKit 中也有办法做到这一点吗我发现了一个相当简单的
无法访问集群端点，请检查是否存在连接/防火墙/DNS 问题

我目前正在研究云技术在我当前的一个项目中我在 Azure 中创建了服务结构集群然后我尝试通过 Windows PowerShell 连接到集群我收到错误无法访问集群端点请检查是否存在连接防火墙 DNS 问题请告诉我如何解决上
即使通过“打开或关闭 Windows 功能”安装 ASP 支持后，也无法在 Windows 10 上运行经典 ASP 页面

我收到此错误处理 URL 时服务器发生错误请联系系统管理员如果您是系统管理员请点击here https learn microsoft com en us iis application frameworks running cla
如何检查两个数据集的匹配列之间的相关性？

如果我们有数据集 import pandas as pd a pd DataFrame A 34 12 78 84 26 B 54 87 35 25 82 C 56 78 0 14 13 D 0 23 72 56 14 E 78 12 31
Firefox：按下鼠标按钮时鼠标悬停不起作用

这是我想做的 https gfycat com ValidEmbarrassedHochstettersfrog https gfycat com ValidEmbarrassedHochstettersfrog 我想强调一些 td 对象在
单击按钮本地化应用程序

我在我的项目 mainMaster 页面中找到了 imageButtons
无法识别 php 变量

我在两个文件中分别有以下代码文件一 php
使用 R 迭代读取、操作多个 Excel 文件并将它们附加到一个数据帧中

在一个目录下我有多个具有相似格式的excel文件您可以从以下位置下载示例文件 here https www dropbox com s ho3visres55kpoy test zip dl 0 我需要循环文件和read excel

使用 R 迭代读取、操作多个 Excel 文件并将它们附加到一个数据帧中

使用 R 迭代读取、操作多个 Excel 文件并将它们附加到一个数据帧中 的相关文章

随机推荐

热门标签

使用 R 迭代读取、操作多个 Excel 文件并将它们附加到一个数据帧中的相关文章