如何将两个或多个不同 csv 文件组成的数据框中的两列合并为一个新列？

2024-04-18

我有几个 csv 文件，全部以日期命名，对于所有文件，我想在每个文件中创建一个新列，其中包含来自其他两列放在一起的数据。然后，我想将它们组合成一个大数据框，并仅选择其中两列来保留。这是一个例子：

假设我有两个数据框：

  a b c        a b c
x 1 2 3      x 3 2 1
y 2 3 1      y 2 1 3

然后我想在每个列中创建一个新的 d 列：

  a b c  d        a b c  d
x 1 2 3 13      x 3 2 1 31
y 2 3 1 21      y 2 1 3 23

然后我想像这样组合它们：

然后保留两列a和d并删除另外两列b和c：

这是我当前的代码（当我尝试合并其中两列或尝试仅保留其中两列时，它不起作用）：

    f <- list.files(pattern="201\\d{5}\\.csv")        # reading in all the files
    mydata <- sapply(f, read.csv, simplify=FALSE)     # assigning them to a dataframe
    do.call(rbind,mydata)                             # combining all of those dataframes into one
    mydata$Data <- paste(mydata$LAST_UPDATE_DT,mydata$px_last)   # combining two of the columns into a new column named "Data"
    c('X','Data') %in% names(mydata)               # keeping two of the columns while deleting the rest

物体mydata是数据框的列表。您可以使用以下命令更改列表中的数据框lapply:

lapply(mydata, function(x) "[<-"(x, "c", value = paste0(x$a, x$b)))

file1 <- "a b             
x 2 3"    
file2 <- "a b
x 3 1"
mydata <- lapply(c(file1, file2), function(x) read.table(text = x, header =TRUE))
lapply(mydata, function(x) "[<-"(x, "c", value = paste0(x$a, x$b)))

# [[1]]
#   a b  c
# x 2 3 23
# 
# [[2]]
#   a b  c
# x 3 1 31

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

csv

DataFrame

multiplecolumns

如何将两个或多个不同 csv 文件组成的数据框中的两列合并为一个新列？的相关文章

为 RStudio Server 1.0.44 配置日志目录

我在 CentOS 7 上运行 RStudio Server 1 0 44 根据文档 https support rstudio com hc en us articles 200554766 RStudio Server Applicat
将 CSV 文件读入 Java 作为数据库表

我发现了很多关于使用 Java 读取 CSV 的帖子并且他们所指向的 API 在读取 CSV 文件时都采用了面向行的方法就像当你得到一行时获取每一列的值我希望有一个更高级别的 API 比如在 Perl 中 DBI 允许您在 CSV
如何在flutter中从设备存储读取CSV文件

我想将数据从 flutter 中的 CSV 文件导入到 firebase 数据库中因此我使用文件选择器从设备中选择 CSV 文件现在我如何从该文件中读取数据首先从 dart 包导入 file picker 和 CSV 包比定义方法
如何使用 pandas 选择所有非 NaN 列和非 NaN 最后一列？

如果标题有点令人困惑请原谅我假设我有test h5 下面是使用读取该文件的结果df read hdf test h5 testdata 0 1 2 3 4 5 6 0 123 444 111 321 NaN NaN NaN 1 12 2
完全缺失列的 VaR 计算

我需要计算股票收益的滚动 VaR 从这篇文章使用rollapply函数使用R进行VaR计算 https stackoverflow com questions 25045612 using rollapply function for v
网页抓取（R 语言？）

我想获取中间栏中的公司名称this http www consumercomplaints in bysubcategory mobile service providers page 1 html页面以蓝色粗体书写以及登记投诉者的位置
left_join 表示列不存在，即使它存在

我想用两个不同的变量 tp join 连接两个数据框出现错误表示无法在第二个数据帧中找到变量但是当我运行函数 colnames 时会显示列名称为什么会这样呢 df new lt left join master settlemen
对数据框的行进行排序

我有以下数据框 adjusted RFC df Node Feature Indicator Scaled Class Direction True False 0 0 km lt 0 181 class 4 0 gt 1 NA 125 1
r - 从我的应用程序下载shinyapps代码

我正在尝试从shinyapps io 在另一台电脑上下载我的shiny 应用程序代码我按照这个例子 https support rstudio com hc en us articles 204536588 从 shinyapps io下
自动将变量名称添加到列表的元素[重复]

这个问题在这里已经有答案了我有一个模型列表为了使代码更易于维护因此可以方便地添加和删除模型我希望有一个地方来存储它们及其名称为此我必须解决以下命名问题上游我生成模型的方式比以下方式效率低如果是这样压缩的我会assign他
以计数矩阵作为响应的多项式

根据帮助multinom 包裹nnet 响应应该是一个因子或具有 K 列的矩阵它将被解释为每个 K 类的计数我尝试在第二种情况下使用此函数但出现错误这是我所做的示例代码 response lt matrix round runif
R igraph - 保存布局？

我想知道是否可以保存 igraph 网络的布局以便其他人能够重现相同的图表目前 Fruchterman Reingold 算法总是创建一个新的网络 par mfrow c 1 2 g lt erdos renyi game 100 1
Python：按小时、天和月过滤 Pandas 中的数据帧（按年分组）

作为 Pandas 的新手我必须进行大量挖掘才能找到这个问题的解决方案考虑到我仍然需要解决边界问题我想知道更好的方法来解决这个问题我有一组从 2009 年到 2012 年的 10 分钟功率测量值并且希望获得所有年份的小时和日
R 中的 Mapdeck 包 - add_grid 似乎未渲染任何内容

Problem The add gridR 中的函数mapdeck包很精彩然而遵循CRAN 文档 https cran r project org web packages mapdeck mapdeck pdf 我似乎无法获得任何数据
R中的等值线绘图问题

编辑我已经意识到问题的根源我只有我有数据的县的计数信息该信息少于我正在绘制的区域中的县数量按理说问题代码行在这里 mapnames lt map county plot FALSE 4 names colorsmatched lt
根据随机选择的列生成随机天数

我有一个如下所示的数据框感谢 SO 社区在以下方面提供的帮助 df1 pd DataFrame person id 11 11 12 13 14 date birth 01 01 1961 12 30 1961 05 29 1967 01
如何使用 tidyr 将向量中字符串中的每个字符分隔到一列中

我想将向量中的每个字符串分成列但我做不到 library tidyr library dplyr df lt data frame x c abe bas dds eer df gt separate x c A B C sep 1 我想
计算数据框中每一行的 R 条件运行总和

我想创建一个等于 data Rating 的运行总和的列假设第 3 列和第 4 列中有两个条件成立特别是 data Year 换句话说这应该计算直到上一年为止每个 id 的评分累积总和它应该对数据框中的每一行大约 50 000 行
粘贴两个 data.table 列

dt lt data table L 1 5 A letters 7 11 B letters 12 16 L A B 1 1 g l 2 2 h m 3 3 i n 4 4 j o 5 5 k p 现在我想粘贴列 A 和 B 以获得一个新
R Leaflet：添加多边形时传递 popupOptions。

Within addPolygons 有一个popup参数就像addPopups 功能区别我认为是当弹出窗口创建时addPolygons 可以单击多边形内的任意位置来触发弹出窗口但是如果addPopups 被使用单个lng and

随机推荐

logback 支持 log4j 附加程序吗？

为 log4j 创建的自定义 Appender 扩展 AppenderSkeleton 可以与 new 一起使用吗logback框架我知道logback带有自己的一组类似于 log4j 的附加程序但这是否可以重用现有的附加程序如何以
signal(SIGCHLD, SIG_DFL); 是什么意思？意思是？

我不处理SIGCHLD在我的代码中我的进程仍然在终止后立即被删除我希望它成为僵尸进程如果我设置SIGCHLD to SIG DFL那么它会起作用吗我该如何设置SIGCHLD to SIG DFL 我希望进程成为僵尸这样我就可以在
尝试调用虚拟方法“int java.lang.String.hashCode()”

我正在尝试使用 Volley Library 将图像从 URL 加载到 gridview 中为此我正在关注this http www 101apps co za index php articles using volley to dow
使用 javascript 的 ASP.Net MVC 3.0 Ajax.ActionLink 动态对象路由值

0 项目在我看来我有一个隐藏字段其中有一个UserID 该用户 ID 是根据操作生成的因此事先不会知道一旦这个隐藏字段有了值我想使用该值作为操作链接路由值我可以用 jquery 选择器来做到这一点吗我的隐藏字段是
我可以使用远程数据库服务器配置 ssl

我想知道是否可以在我的应用程序和远程数据库服务器之间配置 ssl Weblogic 服务器上的 Oracle 数据库和 Web 应用程序 Thanks 是的这是可能的我不确定如何配置服务器我只从客户端的角度使用它但是可以按照链接中的
ejabberd 和 Erlang 安装，lager_transform 未定义

我是 Erlang 新手我一直在尝试在 EC2 ubuntu 机器上安装 Erlang 和 ejabberd 一切都很顺利直到我开始编译一些外部模块ejabberd 它开始抛出错误undefined parse transform la
从雅虎财经提取数据时出错

我正在尝试通过 Pandas 从雅虎财经提取数据我以前使用过类似的拉力但在此之前没有遇到任何问题 import pandas as pd import numpy as np import datetime as dt from dat
Postgis - ST_within 没有做我想做的事。如何在空心区域中找到一个点？

请参阅丝网印刷我在 Postgis 中运行了一个空间查询以返回地图上某个点所在的选区区域该查询使用ST within函数其中点位于多边形内正如您从打印中看到的该点实际上并不在 York Outer 的多边形区域内尽管从技术
php中如何将多维关联数组转换为一维数组？

我有一个快速查询如何将多维数组转换为一维数组 teachers array array post id gt John Doe video id gt array Government English array post id gt St
在Android studio中添加外部库

我想添加外部库https github com foursquare foursquare android oauth https github com foursquare foursquare android oauth到我的 Andr
更改my.ini后MySQL服务无法启动

我在 Windows 上运行 MySQL 8 0 我对 my ini 做了一些更改最终找到了它以更改字符集愚蠢的是我没有先备份它并且我使用了记事本它没有多重撤消功能现在我明白了 The MySQL Service could n
Kivy 中的 HTTPS 请求

我一直在处理与通过 AWS API Gateway 托管的 API 绑定的 Kivy 应用程序中的 HTTPS 请求首先我从Python3迁移到2 然后从requests库迁移到kivy的URLRequest 该应用程序在我的 Linu
prawnto 显示新页面时不会中断的表格

我有数量可变的表行数可变我想让它们一个接一个地显示但如果当前页面不适合表请将其放在下一页上然后继续我已将表格放入事务中这样如果高度适合当前页面我可以回滚然后打印它但如何获取表格高度我现在有这个代码 pdf transac
将 CSV 导入组织模式属性

我想将 CSV 导入组织模式其他人已经询问过如何将 CSV 导入组织模式表这不是我想做的我需要将 CSV 导入到组织模式属性例如像这样的 CSV Name Tel Mobile Fax John 11111 22222 33333
删除具有重复索引的 pandas 行

如何删除具有重复索引值的行在下面的天气数据框中有时科学家会返回并纠正观察结果不是通过编辑错误的行而是通过将重复的行附加到文件末尾我正在从网络上读取一些自动天气数据每 5 分钟进行一次观测并编译成每个气象站的每月文件解析文件后
使用 ffmpeg 将文件从一种格式转换为另一种格式

我是新来的ffmpeg我试图找出如何将音频或视频文件从一种格式转换为另一种格式我不想使用CLI 我只是想知道我是否可以使用ffmpeg作为库并调用函数将文件从一种格式转换为另一种格式我浏览了文档并找到了函数avcodec encode
如何仅在夹具级别执行“beforeEach”，而不是针对该夹具下的每个测试

我只想在固定装置级别运行 beforeEach 而不是在该固定装置下的每个测试中运行 fixture Fixture A for Use Case1 beforeEach login test A Test 1 async t gt awa
这是 Matlab 的错误吗？你有同样的问题吗？ [复制]

这个问题在这里已经有答案了我的Matlab版本是R2012a为什么在Matlab中1 1 0 2不等于0 9 这太糟糕了 gt gt 1 1 0 2 0 9 ans 0 这不是Matlab问题这是一个浮点问题在 C 或任何符合以下标准
使用 Google Drive API 从 Google Drive 直接下载

我的桌面应用程序是用 java 编写的尝试从 Google Drive 下载公共文件据我发现它可以通过使用文件来实现webContentLink 这是为了能够在未经用户授权的情况下下载公共文件因此下面的代码适用于小文件 Strin
如何将两个或多个不同 csv 文件组成的数据框中的两列合并为一个新列？

我有几个 csv 文件全部以日期命名对于所有文件我想在每个文件中创建一个新列其中包含来自其他两列放在一起的数据然后我想将它们组合成一个大数据框并仅选择其中两列来保留这是一个例子假设我有两个数据框 a b c a b c x

如何将两个或多个不同 csv 文件组成的数据框中的两列合并为一个新列？

如何将两个或多个不同 csv 文件组成的数据框中的两列合并为一个新列？ 的相关文章

随机推荐

热门标签

如何将两个或多个不同 csv 文件组成的数据框中的两列合并为一个新列？的相关文章