旋转数据框以保留 R 中的列标题和子标题

2024-01-15

我正在尝试旋转一个包含标题和副标题的表格，以便标题进入“日期”列，并且副标题是两列而不是重复。

这是我的数据的示例。

这是使用制作的dput()，因此在原始 Excel 文件中，每个日期都跨越两个子标题（“蓝色”和“绿色”），在 R 中，这些空白单元格被重新命名为 X.1、X.2 等。

table <- "          X    X.1 X02.Jul.12   X.2 X03.Jul.12   X.3 X04.Jul.12   X.4
1  category number       blue green       blue green       blue green
2         G      1          1     0          1     0          1     0
3         G      2          2    99          2    99          1    99
4         G      3          1     1          1    99          1    99
5         G      4          1     1          1     1          2    99
6         G      5          1     0          1     0          1    99
7         G      6          1    99          1     1          1    99
8         G      7          1     0          1     0          1     0
9         G      8          1     1          1     1          1    99
10        G      9          1     1          1     1          1     1
11        H      1          1     1          1     1          1     1
12        H      2          1    99          1     0          1     0
13        H      3          1     1          1     1          1    99
14        H      4          1    99          1     2          1    99
15        H      5          1     1          1     1          1     1
16        H      6          1     0          1     0          1    99
17        H      7          1     1          2     1          1    99
18        H      8          2     0          2     0          1     1
19        H      9          2     0          2     0          1     1"

#Create a dataframe with the above table
df <- read.table(text=table, header = TRUE)
df

下面是 Excel 中的示例：

这是我想要实现的期望输出：

虽然这可以在 Excel 中手动完成，但我有多个包含超过 100 个日期/列的文件，因此更愿意找到一种在 R 中清理它的方法。

任何帮助，将不胜感激！

Excel 代表

下面是数据集的表示，就好像它是从 Excel 中读取的，没有进行名称更正：

# Define the dataset.
df_excel <- structure(
  list(
    c("category", "G", "G", "G", "G", "G", "G", "G", "G", "G", "H", "H", "H", "H", "H", "H", "H", "H", "H"),
    c("number", "1", "2", "3", "4", "5", "6", "7", "8", "9", "1", "2", "3", "4", "5", "6", "7", "8", "9"),
    `02.Jul.12` = c("blue", "1", "2", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "2", "2"),
    c("green", "0", "99", "1", "1", "0", "99", "0", "1", "1", "1", "99", "1", "99", "1", "0", "1", "0", "0"),
    `03.Jul.12` = c("blue", "1", "2", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "2", "2", "2"),
    c("green", "0", "99", "99", "1", "0", "1", "0", "1", "1", "1", "0", "1", "2", "1", "0", "1", "0", "0"),
    `04.Jul.12` = c("blue", "1", "1", "1", "2", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1"),
    c("green", "0", "99", "99", "99", "99", "99", "0", "99", "1", "1", "0", "99", "99", "1", "99", "99", "1", "1")
  ),
  class = "data.frame",
  row.names = c("1", "2", "3", "4", "5", "6", "7", "8", "9", "10", "11", "12", "13", "14", "15", "16", "17", "18", "19")
)

# Save dataset in Excel file ('reprex.xlsx') for reproducibility.
openxlsx::write.xlsx(x = df_excel, file = "./reprex.xlsx")

df %>%
  set_names(enframe(unlist(df[1,])) %>%
  mutate(name = na_if(name, ''))%>%
  fill(name)%>%
  transmute(nms = coalesce(str_c(name, value, sep='_'), value)) %>%
  pull(nms)) %>%
  slice(-1)%>%
  type.convert(as.is = TRUE)%>%
  pivot_longer(-c(category, number), names_to = c('Date', '.value'), 
               names_sep = '_', names_transform = list(Date = dmy)) %>%
  arrange(category, Date, number)

# A tibble: 54 x 5
   category number Date        blue green
   <chr>     <int> <date>     <int> <int>
 1 G             1 2012-07-02     1     0
 2 G             2 2012-07-02     2    99
 3 G             3 2012-07-02     1     1
 4 G             4 2012-07-02     1     1
 5 G             5 2012-07-02     1     0
 6 G             6 2012-07-02     1    99
 7 G             7 2012-07-02     1     0
 8 G             8 2012-07-02     1     1
 9 G             9 2012-07-02     1     1
10 G             1 2012-07-03     1     0
# ... with 44 more rows

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

Pivot

pivottable

tidyr

datacleaning

旋转数据框以保留 R 中的列标题和子标题的相关文章

连接路径的函数？

是否有现有的函数来连接路径我知道实施起来并不困难但仍然除了照顾尾随 or 我需要注意正确的操作系统路径格式检测即我们是否编写C dir file or dir file 正如我所说我相信我知道如何实施它问题是我应该这样做吗现
数据框中按行相关

我正在尝试计算大型数据帧的所有行之间的相关性到目前为止已经提出了一个有效的简单 for 循环例如 name lt c a b c d col1 lt c 43 78 43 84 37 92 31 72 col2 lt c 43 80 4
Dplyr 过滤多个类似条件

我正在尝试在 dplyr 中做一个过滤器其中的列就像某些观察结果我可以使用 sqldf 作为 Test lt sqldf select from database Where SOURCE LIKE ALPHA OR SOURCE LI
R：igraph、社区检测、edge. Betweenness 方法、统计/列出每个社区的成员？

我有一个相对较大的图表其中顶点 524 边 1125 是现实世界的交易边是有向的并且具有权重包含是可选的我正在尝试调查图中的各个社区并且本质上需要一种方法计算所有可能的社区计算最佳社区数量返回每个最佳社区的成员成员数量
ggplot2以限制为中心的多边形世界地图给出了有趣的边缘

使用下面的代码我生成了一张以华盛顿特区为中心的地图解决方案基于科斯克的解决方案在这里 https stackoverflow com questions 10620862 use different center than the pri
使用 alpha 通道叠加两个 ggplot2 stat_密度2d 图

我想叠加两个ggplot2使用 alpha 通道进行绘图结果图像显示两个数据集这是我的测试数据 data read table text P1 1 0 4 nP2 0 0 2 nP3 2 1 8 nP4 2 2 6 nP5 0 5 2
使用插入符号完全可重现的并行模型

当我在插入符中运行 2 个随机森林时如果设置随机种子我会得到完全相同的结果 library caret library doParallel set seed 42 myControl lt trainControl method cv
计算数据集列的百分位数

最亲爱的 R 专家为您快速介绍一下我正在做一项作业在这个练习中我被要求从数据中获取基本统计数据infert数据集它是内置的特别是其中的一列 infert age 对于不熟悉数据集的人 gt table ages Which is
从 r 中的多个列表创建二进制（存在/不存在）数据矩阵

我有一系列不同长度的单独变量列表字符串我想将它们组合成一个数据帧以形成存在 1 不存在 0 矩阵鉴于它们的长度不同我什至不知道如何创建初始数据框这是我的例子 data1 lt c a b c d e f data2 lt c e
mtext：使用布局时较小的标签描述

使用 mtext 作为标签描述与使用 xlab 的作用不同如何使 mtext 标签始终与使用 xlab 时的大小相同无需始终定义 cex 参数在下面的最小示例中两个图的 cex cex lab 1 不过大小不同 layout mat
按值对 geom_bar ggplot2 中的条形重新排序

我正在尝试制作一个条形图其中的图是从miRNA与最高的value to the miRNA与最低的为什么我的代码不起作用 gt head corr m miRNA variable value 1 mmu miR 532 3p pos
相对于时间求平均值

我有以下带有日期时间和相应值的数据集时间间隔为每10分钟一次我需要以 15 分钟的间隔生成新行例如 15 40 的值为 599 15 50 的值为 594 因此需要在两者之间生成一个新行即 15 45 的平均值为 599 和 594
在 R 中运行 glmnet 包，出现错误“缺少 TRUE/FALSE 需要的值”，可能是由于缺少值？

我正在尝试使用glmnet来自glmnet运行 LASSO 回归的包我正在使用以下命令 library glmnet glmnet a b family binomial alpha 1 我收到错误 gt Error in if all
将时间值转换为数字，同时保留时间特征

我有一个数据集其中包含不同事件发生的间隔时间我想要做的是将数据转换为数字向量以便更容易操作和运行摘要制作图表等同时保持其时间特征这是我的数据片段 data lt c 03 31 12 17 16 29 09 52 04 01 0
如何将曲线拟合到直方图

我已经探讨了有关该主题的类似问题但在我的直方图上生成漂亮的曲线时遇到了一些麻烦我知道有些人可能会认为这是重复的但我目前还没有找到任何可以帮助解决我的问题的东西尽管数据在此处不可见但这里是我使用的一些变量以便您可以在下面的代码中看
x[floor(d)] + x[ceiling(d)] 中的错误：二元运算符的非数字参数

我试图绘制病毒载量和试验组的简单箱线图但不断收到此错误 x floor d x ceiling d 中的错误二元运算符的非数字参数 dataset PatientID trial arm viral load 1 club 19 2 c
R 语言 NaN + NA 行为

我有一个关于 R 中算术行为的问题看下面这段代码 gt NaN NA 1 NaN gt gt gt NaN as integer NA gt NA 所以我很困惑这两个添加给出了不同的结果有谁知道这是否是真正想要的行为还是只是某种错误
在模块中使用shiny的renderUI

这是我在 stackoverflow 上的第一个问题我在闪亮 1 0 5 中遇到模块和 renderUI 的问题当我在中使用 renderUI 时 Main Part ui lt bootstrapPage uiOutput Dynam
使用循环（或向量化）按向量中的多个元素对列表进行子集化

我有3个清单data frames my list lt list a data frame value c 1 5 class c letters 1 3 a b b data frame value c 6 1 class c lett
R 连接到主机时出错

我已经安装了 R 3 0 2 和包KEGGREST 在使用它的命令时我收到以下错误函数错误类型消息 asError TRUE 无法连接到主持人使用 internet2 选项后我可以很好地从互联网安装软件包该选项使用来自 In

随机推荐

发出局部变量并为其赋值

我正在初始化一个整数变量如下所示 LocalBuilder a ilGen DeclareLocal typeof Int32 我如何访问它并为其赋值我想做这样的事情 int a b a 5 b 6 return a b Use the
在 Python 中进行自动属性分配的最佳方法是什么？这是一个好主意吗？

而不是每次定义类时都编写这样的代码 class Foo object def init self a b c d e f g self a a self b b self c c self d d self e e self f f sel
php刷新当前页面？

我有一个页面如果设置了变量在会话中它会执行一个动作然后它会取消会话现在它必须自我更新这就是我被困住的地方有没有办法获取当前页面的确切 url 或者有一个函数可以做到这一点吗 so header location header
使用 SVG 仅填充半颗星

对于我正在构建的评级系统有没有办法向这个 svg 示例添加一个 css 类以便它只显示填充的一半星号参见jsbin http jsbin com cifip 2 http jsbin com cifip 2 在此示例中当前填充为黄色
TinyMCE 增加字体系列下拉字体大小

有谁知道如何增加 TinyMCE 中字体系列下拉列表项的字体大小 Thanks 您需要创建一个自己的 css 文件并使用 tinymce 配置参数 content css your css file css 您的 css 文件必须包含以
gradle 存储库指向具有多个库的本地目录

我对本地存储库的 build gradle 中的构建依赖项有疑问即使用本地目录 dependencies compile fileTree include jar dir libs 它只解决libs目录中的依赖关系还是解决lib目录中所有
获取经过身份验证的 Facebook 用户的年龄，无需进一步的权限提示

使用 Facebook Graph API 是否可以在不首先提示用户年龄或年龄范围的情况下获取用户的年龄或年龄范围 user birthday or friends birthday允许你不能年龄要求user birthday o
我需要帮助使用 Knockout 格式化数据绑定

我对 Knockout 相当陌生我正在寻找格式化输出的方法我看到了一个类似这样的例子但我的尝试当然是行不通的这是 jsfiddle 的链接 http jsfiddle net cezmp http jsfiddle net cezm
Django的URL字段测试问题

有人可以解释一下为什么这个网址吗http www nacolmeia com br do Home oferta EnERURLField 的 Django 生成的表单不被接受 Thanks 您是否在尝试验证该网站的同一台服务器上托管该网站
Faye 和 Nodejs：如何运行 Faye 服务器端客户端？

我正在尝试开发一个 Faye 服务器端客户端以根据需要自动运行在Faye的官方网站上我只找到了关于服务器端客户端的文档没有关于如何运行它的信息请告诉我该怎么做谢谢文档中缺少一个关键部分看来你需要打电话client connec
为什么 PHP 4.4.9 抛出“解析错误：语法错误，意外的 T_STATIC”？ [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 我刚刚意识
Spring：@Component 与 @Bean

我明白那个 Component注解是在 spring 2 5 中引入的目的是通过使用类路径扫描来摆脱 xml bean 定义 Bean于 spring 3 0 中引入可与 Configuration为了完全摆脱 xml 文件并使用 ja
线程状态阻塞和等待之间的区别[重复]

这个问题在这里已经有答案了我已通过以下帖子阅读了答案 WAIT 和 BLOCKED 线程状态之间的区别 https stackoverflow com questions 15680422 difference between wait
我可以扩展 Button 以添加右键单击事件，同时也保留图形副作用吗？

我正在尝试扩展 Button 以添加右键单击事件我的客户想要一个按钮来执行不同的操作具体取决于您是左键单击还是右键单击我预计会有一个简单的右键单击事件但事实证明没有我希望 Button 的视觉行为与预先存在的 Click 事件相同
当部分在页面上滚动时处于活动状态时，突出显示目录中的项目

当您向下滚动页面时我试图突出显示粘性目录中的当前部分项目目前的结构是这样的 div div div div h2 Header h2 div content div div div div div 目录如下 ul li a href I
Makefile 将目录中的所有 cpp 文件编译为单独的可执行文件

我现在正在学习C 我想要一个 makefile 它将编译当前目录中的所有 cpp 文件以分离可执行文件例如一个目录下有3个c 文件比如考试1 cpp 考试2 cpp and 示例3 cpp 我想要一个 makefile 来编译和链接它
如何覆盖 console.log() 并在输出的开头添加一个单词？

我有一个 Log 函数它可以打印数据以及传递的参数如何打印内容并同时始终在日志开头打印单词 Report function Log if app debug logs if console console log console log
加特林使一个场景在一系列场景中运行一次

我有一个场景我必须执行某些步骤但我不希望用户多次登录所以我链接了这些场景但登录仍然发生多次有没有办法限制部分链只运行一次 class CreateUserSimulation extends Simulation val logi
硒：无法定位元素

我正在尝试切换到框架但 Selenium 无法找到该元素这是我在定位之前使用 Selenium 获得的 HTML 代码 div class jqmPopOverlay style height 100 width 100 div div
旋转数据框以保留 R 中的列标题和子标题

我正在尝试旋转一个包含标题和副标题的表格以便标题进入日期列并且副标题是两列而不是重复这是我的数据的示例这是使用制作的dput 因此在原始 Excel 文件中每个日期都跨越两个子标题蓝色和绿色在 R 中这些空白单元格被

旋转数据框以保留 R 中的列标题和子标题

Excel 代表

旋转数据框以保留 R 中的列标题和子标题 的相关文章

随机推荐

热门标签

旋转数据框以保留 R 中的列标题和子标题的相关文章