使用 lapply 和 which 按特征和功能对数据帧进行子集化

2024-03-14

我有一个包含 5 个维度数据的数据框，如下所示：

> dim(alldata)
[1] 162   6
> head(alldata)
         value layer Kmultiplier Resolution      Season           Variable
1:  0.01308008     b        .01K        1km    Baseflow Evapotranspiration
2:  0.03974779     b        .01K        1km   Peak Flow Evapotranspiration
3:  0.02396524     b        .01K        1km Summer Flow Evapotranspiration
4: -0.15670996     b        .01K        1km    Baseflow          Discharge
5:  0.06774948     b        .01K        1km   Peak Flow          Discharge
6: -0.04138313     b        .01K        1km Summer Flow          Discharge

我想做的是根据其他列获取数据的某些“特征”的值列的平均值。因此，我使用它将数据子集仅包含我感兴趣的变量，例如：

> subset=alldata[which(alldata$Variable=="Discharge" & alldata$Resolution=="1km" & alldata$Season=="Peak Flow"),]
> subset
          value layer Kmultiplier Resolution    Season  Variable
1:  0.067749478     b        .01K        1km Peak Flow Discharge
2:  0.058260448     b         .1K        1km Peak Flow Discharge
3: -0.223953725     b         10K        1km Peak Flow Discharge
4:  0.272916114     g        .01K        1km Peak Flow Discharge
5:  0.240135025     g         .1K        1km Peak Flow Discharge
6: -0.216730348     g         10K        1km Peak Flow Discharge
7:  0.088966500     s        .01K        1km Peak Flow Discharge
8: -0.018943754     s         .1K        1km Peak Flow Discharge
9: -0.008339365     s         10K        1km Peak Flow Discharge

这就是我被困住的地方。假设我想要“层”列中每个值的平均值的向量或列表...所以我最终会得到 3 个数字，一个代表“b”，一个代表“g”，一个代表“s”。我需要制作一堆这样的子集，我认为应用函数可以提供帮助，但在多个教程和堆栈问题之后我无法让它工作。一个更简单的例子也很好，像这样：

> A=data.frame(seq(1,9),rep(c("a","b","c"),3),c(rep("type1",3),rep("type2",3),rep("type3",3)),c(rep("place1",2),rep("place2",2),rep("place3",2),rep("place1",2),rep("place2",1)))
> names(A)=c("value","Letter","Type","Place")
> A
  value Letter  Type  Place
1     1      a type1 place1
2     2      b type1 place1
3     3      c type1 place2
4     4      a type2 place2
5     5      b type2 place3
6     6      c type2 place3
7     7      a type3 place1
8     8      b type3 place1
9     9      c type3 place2

在这个简单的示例中，我需要按字母列出的“place1”列“value”的平均值，它应该以任何格式返回类似：“a=平均值，b=平均值，c=平均值”作品。

这是应用功能的工作吗？如果是这样，怎么办？如果没有，请告诉我一个更好的替代方法来对我的数据进行子集化。

谢谢你！

在您给出的示例数据集上实现的替代解决方案，并且不使用任何apply家庭在这里发挥作用。

Using dplyr package

library(dplyr)
A %>% 
 group_by_(.dots = c("Place","Letter")) %>% 
 summarise(MEAN = mean(value))

# Source: local data frame [6 x 3]
# Groups: Place [?]

#    Place Letter  MEAN
#    <fctr> <fctr> <dbl>
# 1 place1      a     4
# 2 place1      b     5
# 3 place2      a     4
# 4 place2      c     6
# 5 place3      b     5
# 6 place3      c     6

Using by()功能

> by(A$value, A[,c(2,4)], FUN = mean)
# Letter: a
# Place: place1
# [1] 4
# ------------------------------------------------------------ 
# Letter: b
# Place: place1
# [1] 5
# ------------------------------------------------------------ 
# Letter: c
# Place: place1
# [1] NA
# ------------------------------------------------------------ 
# Letter: a
# Place: place2
# [1] 4
# ------------------------------------------------------------ 
# Letter: b
# Place: place2
# [1] NA
# ------------------------------------------------------------ 
# Letter: c
# Place: place2
# [1] 6
# ------------------------------------------------------------ 
# Letter: a
# Place: place3
# [1] NA
# ------------------------------------------------------------ 
# Letter: b
# Place: place3
# [1] 5
# ------------------------------------------------------------ 
# Letter: c
# Place: place3
# [1] 6

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

subset

apply

使用 lapply 和 which 按特征和功能对数据帧进行子集化的相关文章

为什么 Jupyter 突然将数据框显示为基于文本的？

我已经使用 jupyter 笔记本有一段时间了如果我这样做的话df head 它总是返回一个格式良好的表格格式现在我调用了数据我得到了这个为什么我该如何解决它 import pandas as pd df pd read csv
带有 dplyr::do 的匿名函数 - 使用 rle 的结果来过滤数据

我有按主题 id 分组的时间序列数据这些数据保留在某个站点上并且在每个时间步骤中都有某个阶段有时受试者从一个站点切换到另一个站点并且可能会再次返回如果个人更换站点来回例如从站点 a 到站点 b 然后返回站点 a an
通过使用 dplyr 对变量进行分组来将多列的响应制成表格

你好我是 plyr dplyr 系列的新手但很喜欢它我可以看到它对我自己的工作有巨大的实用性但我仍在努力解决它我有一个如下所示的数据框 1 如何为每个非分组变量生成一个表格以显示分组变量每个值内的响应分布 2 注意我确实有一些
R中特定小时和月份的数据框中的平均值

我一直在网上搜索但还没有找到解决这个可能很简单的问题的方法这是使用库 xts 的半小时数据 library xts data xts lt as xts 1 nrow data as POSIXct 2007 08 24 17 30 0
从具有重复元素的向量生成所有独特的组合

这个问题之前曾被问过但仅适用于具有非重复元素的向量我无法找到一个简单的解决方案来从具有重复元素的向量中获取所有组合为了说明这一点我在下面列出了一个例子 x lt c red blue green red green red 向量 x
将日期添加到日历热图 R

I m plotting a calender heat map using Paul Bleicher s calenderHeat R code https raw githubusercontent com iascchen VisH
将命名参数传递给调用非 mutate 函数的函数

我正在尝试做一些非常类似的事情here https community rstudio com t passing named list to mutate and probably other dplyr verbs 2553 11 本质
获取因子变量中水平和标签之间的原始关联

我正在寻找一个函数来获取因子变量的原始映射表我导入一个 Rdata 文件我有一个名为 FactVar 的因子变量我知道 FactVar 的映射表如下 010025 gt city1 015146 gt city2 048017 gt
在单词后获取文本——R Webscraping

几周前这里有人帮助我极大地获得了名人数据库中所有链接的列表我能够运行此代码并获得以下输出 library purrr library rvest url base lt https www nndb com lists 494 0000
使用ggmap在地图上绘制等高线

我有洛杉矶港地区的颗粒物浓度差异之后之前我正在尝试使用 ggmap 在地图上绘制浓度等值线但结果看起来很不同我使用的代码如下所示数据位于代码下方 Code 安装 packages ggmap library ggmap PM r
R：计算数据框的边距或行和列总和

我有一个如下所示的数据框 Flag1 Flag2 Type1 Type2 Type3 1 A FIRST 2 0 0 2 A SECOND 1 9 0 3 A THIRD 3 7 0 4 A FOURTH 9 18 0 5 A FIFTH
在数据帧中的几行上提取具有匹配模式的 id

这是我正在处理的数据框的示例 id string 1 no 1 yes 1 yes 2 no 2 yes 3 yes 3 yes 3 no 我想提取id为此最后两行包含字符串 yes 对于列string 所以结果是 id string 1
控制绘图中 x 轴上出现哪些刻度线/标签？

我想控制 X 轴上显示的刻度线以下代码将刻度线放置在 5 的序列中位于 5 10 15 30 library plotly df lt data frame x 1 30 y sample 100 300 size 30 replace
从 Rcpp C++ 函数获取 r 函数参数

我在 R 端定义了一个函数如下所示 foo lt function arg1 arg2 arg3 以及使用 Rcpp 的 C 函数该函数获取全局环境并实例化 R 函数以从该函数执行它这是代码 namespace Rcpp void m
R：在组上应用函数

我希望将函数应用于数据框然后将该函数的结果存储在数据框中的新列中这是我的数据框 tradeData 的示例 Login AL Diff a 1 0 a 1 0 a 1 0 a 0 1 a 0 0 a 0 0 a 0 0 a 1 1 a
如何在 R 中手动编写正态分布核的似然值？

具体来说如何编码 x 和 mu 之差的乘积精度矩阵以及 x 和 mu 之差的转置我下面的代码正确吗提前致谢 colSums dat mu mat solve sigma colSums dat mu mat 其中 mu mat 是重
data.frame 不会破坏列名

有没有办法使用 data frame 而不破坏列名我有以下结构 Canon PowerShot 1 9 997803e 01 9 997318e 01 3 327920e 01 3 327920e 01 9 988220e 01 6 4
在ggplot2中按线连接分组点

我试图将每组的每个蓝点与其相应的红点连接起来但是我在使用时遇到问题geom segment 谢谢帮助 repl lt data frame title c A B C A B C diff c 10 06 1 89 12 79 10 0
ggplot2：从纵横比中排除图例

I use ggplot2 and knitr发布带有右侧图例的散点图图例包含在纵横比中因此破坏了绘图的方形如图所示默认主题 https github com hadley ggplot2 wiki themes 当图例文本变得比
如何在R中制作渐变颜色填充时间序列图

How to 填充区域 sp 线下方和上方渐变色这个例子是在 Inkscape 中绘制的但我需要垂直渐变不是水平的间隔从zero to positive 来自white to red 间隔从zero to negative 来自wh

随机推荐

挂钩我的 Vaadin Web 应用程序的启动和停止吗？

我如何知道我的 Vaadin 7 Web 应用程序何时首次启动启动以便我可以进行一些初始设置工作同样我如何知道我的网络应用程序何时结束关闭退出 ServletContextListener Vaadin 建立在Java小服务程序
如何以编程方式更改默认音频输入设备

我正在寻找一种在我的应用程序中设置更改默认输入设备的方法我有几个不同的录音设备进入控制面板并更改默认录音设备非常烦人我环顾四周没有找到任何可以帮助我解决问题的东西应用程序是用 C 编写的面向 Windows Vista Win
如何在 C 中打印 UTF-16 字符？

我有一个包含 UTF 16 字符的文件我读取文件并可以将字符存储在 uint16 t 数组或 char 数组中有更好的选择吗但我如何打印这些字符呢我假设你想打印到stdout or stderr 一种方法是使用libiconv ht
MagicalRecord：如何在后台保存导入的数据

我正在尝试将数据导入核心数据并将其保存在后台线程中魔幻唱片我基本上正在尝试这样做 block User user nil MagicalRecord saveWithBlockAndWait NSManagedObjectContext
我们可以按消息属性过滤来自 Amazon SQS 队列的消息吗？

现在我尝试根据消息属性名称类来过滤消息正如你在下面的代码中看到的 Specify attribute list List
FB SDK 和 cURL：连接到 graph.facebook.com 时出现未知 SSL 协议错误：443

使用 FaceBook SDK 今天获取时出现错误 Fatal error Uncaught CurlException 35 Unknown SSL protocol error in connection to graph faceb
将拉丁mysql数据转换为utf8

我现在想使用utf 8 但我所有的数据都是latin1 转换数据的有效方法是什么我也知道如何将数据库的结构字符集更改为utf8 我想做的是更改现有数据的字符集 update 这是我的旧设置 html输出 utf8 html输入 utf
在 webgl 中制作 2d HUD 的推荐方法

对于 fps 性能很重要的 webgl 游戏制作 2D HUD 最有效的方法是什么我可以想到 3 个选项但我不清楚每个选项的性能成本是多少以及哪个选项最有效那么以下 3 个选项之间的相对性能成本是多少答使用正交相机以 3D 形
如何在 Ionic 4/Angular7 中从 @ViewChild 获取 nativeElement？

我正在使用 Ionic 4 的离子搜索如下所示
在 python 中使用多个输出流？

我要做的是在 python 函数中创建多个输出流并将它们称为1 2 3 在test py def main print gt gt fd1 words1 print gt gt fd2 words2 print gt gt fd3 wor
如何检查 Mac 操作系统中是否安装了特定应用程序/软件

我想使用 Perl Shell 脚本检查 Mac 操作系统中是否安装了特定应用程序我正在使用 PackageMaker 编写程序包其中我需要在安装应用程序之前检查用户计算机上的一些应用程序因此我计划编写一个脚本来为我检查这一点如果
关于使用 this 实现 equals 来比较 Java 中的对象

我看到了一个关于定义的代码段equals 来自本论坛的另一个问题线程但我的问题是以下代码的作用是什么为什么需要它谢谢 if obj this return true 原代码如下所示 http stackoverflow com que
在哪里可以找到示例 XHTML5 源代码？

我在哪里可以找到样品XHTML 5 页面我主要想知道是否可以将 XHTML 5 与其他 XML 语言如 XHTML 1 混合搭配例如这样的内容在 XHTML 5 中有效吗
Netbeans 不允许 Python 2.6 作为默认平台（强制 Jython2.5）

我试图让 Netbeans python 使用设置为 Python 2 6 1 我的系统 python 的默认 python 平台运行因此在 Netbeans 中我执行以下操作工具 gt Python 平台将 Python 2 6 1
为什么数组协方差被认为如此可怕？

在 NET 中引用类型数组是协变的这被认为是一个错误但是我不明白为什么这这么糟糕请考虑以下代码 string strings new Hey there object objects strings objects 0 new o
我应该在哪里存储配置文件？

我需要通过Win8在WinXP中读取和写入配置文件到Windows磁盘他们最好在哪里做这件事 ProgramData 文件夹似乎不允许 procedure TfrmMain FormCreate Sender TObject var pa
输入验证以确保只有数字 c++

好的我正在尝试擅长使用指针因此我正在尝试为用户输入编写输入验证以确保正确处理任何非数字的内容当我使用 isdigit 时它对我不起作用当我输入字母表时我仍然遇到异常有什么建议么谢谢看一下这个 include
如何隐藏 Windows Gtk 应用程序的命令提示符？

我正在使用 MinGW 工具链在 Windows 中编译 Gtk 应用程序但是当我运行我的应用程序时会出现一个命令提示符窗口怎样才能让这个提示消失呢 Check 本文 http ricardo ecn wfu edu cottrell
ajax 调用循环 - 访问循环计数器？

我被困在这里任何帮助将不胜感激我有一个项目列表框我想通过 AJAX 调用 Web 服务检索列表中每个项目的数据需要根据调用数据的行来操作检索到的数据如果我传入 row 参数它的值始终比行数大 1 有没有办法传入 ajax 调用
使用 lapply 和 which 按特征和功能对数据帧进行子集化

我有一个包含 5 个维度数据的数据框如下所示 gt dim alldata 1 162 6 gt head alldata value layer Kmultiplier Resolution Season Variable 1 0 01

使用 lapply 和 which 按特征和功能对数据帧进行子集化

使用 lapply 和 which 按特征和功能对数据帧进行子集化 的相关文章

随机推荐

热门标签

使用 lapply 和 which 按特征和功能对数据帧进行子集化的相关文章