如何通过在 R 中创建额外的列(均值和标准差)来获得同一数据帧的均值和标准差结果

2024-03-06

如何通过在 R 中创建额外的列(平均值和标准差)来获得同一数据帧的平均值和标准差结果

**DATA:

     category sex day    flag    value
1        FC   M   -1          a     27.5
2        FC   M   -1          a     25.2
3        FC   M   -1          a     22.0
4        FC   M   -1          a     24.3
5        FC   M   -1          a     24.0
6        FC   M   -1          a     29.3
7        FC   M   -1          a     23.4
8        FC   M   -1          a     29.3
9        FC   M   -1          a     23.4
10       FC   M   -1          a     29.3
11       FC   M   -1          a     28.3
12       FC   M   -1          a     30.2
13       FC   M   -1          a     30.2

code


library(dplyr)
library(plyr)
library(doBy)
library(tidyverse)
data <- read.csv("users/category.csv")
print(data)


new_table <- select(data, category, sex, day, flag,value)
filtered<-filter(new_table, sex=="M", category=="FC", flag=="a", day==-1)
filtered

输出应该是:

     category sex day      flag    value    mean    Standard deviation
1        FC   M   -1          a     27.5    27.5       2.8   
2        FC   M   -1          a     25.2
3        FC   M   -1          a     22.0
4        FC   M   -1          a     24.3
5        FC   M   -1          a     24.0
6        FC   M   -1          a     29.3
7        FC   M   -1          a     23.4
8        FC   M   -1          a     29.3
9        FC   M   -1          a     23.4
10       FC   M   -1          a     29.3
11       FC   M   -1          a     28.3
12       FC   M   -1          a     30.2
13       FC   M   -1          a     30.2


你可以使用以下方法来做到这一点dplyr并将其添加到您的filter管链,但值会重复:

library(dplyr)

df %>% 
  mutate(mean = mean(value),
         `Standard deviation` = sd(value))

或者在基地R过滤后:

df$mean <- mean(df$value)
df$`Standard deviation` <- sd(df$value)

Output

   category sex day flag value     mean Standard devation
1        FC   M  -1    a  27.5 26.64615          2.987646
2        FC   M  -1    a  25.2 26.64615          2.987646
3        FC   M  -1    a  22.0 26.64615          2.987646
4        FC   M  -1    a  24.3 26.64615          2.987646
5        FC   M  -1    a  24.0 26.64615          2.987646
6        FC   M  -1    a  29.3 26.64615          2.987646
7        FC   M  -1    a  23.4 26.64615          2.987646
8        FC   M  -1    a  29.3 26.64615          2.987646
9        FC   M  -1    a  23.4 26.64615          2.987646
10       FC   M  -1    a  29.3 26.64615          2.987646
11       FC   M  -1    a  28.3 26.64615          2.987646
12       FC   M  -1    a  30.2 26.64615          2.987646
13       FC   M  -1    a  30.2 26.64615          2.987646

如果您需要向这些列添加值category, sex, flag等然后你可以使用dplyr::group_by关于这些变量before the mutate功能。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何通过在 R 中创建额外的列(均值和标准差)来获得同一数据帧的均值和标准差结果 的相关文章

  • 如何从 data.frame 中删除列?

    不是 你怎么 但更多的是 你怎么 如果有人给你一个包含 200 列的文件 并且你想将其减少到分析所需的少数列 你会如何做呢 一种解决方案是否比另一种解决方案更有优势 假设我们有一个包含列 col1 col2 到 col200 的数据框 如果
  • R 中的卡方拟合优度检验

    我有一个观察值向量 还有一个用模型计算的值向量 actual lt c 1411 439 214 100 62 38 29 64 expected lt c 1425 3 399 5 201 6 116 9 72 2 46 3 30 4 6
  • 使用 lapply、Reduce 和 union 折叠 data.table 中的行

    我有一个 data table 示例 JACcar 它应该使用下面的代码根据 ID 折叠成一行 但是 我不明白为什么它不会折叠少于 2 行 我还尝试通过将列限制为仅包含 NA 以外的值的列来验证我的输出 因为原始数据中有 123 列 有人可
  • 如何检查向量是否是单个 NA 值,没有长度警告且没有抑制

    我有一个功能NA作为默认值 但如果没有NA应该是一个不限于大小 1 的字符向量 我有一个检查来验证这些 但是is na当向量是字符向量时产生标准警告length大于1 so function lt function x NA if is n
  • 基于两列对数据框中的行进行求和[重复]

    这个问题在这里已经有答案了 我想添加一列的值 将它们按两列分组 我找到了如何在一列上执行此操作 但无法弄清楚如何在两列上执行此操作 例如 如果我有以下数据框 x c a a b b c c a a b b c c a a b b c c y
  • 如何扩展 ggplot y 轴限制以包含最大值

    通常 在图中 Y 轴值标签会在绘制的最大值下方被截断 For example library tidyverse mtcars gt ggplot aes x mpg y hp geom point 我知道scale y continous
  • 尝试使用 movie3d 制作 3D PCA 图(rgl)的电影

    我已经使用 pca3d 包在 R 中制作了 rgl 3D PCA 图 并且我正在尝试使用 movie3d 制作一个包含旋转图电影的 gif 文件 pca3d 包 makeMoviePCA 中有一个函数 它将其参数传递给 movie3d 这是
  • data.table 相当于 dplyr::filter_at

    考虑数据 library data table library magrittr vec1 lt c Iron Copper vec2 lt c Defective Passed Error set seed 123 a1 lt sampl
  • 在两个向量之间交换元素(交叉)

    假设我有 chromosome 1 lt c 0010000001010000 chromosome 2 lt c 0100000001001010 我该如何实施step 3 5 Evaluate NC1 否 中 1 个chromosome
  • R:从 Github 安装包时出现编码问题

    我正在尝试安装dcStockR https github com yutannihilation dcStockR来自 Github 的包 这是一个htmlwidgets http www htmlwidgets org 周围的包装纸dc
  • 连接路径的函数?

    是否有现有的函数来连接路径 我知道实施起来并不困难 但仍然 除了照顾尾随 or 我需要注意正确的操作系统路径格式检测 即我们是否编写C dir file or dir file 正如我所说 我相信我知道如何实施它 问题是 我应该这样做吗 现
  • 如何通过在R闪亮循环中读取.csv文件来动态生成dataTableOutput?

    我有一个函数可以生成 n 个数据帧并将其作为 csv 文件保存在某个位置 并且该函数返回已保存 CSV 的文件名 我希望获取这些 csv 文件 使用以下命令读取它read csv 然后使用 renderUI 和 renderDataTabl
  • ‘!’ 对于 R 中的因子没有意义

    我需要从数据框中排除变量 PABI 所以 我按如下方式进行子集化 MyData4 lt subset MyData PROV PABI newdata lt MyData MyData4 但我得到了这个错误 Error in FUN lef
  • 使用 xtable 对乳胶输出的表进行排序

    我正在尝试生成一个排序表并导出到乳胶中 然而 xtable 似乎无法处理排序表 建议 a lt sample letters 500 replace T b lt table a c lt sort table a decreasing T
  • Dplyr 过滤多个类似条件

    我正在尝试在 dplyr 中做一个过滤器 其中的列就像某些观察结果 我可以使用 sqldf 作为 Test lt sqldf select from database Where SOURCE LIKE ALPHA OR SOURCE LI
  • ggplot2 中的颜色和填充参数有什么区别?

    ggmap location geom density 2d aes long lat df geom point aes long lat color special alpha 0 5 data df 当我更改填充颜色时 我看不出有什么
  • 如何使用 Rcpp 将 C 结构从 C 库公开到 R

    我正在尝试将 C 结构从 C 库公开到 R 中 例如 struct A int flag 库提供 API 来构造和销毁是很常见的A A initA void freeA A a 感谢RCPP MODULE 很容易暴露它而不考虑析构函数 in
  • 如何在 R 中创建纯 ascii 表作为输出,类似于 MySQL 风格?

    我正在尝试为 R 找到一个输出的函数data frameMySQL 风格的 ascii 表中的对象如下 id var1 var2 1 asdf g 2 asdf h 3 asdf j 有这样的功能吗 至少有两个工具可以做到这一点 csvfi
  • “条件长度 > 1 并且仅使用第一个元素”错误

    我对 f 语句有疑问 因为它返回给我以下错误消息 条件长度 gt 1 并且仅使用第一个元素 我有一个名为 data summary 的数据框 我想创建两个新变量vol up and vol down取决于我的数据框的其他变量 这是我的脚本代
  • rpy2 无法加载外部库

    希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包 该包以 rJava 作为依赖项 venneuler 和 rJa

随机推荐