R:对一列中的完整案例进行求和,并按另一列中的值进行分组(或排序)

2024-01-13

我正在使用airqualityR 中可用的数据集,并尝试计算数据中不包含任何数据的行数NAs,同时聚合Month.

数据如下:

head(airquality)
#   Ozone Solar.R Wind Temp Month Day
# 1    41     190  7.4   67     5   1
# 2    36     118  8.0   72     5   2
# 3    12     149 12.6   74     5   3
# 4    18     313 11.5   62     5   4
# 5    NA      NA 14.3   56     5   5
# 6    28      NA 14.9   66     5   6

如你所见,我有NA列中的 sOzone and Solar.R。我使用了该功能complete.cases如下:

x  <- airquality[,1] # for the Ozone
y  <- airquality[,2] # for the Solar.R
ok <- complete.cases(x,y)

然后检查:

nrow(airquality)
# [1] 153
sum(!ok)
# [1] 42
sum(ok)
# [1] 111

这太棒了。

但现在,我想将这些数据分开进行排序Month(第 5 栏)这就是我遇到问题的地方 - 在尝试aggregate or sort通过第 5 列中的值 (Month).

我能够让它运行,它不会排序Month然而(我只是想确保我可以运行该函数):

aggregate(x = sum(complete.cases(airquality)), by= list(nrow(airquality)), FUN = sum)
#   Group.1   x
# 1     153 111

好吧……所以要整理一下。我正在尝试使用by要排序的聚合函数的一部分。我尝试了column5的许多变体airquality.

- airquality[,5]
- airquality[,"Month"]

我收到这些错误:

aggregate(x = sum(complete.cases(airquality)), by= list(airquality[,5]), FUN = sum)
# Error in aggregate.data.frame(as.data.frame(x), ...) : 
#   arguments must have same length

aggregate(x = sum(complete.cases(airquality)), by= 
      list(sum(complete.cases(airquality)),airquality[,5]), FUN = sum)
# Error in aggregate.data.frame(as.data.frame(x), ...) : 
#   arguments must have same length

我试图进一步搜索?aggregate(x, ...)功能。即在by part...

by - 分组元素列表,每个元素与数据框 x 中的变量一样长。这些元素在使用前会被强制转换为因子。

我抬头?factor,但似乎不知道如何应用它(如果在这种情况下甚至有必要)。我也尝试过放break =但没有成功。

没有任何一个“您可能已经有了答案的问题”似乎适用,其中许多给出了 C# 和 SQL 的解决方案。

编辑:预期结果

Count  Month
  24       5
   9       6
  26       7
  23       8
  29       9

作为其他答案的补充,您可以这样做dplyr.

require(dplyr)

airquality %.%
  group_by(Month) %.%
  summarize(incomplete = sum(!complete.cases(Ozone, Solar.R)),
             complete = sum(complete.cases(Ozone, Solar.R)))

#  Month incomplete complete
#1     5          7       24
#2     6         21        9
#3     7          5       26
#4     8          8       23
#5     9          1       29
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R:对一列中的完整案例进行求和,并按另一列中的值进行分组(或排序) 的相关文章

  • Perl:散列 2 中数组的数值排序(施瓦茨变换)

    这实际上是该线程的后续内容 Perl 散列中数组的数字排序 https stackoverflow com questions 7914931 perl numerical sort of arrays in a hash 我无法编辑原始问
  • 获取非零数据的列意味着

    R 可以获得数据帧非零值的 colMeans 吗 data lt data frame col1 c 1 0 1 0 3 3 col2 c 5 0 5 0 7 7 colMeans data 1 33 4 我想要这样的东西 mean dat
  • dplyr:取消选择由给出的列

    如何取消选择中给出的列 自写函数的参数 我还需要在另一点选择列 因此只需使用 in 没有解决我的问题 任何解决方案表示赞赏 select 帮助者 操纵者quosures或表达方式 very simple example data test
  • 使用两列数据分割数据帧并对结果数据帧列表应用通用转换

    我想根据两列中的值将一个大数据帧拆分为一个数据帧列表 然后 我想对结果列表中的所有数据帧应用通用数据转换 滞后转换 我知道 split 命令 但只能让它一次处理一列数据 您需要将所有想要分割的因素放在一个列表中 例如 split mtcar
  • 缓存施瓦茨变换

    我正在学习 中级 Perl 它非常酷 我刚刚读完 施瓦茨变换 部分 在理解它之后 我开始想知道为什么变换不使用缓存 在具有多个重复值的列表中 转换会重新计算每个值的值 因此我想为什么不使用哈希来缓存结果 这是一些代码 a place to
  • 替换因子列中的

    我想更换
  • 如何很好地注释 ggplot2(手册)

    Using ggplot2我通常使用geom text和类似的东西position jitter注释我的情节 然而 对于一个漂亮的情节 我经常发现手动注释是值得的 像下面这样 data2 lt structure list type str
  • 快速排序优化

    我正在学习排序算法 下一步 我试图让我的实现接近std sort 到目前为止我还很远 我有 3 个快速排序的实现 标准快速排序 使用临时数组 quicksort with following optimizations median3 用于
  • 在R中使用plotly在轴标题中换行和下标

    我刚开始使用plotly对于 R 中的一些交互式散点图 并且在轴标签上遇到困难 通常我设计我的情节ggplot2然后使用ggplotly函数来转换它们 但这有时由于某种原因非常慢 所以我想直接在中创建我的图plotly 我现在尝试更改轴标题
  • 挖泥机子集 (MuMIn) - 如果存在主效应,则必须包括交互作用

    我正在使用 dredge MuMIn 进行一些探索性工作 在此过程中 我想将两个变量设置为仅当它们之间存在相互作用时才允许一起出现 即它们不能仅作为主要效果一起出现 使用样本数据 我想挖掘模型 fm1 尽管它可能没有意义 如果变量 GNP
  • 如何为 nls 函数找到良好的起始值?

    我不明白为什么我不能对这些数据使用 nls 函数 我尝试过很多不同的起始值 但总是出现相同的错误 这是我一直在做的事情 expFct2 function x a b c a 1 exp x b c vec x lt c 77 87 87 7
  • 在另一个函数中定义一个函数的优雅方式

    我想构建 f lt function g lt function x x 2 list 这样我就可以使用调用f g 4 并有list 导致list 16 一般来说我会在里面定义几个临时函数f用户在调用时可以调用f 我已经尝试过assign
  • 使用 ggplot 将条形图的列与线图的点对齐

    当线图的点与条形图的条具有相同的 x 轴时 有什么方法可以使用 ggplot 将它们对齐 这是我尝试使用的示例数据 library ggplot2 library gridExtra data data frame x rep 1 27 e
  • 如何解决在Windows中运行R时出现“剪贴板缓冲区已满且输出丢失”错误?

    我正在尝试将一些数据直接从 R 复制到我的 Windows 计算机中的剪贴板 我发现在一些网站上使用 file clipboard 可以工作 确实如此 但对于非常小的数据集 例如 如果我复制一个小数据集 100 个 obs 它会顺利工作 d
  • 基于多列重新编码数据框列[重复]

    这个问题在这里已经有答案了 如何根据其他列的值重新编码列 假设我有以下数据框 我想重新编码df Col3使得该值为 0 如果df Col1 x and df Col2 a gt df lt data frame a c rep x 3 re
  • 使用 data() 的 R 包命名空间问题 -- 找不到数据集

    我在尝试在我自己的包中导入包 即 robfilter 时遇到了问题 我尝试使用它的方法之一 adore filter 在这一行失败 data critvals 出现错误 未找到数据集 critvals 如果我通过 require robfi
  • 删除ggplot2 geom_bar中没有数据的日期列[重复]

    这个问题在这里已经有答案了 我想隐藏 ggplot2 中没有数据的列 这是使用 nycflights13 库的可重现示例 library nycflights13 library dplyr library ggplot2 small da
  • R中不重复的组合

    我试图获取变量元素长度为 3 的所有可能组合 虽然它部分地与combn 一起工作 但我没有完全得到我正在寻找的输出 这是我的例子 x lt c a b c d e t combn c x x 3 我得到的输出看起来像这样 1 2 3 1 a
  • 有条件地将字符串转换为特定数值

    我确信对此有一个简单的答案 但我已经扫描了堆栈溢出 但无法找到解决方案 似乎 sapply 和 ifelse 函数的组合可能可以完成这项工作 但我不确定 所以我有一个包含字符的数据框 除了一列是数值 Create dataframe whi
  • 将从数据透视表包生成的数据透视表转换为数据帧

    我正在尝试制作一个数据透视表pivottabler包裹 我想将数据透视表对象转换为数据框 以便我可以将其转换为数据表 带有 DT 并在 Shiny 应用程序中渲染它 以便可以下载 library pivottabler pt qpvt mt

随机推荐

  • 在开发、登台和生产之间同步 Drupal 站点

    通常在 Drupal 6 x 站点启动后 我会让人们开始注册并输入他们自己的内容 每当需要升级时 生产中的数据库都会复制到开发版 然后在开发版上完成开发 然后推送到登台以供客户批准 当网站最终准备上线时 出现了一个问题 生产服务器具有最新的
  • 为什么 ng-scope 添加到我的部分视图的 javascript 内联中并使警报不起作用?

    我正在使用 AngularJs 和模板系统 我想向每个模板添加特定的内联 javascript 脚本 添加与所选选项卡相关的警报框 主页 列表 设置 Html 渲染 但是添加了 ng scope 并且当您更改选项卡时没有任何警报 我在这里提
  • jQuery datepicker altFormat 不显示

    我有一个 jQuery 日期选择器 它根据卖家的语言偏好进行本地化 每个日期选择器自定义都有不同的日期格式 但我希望提交表单时的输入采用特定的格式进行解析 我尝试在日期选择器上使用 altFormat 将其设置为 mm dd yy 但我不希
  • 角度 ui-router 维护选项卡之间的状态

    想知道保留选项卡之间状态的最佳方法 我使用引导选项卡和角度用户界面路由器 我在其中一个选项卡中有一个谷歌地图 并且不想在用户选择该选项卡时重新加载地图 请指教 Thanks 我认为本期讨论了您正在寻找的内容 https github com
  • php mysql asc/desc 顺序

    TABLE timeslot id timeslot times 1 09 00 2 09 30 3 10 00 4 10 30 5 11 00 bookslot id id timeslot date b ref 1 2 2010 02
  • 如何让Android模拟器启动更快

    我目前一直坚持使用 Atom CPU 桌面来开发 Android 应用程序 有哪些方法可以改善其启动时间 运行模拟器时 我可以看到模拟器使用的核心数量只有一个 我从 Eclipse ADT 插件中运行模拟器 如何让模拟器使用两个核心而不是一
  • 只需单击标签即可双击

    我有一个标签 并且单击它时正在运行一些功能 但是 当单击事件发生时 双击事件完成 然后我的函数运行两次 你可以看一个简单的例子here http jsfiddle net vgWGT 2 HTML
  • iOS 7 master有导航栏提示时的细节布局

    我在 iOS 7 中遇到布局问题 要重现 请创建一个简单的主从应用程序并将此行插入MasterViewController m self navigationItem prompt Master 这在DetailViewController
  • 正则表达式允许非 ASCII 和外文字母吗?

    是否可以创建一个正则表达式来允许非ascii字母与拉丁字母一起使用 例如中文或希腊符号 例如允许A汉语AbN汉语 我目前有以下内容 w d w d s 只允许使用拉丁字母 In NET p L d p L d s 相当于你的正则表达式 另外
  • Angular2 5 分钟安装错误 - 未定义需求

    我正在做Angular2 5 分钟快速入门 https angular io docs ts latest quickstart html 现在教程已经进行了大约一半 我已经正确设置了以下文件 索引 html 应用程序组件 ts 应用程序
  • 实现观察者模式时出现的问题:“成员引用基类型 ________ 不是结构或联合”

    我一直在实现一个准系统观察者模式 但遇到了一个有点神秘的错误 成员引用基类型 Observer 不是结构或联合 我认为这与我使用模板有关 但我仍然对模板感到相当不舒服 这是有问题的代码 为了简化事情而删除了大多数 cons 析构函数 主题界
  • 在Android中绘画时如何遮盖一个简单的区域?

    下面是一个简化的描述 想象一下 我有一个 View 类 它可以绘制一面墙的图片 并且我想在绘制它时切出一个窗口 假设我扩展该 View 类并重写其dispatchDraw 方法来执行以下操作 首先绘制背景 如果有的话 可以通过窗户看到 接下
  • 有没有办法像oracle中的rownum一样获取Mysql中的行号[重复]

    这个问题在这里已经有答案了 有没有办法像oracle中的rownum一样获取Mysql中的行号 如果没有那么有什么间接的方法吗 请建议 直到MySQL终于支持现代SQL http modern sql com slides 获得类似内容的唯
  • 如何标记和测量斑点的大小?

    我正在用Python学习图像分析 我只是一个初学者 我能够编写代码 我在下面分享 来检测此纳米颗粒图像中的斑点 纳米颗粒 我可以使用以下方法检测到有 10 个纳米粒子cv2 connectedComponents 但现在我需要 用数字标记每
  • 单击标题上的按钮时阻止引导手风琴打开

    我有两个操作按钮位于手风琴的标题上 如下所示 当我单击这些按钮之一时 它会切换手风琴的状态 我尝试过e preventDefault and e stopImmediatePropagation 没有结果 这是jsfiddle https
  • 如何使用垂直对齐:居中;适当地?

    我想让我的列表 导航 与图像 徽标 的中心对齐 我尝试使用vertical align middle 但是当我左右浮动图像时 我无法让它工作 这是我的代码 HTML div img src logo png ul li a href Ite
  • 如何以最简单的方式在 V 2010Express C# 中创建 MRU?

    首先 我是 C 编程的新手 我需要尽快创建一个简单的 MRU 好吧 问题是我尝试查看一些在线示例 但我发现它们有点太令人困惑了 那么 是否任何人都可以在工具条菜单项中创建 最近使用 部分 而无需进入那些复杂的代码 例如 我将无法理解这些东西
  • 如何在 pyparsing 中与 OneOrMore 等进行非贪婪(回溯)匹配?

    我正在尝试使用以下方法将部分标准化的街道地址解析为其组件pyparsing 我想要非贪婪地匹配可能有 N 个令牌长的街道名称 例如 444 PARK GARDEN LN 应该解析为 number 444 street PARK GARDEN
  • 使用 selenium 滚动网站的特定部分。

    我正在尝试创建一个用于滚动该网站的脚本 http m 1688 com offer 39202959720 html spm a26g8 7664812 0 0 dfxn8I http m 1688 com offer 3920295972
  • R:对一列中的完整案例进行求和,并按另一列中的值进行分组(或排序)

    我正在使用airqualityR 中可用的数据集 并尝试计算数据中不包含任何数据的行数NAs 同时聚合Month 数据如下 head airquality Ozone Solar R Wind Temp Month Day 1 41 190