使用 dplyr 的过滤器和 mutate 生成新变量

2024-03-14

我选择 hflights-dataset 作为示例。

我尝试创建一个包含飞机“TailNum”的变量/列，但仅限于飞行时间最长的 10% 以下的飞机。

install.packages("hflights") 
library("hflights") 
flights <-tbl_df(hflights) 
flights %>% filter(cume_dist(desc(AirTime)) < 0.1) %>% mutate(new_var=TailNum)

编辑：生成的数据帧只有 22208 个 obs，而不是 227496。有没有办法保留原始数据帧，但为具有前 10% 播放时间的飞机添加一个带有 TeilNum 的新变量？

你不需要flights in mutate()在管道之后。

flights %>% filter(cume_dist(desc(AirTime)) < 0.1) %>% mutate(new = TailNum)

另外，new 是一个函数，所以最好避免将其作为变量名。看到吗？新的。举例来说：

flights <-tbl_df(hflights) 
flights %>% filter(cume_dist(desc(AirTime)) < 0.1) %>% 
+   mutate(new_var = TailNum, new = TailNum) %>%
+   select(AirTime, TailNum, new_var)
Source: local data frame [22,208 x 3]

   AirTime TailNum new_var
1      255  N614AS  N614AS
2      257  N627AS  N627AS
3      260  N627AS  N627AS
4      268  N618AS  N618AS
5      273  N607AS  N607AS
6      278  N624AS  N624AS
7      274  N611AS  N611AS
8      269  N607AS  N607AS
9      253  N609AS  N609AS
10     315  N626AS  N626AS
..     ...     ...     ...

要保留所有观察结果，请丢失filter()。我的正常方法是使用ifelse()反而。其他人也许能够提出更好的解决方案。

f2 <- flights %>% mutate(cumdist = cume_dist(desc(AirTime)), 
                   new_var = ifelse(cumdist < 0.1, TailNum, NA)) %>%
  select(AirTime, TailNum, cumdist, new_var)

table(is.na(f2$new_var))

 FALSE   TRUE 
 22208 205288

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

使用 dplyr 的过滤器和 mutate 生成新变量的相关文章

根据不平凡的标准有效合并两个数据帧

正在接听这个问题 https stackoverflow com questions 18821862 data selection error 18823432 18823432昨晚我花了一个小时试图找到一个没有增长的解决方案data
获取所有矩阵列逐元素乘积对的快速方法

假设我有一个数字matrix set seed 1 mat lt matrix rnorm 1000 ncol 100 我想生成所有向量它们是中所有唯一向量对的逐元素乘积的结果mat 我们如何改进下面的代码 all pairs lt t
R-在多个图的外缘绘制居中图例

我想在具有多个绘图的设备中的绘图区域之外绘制居中图例 SO 中提出了许多关于更改 R 图中图例位置的问题略有不同例如 1 R 组合图的通用标题和图例 https stackoverflow com questions 8736966 r
使用 R 从字符串中提取函数参数

最好使用stringr包我想创建一个函数extract 以字符串向量作为参数 vec lt c div span icon hospital user i18n t Enrolments or i18n t Paper a string
在ggplotly散点图中添加自定义数据标签

我想显示Species对于每个数据点当光标位于该点上方而不是 x 和 y 值时我用iris数据集另外我希望能够单击数据点以使标签持久存在并且当我在图中选择新位置时标签不会消失如果可能的话最基本的是标签持久性问题是一个优点这
在 R Shiny 中，如何使用可排序 js 将其在列表中出现的顺序次数附加到每个列表元素？

下面的可重现代码适用于将元素从一个面板拖动到另一个面板并在拖动到面板中自动使用 HTML CSS 对拖入的每个元素进行排名顺序编号但是我现在尝试附加到每个拖动到列表元素的末尾使用某种形式的paste0 我假设该元素在拖至
对于多项式，获取其所有极值并通过突出显示所有单调部分来绘制它

有人问我这个有趣的问题我认为值得将其发布在这里因为 Stack Overflow 上还没有任何相关线程假设我有长度为的多项式系数n vector pc 其中次数多项式n 1对于变量x可以以其原始形式表示 pc 1 pc 2 x pc
编写健壮的 R 代码：命名空间、屏蔽和使用 `::` 运算符

简洁版本对于那些不想阅读我的案例的人来说这就是本质最小化新包破坏现有代码即编写您编写的代码的机会的推荐方法是什么尽可能坚固充分利用该功能的推荐方法是什么命名空间机制 when a just using贡献的软件包比如在一
连接多个用户的 R 闪亮会话

最小可重现示例 library shiny ui lt fluidPage actionButton button1 Run 1 actionButton button2 Run 2 server lt function session i
jupyter 中的 r 图形 - 无法启动 png() 设备

我在 Jupyter 中使用 R 但无法在笔记本本身中绘制图表这是一个可重现的示例 set seed 123 mat as matrix x rnorm 100 y rnorm 100 plot mat 在朱皮特中 Error in pn
R：根据元素长度从向量中删除元素

如何根据字符串的字符数或长度从字符串向量中删除元素 df lt c asdf fweafewwf af aewfawefwef awefWEfawefawef gt df 1 asdf fweafewwf af aewfawefwef aw
如何从R中的日期中提取月份

我正在使用lubridate封装并应用month从日期中提取月份的函数我在日期字段上运行了 str 命令得到了 Factor w 9498 levels 01 01 1979 01 01 1980 5305 1 1 1 1 1 1 1
rpart是自动剪枝吗？

Is rpart自动修剪生成的决策树rpart比具有自动修剪功能的 Oracle Data Mining 生成的级别要多得多否但拟合函数的默认值可能会提前停止分割对于早期的某些定义 See rpart control对于您可
R：如何找到向量的模式[重复]

这个问题在这里已经有答案了下面是我的data frame我想知道每个内存类别 1 到 8 的模式是什么 gt dput d structure list MEMORY1 c 5 5 7 1 5 6 4 5 4 5 5 4 1 5 5 2
将不同的 grViz 组合成一个图

我想结合不同的DiagrammeR绘制成一个图形生成的图如下例所示 library DiagrammeR pDia lt grViz digraph boxes and circles a graph statement graph ov
在函数中使用 quit/q 会导致 RStudio 出现致命错误

更多的是好奇但当你使用时q or quit在 R studio 内的函数内部它会导致致命错误如下所示但 rgui 中的相同函数会导致 R 像往常一样停止并且仅使用q 在 RStudio 中按预期关闭 R 为什么q在函数中导致 RS
R闪亮主面板显示样式和字体

我正在学习闪亮的应用程序并且有一些关于调整布局的基本问题特别是样式和字体希望得到指点或明确的答案谢谢考虑一个基本的输入输出应用程序用户在 sidebarPanel 中输入数据然后在 mainPanel 中反应性地输出结果如何
从 data.frame 中提取时用 NA 填充缺失的列

我有一个函数它将具有某些列的数据框作为输入 columns a b z 现在我有一个数据框DF只有很少的这些列DF columns f u z 如果列不在其中如何创建一个包含所有值为 NA 的列的数据框DF这与DF在柱子上 f u z
如何使用 R 中的函数 sqlSave() 将数据附加到具有 IDENTITY 主键的 SQL Server 表？

我在SQL Server中创建了一个表如下所示 CREATE TABLE testPK ID INT NOT NULL IDENTITY 1 1 PRIMARY KEY NumVal NUMERIC 18 4 现在我想使用 RODBC 函
将所有分号替换为空格 pt2

我尝试对 2000 多行关键字的列表运行文本分析但它们的列出方式如下战略管理风格组织所以当我使用 tm 删除标点符号时它就变成了组织的战略管理风格我认为这在某种程度上破坏了我常用术语的分析我尝试过使用 vector lt

随机推荐

如何在 React 中拖放多个元素？

这是我在 StackOverflow 上的第一个问题我想用 React 构建一个小游戏用户可以将四块骨牌拖放到网格上也可以根据自己的喜好重新定位或旋转它们四格骨牌由矩阵表示然后每个块都在 li 元素中渲染 z tetromino
从 html select 中选择的总和

尝试了多种方法进行了大量研究也许我错过了一些东西但无法完成所以我想知道是否可以对 html select 的选定值求和这是我的代码
使用express在node.js中进行本地化[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案您使用哪个包在 Node js 中使用 Express 进行本地化 Thanks 节点本地化 http
为什么仅在 CNN 中对通道进行批量归一化

我想知道在卷积神经网络中批量归一化是否应该分别应用于每个像素或者我应该取每个通道的像素平均值我在Tensorflow的描述中看到了这一点tf layers batch normalization https www tensorfl
Visual Studio 2017 HRESULT：0x80004004

我在 Docker 容器中完美地运行了 ASP NET Core 项目但随后我在同一解决方案中创建了另一个项目该项目被第一个项目引用构建时 VS 2017 没有抱怨调试时VS说操作已中止 HRESULT 异常 0x80004004
rtl HTML 页面中的方向 ltr

我试图在 rtl HTML 页面中显示负数该标签似乎没有回应我的direction ltr 我写了一个jsFiddle http jsfiddle net opmaster rWSXX 1 显示相反的场景尝试从右到左显示 Add uni
SwiftUI：什么是 @AppStorage 属性包装器

我曾经使用以下语句将重要的应用程序数据例如登录凭据保存到 UserDefaults 中 UserDefaults standard set email protected cdn cgi l email protection forKe
这种未记录的 RAISERROR 语法是否曾经被记录并随后被弃用？

我正在开发一个大型 SQL Server 代码库其中一些代码库至少从 SQL 7 甚至更早的版本就开始开发了在整个代码库中引发错误的方法是使用以下语法据我所知该语法未记录 RAISERROR
如何优化（最小化）jQuery AJAX 调用

我的代码的不同函数有超过 50 个 AJAX 调用所有这些调用都具有相似的结构但具有不同的数据 url 回调参数 var jqXHR post dba port php mode del wallfunds pdata cdata wn
构建图像时出错：在存储库 docker.io/hyperledger/fabric-baseimage 中找不到最新标签

我将链代码部署到对等网络但没有成功我查看了同行的日志看到了一条错误消息构建镜像时出错在存储库 docker io hyperledger fabric baseimage 中找不到最新标签从中提取特定的基础镜像https hub
如何更改 Django 表行的颜色？

是否可以根据当前对象的值更改行的颜色就我而言我有一个table从模型创建Job The Job有属性delivery If job delivery例如已交付我想将行的颜色更改为红色我唯一想到的是使用JQuery但我不确定这是否有
使用 JS SDK 以您自己的身份（而不是页面）在页面上发表评论 [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 我正在尝试
在相等运算符实现中引用相等运算符

使用 Reflector 或 DotPeek 相等运算符重载的 System Linq Data Binary 实现如下所示 Serializable DataContract public sealed class Binary IEqu
:before_save 和 :before_update Active Record 回调之间有什么区别？

有人可以向我解释一下两者之间的区别吗 before save and before updateRuby on Rails 4 中的 Active Record 回调我通读了有关 Active Record 回调的官方文档但找不到足够详
如何将 lambda 函数排队到 Qt 的事件循环中？

基本上我需要在 Java 中完成同样的事情 SwingUtilities invokeLater gt function 或者像 JavaScript 中这样 setTimeout gt function 0 但有了 Qt 和 lambda
setTimeout 仅运行一次而不是重复运行[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我想让 div 每 2 秒淡入和淡出一次但 setTimeout 函数只运行一次并隐藏 div 仅此而已它不会执行多次 HTM
numba 编译逻辑比较中的性能损失

以下用于逻辑比较的 numba 编译函数性能下降的原因可能是什么 from numba import njit t True and False njit boolean boolean unicode type boolean njit
如何将 Beast websocket 的读取处理程序传递给 async_read？

我如何传递回调给async read 我尝试了以下但不会编译我基于修改代码docs http www boost org doc libs 1 65 1 doc html boost asio reference ReadHandler
如何使用CodeMirror动态切换模式？

如何使用CodeMirror动态切换模式我有默认设置但需要切换它像这样的东西会对你有帮助首先设置CodeMirror this editor CodeMirror fromTextArea document getElementB
使用 dplyr 的过滤器和 mutate 生成新变量

我选择 hflights dataset 作为示例我尝试创建一个包含飞机 TailNum 的变量列但仅限于飞行时间最长的 10 以下的飞机 install packages hflights library hflights flig

使用 dplyr 的过滤器和 mutate 生成新变量

使用 dplyr 的过滤器和 mutate 生成新变量 的相关文章

随机推荐

热门标签

使用 dplyr 的过滤器和 mutate 生成新变量的相关文章