如何在 R 中对数据进行子集化而不丢失 NA 行？

2024-04-05

我正在 R 中查看一些数据。一个名为“Height”的特定列包含几行 NA。

我希望对我的数据框进行子集化，以便将高于特定值的所有高度都排除在我的分析之外。

df2 <- subset ( df1 , Height < 40 )

然而，每当我这样做时，R 都会自动删除所有包含高度 NA 值的行。我不想要这个。我尝试过包含 na.rm 的参数

f1 <- function ( x , na.rm = FALSE ) {
df2 <- subset ( x , Height < 40 )
}
f1 ( df1 , na.rm = FALSE )

但这似乎没有做任何事情；带有 NA 的行最终仍然从我的数据框中消失。有没有办法对我的数据进行子集化，而不丢失 NA 行？

如果我们决定使用subset函数，那么我们需要注意：

For ordinary vectors, the result is simply ‘x[subset & !is.na(subset)]’.

因此仅保留非 NA 值。

如果你想保留NA情况下，使用逻辑或条件告诉 R 不要丢弃NA cases:

subset(df1, Height < 40 | is.na(Height))
# or `df1[df1$Height < 40 | is.na(df1$Height), ]`

不要直接使用（很快就会解释）：

df2 <- df1[df1$Height < 40, ]

Example

df1 <- data.frame(Height = c(NA, 2, 4, NA, 50, 60), y = 1:6)

subset(df1, Height < 40 | is.na(Height))

#  Height y
#1     NA 1
#2      2 2
#3      4 3
#4     NA 4

df1[df1$Height < 40, ]

#  Height  y
#1     NA NA
#2      2  2
#3      4  3
#4     NA NA

后者失败的原因是索引NA gives NA。考虑这个带有向量的简单示例：

x <- 1:4
ind <- c(NA, TRUE, NA, FALSE)
x[ind]
# [1] NA  2 NA

我们需要以某种方式取代那些NA with TRUE。最直接的方法是添加另一个“或”条件is.na(ind):

x[ind | is.na(ind)]
# [1] 1 2 3

这正是您的情况会发生的情况。如果你的Height包含NA，然后进行逻辑运算Height < 40最终混合成TRUE / FALSE / NA，所以我们需要替换NA by TRUE如上。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

subset

na

如何在 R 中对数据进行子集化而不丢失 NA 行？的相关文章

R data.table 连接不等式条件

我想使用 data table 包根据多个不等式条件对数据进行子集化 data table 手册中的示例展示了如何使用字符变量执行此操作但不显示数字不等式我还了解了如何使用子集函数来执行此操作但我真的很想利用 data table 二
改进R中从google获取股票新闻数据的功能

我已经编写了一个函数来从 Google 获取和解析给定股票代码的新闻数据但我确信有一些方法可以改进它对于初学者来说我的函数返回一个 GMT 时区的对象而不是用户当前的时区如果传递的数字大于 299 它就会失败可能是因为 goog
根据 pyspark 中的条件从数据框中删除行

我有一个包含两列的数据框 col1 col2 22 12 2 1 2 1 5 52 1 2 62 9 77 33 3 我想创建一个新的数据框它只需要行 col1 的值 gt col2 的值就像注释一样col1 很长类型和col2 有双
删除缺失的数据值

我删除了原始帖子以便能够发布更大版本的数据集实际上总共有 418 行这是我正在进行的生存分析的数据第一列是 ID 号其他列标记为 V2 V20 有很多缺失的数据用表示我用coxph 函数来获取以下内容 Saves survi
如何在R中匹配具有相同主键的两个表中的数据

我有两个表其中包含有关人员的数据 df1 lt data frame id c 113 202 377 288 359 name c Alex Silvia Peter Jack Jonny 这为我提供了 id name 1 113 Al
如何总结此R问题中的销售数量、售出酒类数量和花费金额

我使用以下代码在 R 上上传我的数据 if file exists ames liquor rds url lt https github com ds202 at ISU materials blob master 03 tidyvers
zsh：未找到命令：使用 Big Sur Mac 的终端上的 R

我从官方 cran 网站安装了 R 我可以从 Rstudio 运行 R 但是当我尝试从终端使用 R 时我得到以下结果 base ege Eges MBP R zsh command not found R base ege Eges MB
从 pyspark.sql 中的列表创建数据框

我完全陷入了有线的境地现在我有一个清单li li example data map lambda x get labeled prediction w x collect print li type li 输出就像 0 0 59 0 0
仅当某些值相等时，如何才能将一个文本文件中的值替换为另一个文本文件中的其他值？

我有一个名为finalscores txt我想创建一个 python 脚本它将打开它并从两个单独的列中读取值这是我的finalscores txt file Atom nVa predppm avgppm stdev delta QPr
通过 r markdown 中的循环创建代码片段

如同如何使用R中的knitr创建一个包含代码块和文本的循环 https stackoverflow com questions 36373630 how to create a loop that includes both a code
通过 R 中的数据子集执行计算

我想对数据框的 PERMNO 列中的每个公司编号进行计算其摘要可以在此处查看 gt summary companydataRETS PERMNO RET Min 10000 Min 0 971698 1st Qu 32716 1st Qu
rvest 和 NHL 统计数据的 CSS 选择器问题

我想从 hockey reference com 中抓取数据特别是从以下链接中抓取数据 https www hockey reference com leagues NHL 1991 html https www hockey refer
汇总表中各列的字符值比例

在这种数据框中 df lt data frame w1 c A A B C A w2 c C A A C C w3 c C A B C B 我需要计算所有列中字符值的列内比例有趣的是以下代码适用于大型实际数据集但对上述玩具数据会引发错
如何返回包含最大值标签的向量

我有一个 4 列数组我想获得一个向量其中每行包含包含该行最大值的列的标签我可以在循环中执行此操作但我想使用矩阵函数来提高速度我怎样才能在不编写自己的库函数的情况下做到这一点有一个函数可以做到这一点如果x是你的矩阵尝试max
使用 pkg:sjPlot 函数创建一个生成部分斜体单元格的数据框

我正在尝试创建一个简单的数据表其中 Coral taxon 列中的属名称为斜体而 spp 列中的属名称为斜体属名后面的部分不大写我尝试使用 expression 函数对 Coral taxon 的每一行进行编码但没有成功 sum
在 igraph 中为社区分配颜色

我在 igraph 中使用 fastgreedy community 检测算法在 R 中生成社区代码返回 12 个社区但是在绘图时很难识别它们因为它返回的图的颜色数量有限我怎样才能用十二种不同的颜色绘制这个图表 l2 lt layo
RStudio 如何确定控制台宽度，为什么它似乎总是出错？

我刚刚发现wid lt options width在 RStudio 中它似乎是我日常控制台使用中令人烦恼的根源或者更确切地说更接近根源我应该先说一下我目前使用的是 R 3 2 2 RStudio 0 99 491 Linux M
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个
无法部署 ShinyApp：readTableHeader 在“raw”上发现不完整的最后一行（使用默认值：en_US）

我已经拼命尝试部署我的闪亮应用程序大约一周了但不幸的是我无法停止收到以下消息 Warning message Error detecting locale Error in read table file file header head
不同 R/lme4 版本的单一拟合结果不匹配

我试图将 R 版本 3 5 3 lme4 1 1 18 1 的随机效应估计与 R 版本 4 1 1 lme4 1 1 27 1 相匹配然而当存在奇异拟合时这两个版本之间的随机效应存在微小差异我对奇点警告很满意但令人费解的是不同版本

随机推荐

R dcast 在 python pandas 中的等效项

我正在尝试在 python 中执行与以下命令等效的操作 test lt data frame convert me c Convert1 Convert2 Convert3 values rnorm 3 45 12 age col c 23
如何将字符串从 Delphi 程序的一个实例发送到另一个实例？

将字符串从程序的一个实例发送到程序的另一个实例的最佳和最简单的方法是什么接收程序必须使用接收到的字符串作为参数来执行一个过程我开始阅读有关 DDE 的内容但我感到很困惑我还有哪些其他选择实现这一点的最简单方法是什么使用命名管道
在 iOS Swift 上发布到 Instagram 屏幕

我正在努力让从我的应用程序到 Instagram 的分享变得简单我想要的是进入下面屏幕截图所示的屏幕我已经尝试过 instagram stories share deeplink 并且我已经阅读了所有这些文档 https develop
使用标志寄存器作为布尔返回值是否被认为是不好的做法？

我正在 x86 汇编程序中编写一些程序这些程序修改 ZF 作为返回布尔值的方法因此我可以执行以下操作 call is value correct jz not correct 我想知道这是否被认为是不好的做法因为一些编码标准规定简单的
将字符串转换为“InvariantCulture”

我有以下字符串 an ca an ca 如果你仔细观察你会发现它们是不同的为了比较这样的2个字符串我找到了这个解决方案 if String Compare str1 str2 StringComparison InvariantCul
Keras 序列模型输入形状

我想训练一个基于 numpy 数组的神经网络该数组有 4 个条目作为 X 数据另一个数组有一个条目作为 y 数据 X train x1 x2 x3 x4 y train y1 我认为这是一件相当简单的事情但我无法让输入形状发挥作用我
Elixir / Erlang Dialyzer：为什么行为回调的参数类型应该是子类型而不是超类型？

我有一个行为 X 和一个参数类型的回调函数 a any 模块 Y 实现行为 X 实现模块 Y 中的回调函数具有参数类型 a any b any Dialyzer 不喜欢这样并抱怨 a b gt is not a supertype of a
使用 Automapper 映射 ViewModel 后，我应该如何测试以及测试什么？

我正在尝试测试Index控制器的动作该动作使用自动映射器 http automapper org 映射域Customer视图模型的对象TestCustomerForm 虽然这有效但我担心测试我从Index action 控制器的索引操作
正则表达式用于定位一组单词以及可选的包含和排除单词列表

我尝试构建一个 JavaScript 友好的正则表达式它匹配以特定单词组 A 开头的任何字符串并且如果字符串中包含其他单词它们必须位于一组单词 B 内或者不在单词组 B 内词组 C 因此给出以下词组 A B 和 C A Test
如何在 Heroku 上 rake db:drop 和 rake db:create ？ [复制]

这个问题在这里已经有答案了可能的重复如何在heroku中清空数据库 https stackoverflow com questions 4820549 how to empty db in heroku 我在 Heroku 上有一个 P
在 IIS6 上托管 MVC2

我需要一点帮助我正在尝试在 IIS6 上托管 MVC 2 应用程序在我的开发机器 XP 上它可以在 Cassini 中完美运行或者在 IIS 中作为网站运行首先我尝试将 mvc 扩展名引用到 aspnet isapi 但当这不起
Windows Mobile 6.5.3 和以前的版本在运行时有何不同？

是否有一种既定或非官方的方法来查明我的应用程序是否在 Windows Mobile 6 5 3 设备上运行或者是否是以前的版本托管或本机并不重要我不介意互操作因为我想要一些声誉以下是我在网上找到的信息如何检测 Windows Mo
使用 VBA 检测 Excel 版本中是否启用动态数组

我正在尝试实施 Microsoft 所说的最佳实践但没有成功这是由于 Excel 中现在支持新的动态数组这是他们的文章下面是具体部分 HERE https learn microsoft com en us office vba e
检索插入到 sqlite 数据库中的所有行，并在包含标签的表视图单元格中显示为具有不同部分的子视图

我是 Objective C 和 sqlite 的新手我已成功使用 sqlite 将数据插入到表中我的项目包含 2 页添加提醒页面用户输入数据并单击保存这是右侧导航栏查看提醒页面这是用户在表格视图的单元格中查看保存的提醒的地
如何在 Python 中从文件中 unpickle 一系列对象？

我已以追加模式将对象腌制到文件中但它只读取单个对象这是代码我不知道我做错了什么 with open notes pkl ab as fileObject append pickle dump obj fileObject pickle
Eclipse：向括号添加空格

我正在 Eclipse 中寻找一个设置使用 Photon 它将改变括号的自动完成样式 Eclipse 的默认设置如下所示 function call arg1 arg2 arg3 我更喜欢这样编写代码因为我发现它更具可读性 functi
为什么DataTable比DataReader更快

因此我们在工作中就采取哪种DataAccess途径进行了激烈的争论 DataTable还是DataReader 免责声明我站在 DataReader 一边这些结果震撼了我的世界我们最终编写了一些基准测试来测试速度差异人们普遍认为 D
从 .NET 检查 Windows 更新是否已启用

有没有办法从 NET 检查 Windows 更新是否已启用我想在用户每次登录我的应用程序时提示他们的计算机可能存在风险并为他们提供 Windows 更新网站或控制面板中的 Windows 更新应用程序的链接最好它可以在 XP Vi
toLocaleString 在所有浏览器中不适用于小于 10000 的数字

我正在开发一个应用程序它根据用户的配置显示数字一切都按预期工作除了当我在 Chrome 中使用以下区域设置尝试使用小于 10000 的数字时 es AR 有任何想法吗 Chrome Firefox Edge console log 1
如何在 R 中对数据进行子集化而不丢失 NA 行？

我正在 R 中查看一些数据一个名为 Height 的特定列包含几行 NA 我希望对我的数据框进行子集化以便将高于特定值的所有高度都排除在我的分析之外 df2 lt subset df1 Height lt 40 然而每当我这样做时 R

如何在 R 中对数据进行子集化而不丢失 NA 行？

如何在 R 中对数据进行子集化而不丢失 NA 行？ 的相关文章

随机推荐

热门标签

如何在 R 中对数据进行子集化而不丢失 NA 行？的相关文章