区分缺失值类型（无响应与跳过模式）

2024-04-28

对于可能没有仔细阅读密码本的数据集用户，您会建议如何区分缺失值类型？

在这个玩具示例中，q2只询问那些回答“是”的人q1。这意味着有一个缺失值q2因为该人没有回应而缺失，并且有两个缺失值q2因为没有提出问题所以丢失了。

library(tidyverse)
df <- tibble(q1 = c("Yes", "Yes", "No", "No"), 
             q2 = c("Yes", NA, NA, NA))

df

# A tibble: 4 x 2
  q1    q2   
  <chr> <chr>
1 Yes   Yes  
2 Yes   NA   
3 No    NA   
4 No    NA 

df %>% group_by(q1, q2) %>% count()

# A tibble: 3 x 3
# Groups:   q1, q2 [3]
  q1    q2        n
  <chr> <chr> <int>
1 No    NA        2
2 Yes   Yes       1
3 Yes   NA        1

当我总结时q2数据集中无法区分无响应的缺失和结构性缺失。

df %>% group_by(q2) %>% count()

# A tibble: 2 x 2
# Groups:   q2 [2]
  q2        n
  <chr> <int>
1 Yes       1
2 NA        3

使用 NA、Inf、-Inf 和 NaN，我们可以表示 4 类数字缺失值。下面我们展示了 NA 与 Inf 的使用，然后是 NA 与 NaN 的使用。在第三种方法中，我们讨论 naniar 包的使用。

1) Recode q2Yes、No、结构缺失和缺失的值分别为 1、0、Inf 和 NA。注意is.na(x)只会针对实际 NA 报告 TRUE，is.infinite(x)只会针对 Inf 报告 TRUE，并且!is.finite(x)如果您需要执行测试，将针对 NA 或 Inf 报告 TRUE。可以选择重新编码输出。

df %>% 
  count(q2 = recode(q2, Yes = 1, No = 0, .missing = ifelse(q1 == "No", Inf, NA)))

giving:

# A tibble: 3 x 2
# Groups:   q2 [3]
     q2     n
  <dbl> <int>
1     1     1
2   Inf     2
3    NA     1

2)其变体是使用 NaN 代替 Inf。在这种情况下测试可以使用is.na(x), is.nan(x) and !is.finite(x)

df %>% 
  count(q2 = recode(q2, Yes = 1, No = 0, .missing = ifelse(q1 == "No", NaN, NA)))

giving:

# A tibble: 3 x 2
     q2     n
  <dbl> <int>
1     1     1
2    NA     1
3   NaN     2

3)naniar 包可以创建辅助列来定义每个 NA 的类型bind_shadow。然后我们可以使用以下命令重新编码辅助列recode_shadow然后在我们的计数中使用它们。

图书馆（纳尼亚尔）

library(naniar)
df %>%
  bind_shadow %>%
  recode_shadow(q2 = .where(is.na(q2) & q1 == "No" ~ "struct")) %>%
  count(q2, q2_NA)

giving:

# A tibble: 3 x 3
  q2    q2_NA         n
  <chr> <fct>     <int>
1 Yes   !NA           1
2 <NA>  NA            1
3 <NA>  NA_struct     2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

区分缺失值类型（无响应与跳过模式）的相关文章

dmvnorm MVN 密度 - RcppArmadillo 实现比 R 包慢，包括一些 Fortran

The solution现已上线RCPP画廊 http gallery rcpp org articles dmvnorm arma 我从 RcppArmadillo 中的 mvtnorm 包重新实现了 dmvnorm 我有点喜欢犰狳但我
mclapply 调用应该嵌套吗？

正在筑巢parallel mclapply是个好主意吗 require parallel ans lt mclapply 1 3 function x mclapply 1 3 function y y x unlist ans Outpu
使用 gtable 排列 ggplot 绘图（具有相同宽度的 grobs）以创建 2x2 布局

我正在尝试使用 grobs 和 gtable 将 4 个 ggplot2 图排列成 2x2 网格我不知道如何设置宽度也不知道如何设置非 1xn 或 nx1 排列使用此代码 data iris a lt ggplot iris aes
使用 X11 窗口的 R 脚本仅打开一秒钟

我正在通过 Linux Mint 16 命令行运行 R 脚本它包含我想在窗口中显示的箱线图所以我使用 x11 函数来创建该窗口这是我的代码 testdata lt data frame sample 1 1000 size 100 r
选择一个单元格内的最小值或最大值（分隔字符串）

我有一个数据框其中每个样本的列可以有多个值例如 Gene Pvalue1 Pvalue2 Pvalue3 Beta Ace 0 0381 0 00357 0 01755 0 001385 0 0037 NA 0 039 0 03 1 1
在 R 中使用 gsub 删除尾随空格[重复]

这个问题在这里已经有答案了有没有人有一个技巧可以用 gsub 删除变量上的尾随空格以下是我的数据示例正如您所看到的我在变量中同时包含尾随空格和嵌入空格 county lt c mississippi mississippi cany
根据另一个向量替换向量中的值

我想替换向量中的值 x 与另一个向量 y 陷阱 22 方法需要是动态的以适应向量中不同数量的级别 x 例如考虑向量x x lt sample c 1 2 3 4 5 100 replace TRUE gt x 1 2 4 1 1 3
S4 类 [（子集）带有附加参数的继承

这是一个扩展在 R 中的访问器函数中使用 callNextMethod https stackoverflow com q 24875284 2752888 2017 03 25 更新为了说明如何仅在加载方法时失败但在构建的包中时不会失
计算 R 中数据帧的每一行中特定值的连续出现次数

我有一个data frame许多位置这么多行的变量的每月值我想计算值为零的连续月份即连续单元格的数量如果只是从左到右阅读这很容易但增加的复杂性是年底与年初是连续的例如在下面的缩短示例数据集中用季节而不是月份位置 1
在 R 中使用 spplot 将多个绘图放在一个页面上？

我知道如何在使用简单函数图时绘制两个图 old par lt par mfrow c 1 2 plot faithful main Faithful eruptions plot large islands main Islands yla
再现频率矩阵图

我想在 R 中重新创建一个情节情节如下来源 Boring E G 1941 作为动态平衡的统计频率心理学评论 48 4 279 这略高于我的工资等级能力因此在这里询问无聊的状态第一次 A 只能出现从不 0 或总是 1 在
在单个显示器中绘制多个 jpeg 图像

我需要在单个组合显示器或画布中绘制和显示多个 jpeg 图像例如假设我有图像 a b c d jpg 每个图像的大小不同我想将它们绘制在 2x2 网格的一页上能够为每个子图设置标题也很好我一直在彻底寻找解决方案但不知道如何去
循环中的knitr模板和子文档

圣诞节前我之前问过跨多个 knitr 文档的单一样式表 https stackoverflow com questions 20370584 single style sheet across multiple knitr document
确定向量中是否存在元素的最有效方法

我有几种算法取决于确定元素是否存在于向量中的效率在我看来这 in 这相当于is element 应该是最有效的因为它只返回一个布尔值在测试了几种方法之后令我惊讶的是这些方法是迄今为止效率最低的以下是我的分析随着向量大小的增加
使用pivot_longer将R中的多列变成一列[重复]

这个问题在这里已经有答案了我有一个dfpopulation看起来像这样未列出所有列和行 Region X1975 X1976 X1977 X2008 National Total 942420 93717 94974 132802 Be
优化 R 中的嵌套 for 循环

我尝试加速下面的代码但没有成功我读到Rfast https cran r project org web packages Rfast Rfast pdf包但我也未能实现该包有没有办法优化R中的以下代码 RI lt function
使用 R 从字符串中提取函数参数

最好使用stringr包我想创建一个函数extract 以字符串向量作为参数 vec lt c div span icon hospital user i18n t Enrolments or i18n t Paper a string
R lubridate：当地语言的工作日

如何获取本地语言的工作日和月份 My code library lubridate data lt c 10 02 2015 11 03 2015 data lubri lt dmy data wday data lubri label T
从 R 到 C 处理列表并访问它

我想使用从 R 获得的 C 列表我意识到这个问题与此非常相似使用 call 在 R 和 C 之间传递数据帧 https stackoverflow com questions 6658168 passing a data frame f
将 read.csv 与符号链接文件一起使用

我正在尝试做什么我的源文件非常大我想避免将其复制到其他文件夹中我决定创建一个指向大文件的符号链接并想使用read csv读取文件文件夹结构项目1 数据源文件 csv 项目2 数据别名到源文件 csv 什么地方出了错读取源文件

随机推荐

Java：如何将哈希图插入 MongoDB？

我有一个哈希图我试图将其插入到 MongoDB 版本 3 6 中我知道 insertMany 方法它只接受文档列表我无法创建列表因为我的数据中有重复项我想删除它们这就是我创建哈希图的原因有什么办法可以将 hashmap 插入
使用 gnu make 正确构建 git 子模块

我目前尝试编写一个 Makefile 来正确构建一个包含 git 子模块的项目该子模块有自己的一组 makefile 并一次生成多个目标包括一些库该 Makefile 应具有以下属性即使使用并行构建也不要重建两次子模块当子模块代
Linq：Entity Framework Core 中的 Join 与 Include/ThenInlude

我正在开发一个使用 SQL Server 和 EF Core v3 的项目我有 4 个彼此相关的表这是我的表格方案我针对这些表编写了 2 个 Linq 查询其中一个使用像这样的连接 var result from emailTemp
我的 self.view 尺寸错误

我的视图尺寸错误我仅运行横向但视图报告纵向尺寸视图宽度 768 000000 高度 1024 000000 有任何想法如何解决这个问题吗我尝试过使用自动旋转 BOOL shouldAutorotateToInterfaceOrien
Outlook 代码中的 Excel FilePicker 对话框在后台打开

我开发了一个 Outlook 宏让用户选择并打开 Excel 文件文件对话框在后台打开对于用户来说 Outlook 应用程序似乎被卡住了而它只是在等待用户在所有其他窗口后面的文件选择器对话框中选择文件 Dim SigFolder2
无论如何，HTML 表格都不适合整个屏幕

基本上我的网站上有一个表格无法 100 适应浏览器屏幕的宽度即使我将宽度更改为 110 它也只是与右侧重叠但左侧仍然有一个边距空间表格的外部空间我希望表格从左到右完全压在浏览器屏幕上根本没有空间或边框我该怎么做呢我已经尝试了
响应式 CSS 背景图片

我有一个网站 g floors eu 我想让背景在CSS中我为内容定义了一个背景图像也具有响应能力不幸的是除了我能想到的一件事之外我真的不知道如何做到这一点但这是一个解决方法创建多个图像然后使用 css 屏幕大小来更改图像
应用程序域和线程

引用MSDN的一段话 http msdn microsoft com en us library 6kac2kdh aspx http msdn microsoft com en us library 6kac2kdh aspx 一个或多个
如何确定类型参数的方差？

灵感来自Scala 中协变和逆变的现实示例 https stackoverflow com questions 5277526 real world examples of co and contravariance in scala我认为
JsonDocument 获取 JSON 字符串

我需要一个从 JsonDocument 获取 JSON 字符串的示例我可以通过以下方式获取属性RootElement GetProperty ItemName 然后打电话 GetString 但找不到一种方法来获取 JSON 字符串形式的
如何控制台登录 couchdb

首先我真的很喜欢使用 CouchDB 可以做的所有事情我来自很多前端 JavaScript 我使用 console log 来执行大量调试和测试任务我想知道如何 console log 或者 CouchDB 中可能有什么更好的调试方法
为 Blazor UI 应用程序实施防伪验证

我们的应用程序是使用 Blazor Server 和与 Azure API 通信的 razor 页面构建的我想知道对于 Blazor UI 我们是否应该实现防伪造 CSRF XSRF 如果可以我可以获得一些如何实现的信息吗我观察到为
Spring Webflux 抛出“block()/blockFirst()/blockLast() 正在阻塞，线程reactor-http-nio-2 不支持”

我在 Spring Webflux 中执行阻塞操作时遇到一个小问题我检索文章文档列表并从文章文档列表中我想更新另一个对象当我执行下面的代码时有时它会起作用有时会抛出 block blockFirst blockLast 正在阻塞
为什么 objdump 不显示 .bss、.shstratab、.symtab 和 .strtab 部分？

我目前正在用 C 语言实现我自己的 objdump 实现 For my s选项我必须显示 ELF 文件各部分的完整内容我做得很好但我显示的部分比真正的 objdump 更多事实上它并没有输出 bss shstrtab symta
从私钥中提取公钥

我尝试通过以下方式以编程方式完成步骤 2 1 openssl genrsa out signing pem 2048 2 openssl rsa in signing pem outform PEM pubout out signing p
如何让“wc -l”只打印没有文件名的行数？

wc l file txt 输出行数和文件名我只需要数字本身而不是文件名我可以做这个 wc l file txt awk print 1 但也许有更好的方法试试这个方法 wc l lt file txt
使用 Coffeescript 类和 RequireJS（或 Curljs 或类似）作为客户端浏览器库的示例

我们想要使用 Coffeescript 开发一个浏览器仅限客户端库特别是除了纯函数之外我们还倾向于大量使用 Coffeescript 的类功能该库将相对较大因此我们希望开始使用定义良好的模块模式但不会达到我们希望每个咖啡
使用 (imagemagick) `mogrify` 将 webp 文件转换为动画 gif 时如何避免丢失？

使用此代码mogrify format gif webp我在另一个论坛找到的https superuser com questions 1506337 batch convert webp files to gif files offlin
测试类内的扩展函数

如果我们想测试某个类型的扩展函数我们可以创建该类型的实例调用该函数并检查返回值但是测试类内部定义的扩展函数又如何呢 abstract class AbstractClass
区分缺失值类型（无响应与跳过模式）

对于可能没有仔细阅读密码本的数据集用户您会建议如何区分缺失值类型在这个玩具示例中 q2只询问那些回答是的人q1 这意味着有一个缺失值q2因为该人没有回应而缺失并且有两个缺失值q2因为没有提出问题所以丢失了 library tidy

区分缺失值类型（无响应与跳过模式）

区分缺失值类型（无响应与跳过模式） 的相关文章

随机推荐

热门标签

区分缺失值类型（无响应与跳过模式）的相关文章