使用 dplyr 按行用以前的值填充缺失值

2024-05-04

我正在使用 R 中的一个数据框，该数据框跨行有一些缺失值。数据框是下一个（dput添加到最后）：

df
  id V1 V2 V3 V4
1 01  1  1  1 NA
2 02  2  1 NA NA
3 03  3  1 NA NA
4 04  4  1  2 NA

每一行都是不同的id。正如您所看到的，这些行缺少值。我想知道如何才能以这种风格完成数据框由于我的实际数据非常大，因此无需使用 reshape to long 或枢纽:

df
  id V1 V2 V3 V4
1 01  1  1  1  1
2 02  2  1  1  1
3 03  3  1  1  1
4 04  4  1  2  2

我试图使用fill from tidyr但在行级别我遇到了问题。我看过一些帖子，其中它与dplyr功能across但我找不到它。我尝试过使用group_by(id) and rowwise但我还没有成功。也只有以以下开头的变量/列V应填充以前的值。

接下来是数据：

#Data
df <- structure(list(id = c("01", "02", "03", "04"), V1 = c(1, 2, 3, 
4), V2 = c(1, 1, 1, 1), V3 = c(1, NA, NA, 2), V4 = c(NA, NA, 
NA, NA)), class = "data.frame", row.names = c(NA, -4L))

非常感谢您抽出时间。

一种解决方案可以使用na.locf包中的函数zoo结合purrr::pmap行操作中的函数。na.locf取最近的非NA评估并替换所有即将到来的NA值由此。只是作为一个提醒c(...)在两种解决方案中都捕获了所有值V1:V4在每次迭代的每一行中。不过我排除了id两者中的列，因为它不参与我们的计算。

library(zoo)
library(purrr)

df %>%
  mutate(pmap_df(., ~ na.locf(c(...)[-1])))

  id V1 V2 V3 V4
1 01  1  1  1  1
2 02  2  1  1  1
3 03  3  1  1  1
4 04  4  1  2  2

或者我们可以使用coalesce函数来自dplyr。我们可以替换每一个NA每行中最后一个非值NAvalue，我们之前做的事情na.locf。然而这个解决方案有点冗长：

df %>%
  mutate(pmap_df(., ~ {x <- c(...)[!is.na(c(...))]; 
  coalesce(c(...), x[length(x)])}))

  id V1 V2 V3 V4
1 01  1  1  1  1
2 02  2  1  1  1
3 03  3  1  1  1
4 04  4  1  2  2

或者你也可以使用这个：

library(purrr)

df %>%
  mutate(across(!id, ~ replace(., is.na(.), invoke(coalesce, rev(df[-1])))))

  id V1 V2 V3 V4
1 01  1  1  1  1
2 02  2  1  1  1
3 03  3  1  1  1
4 04  4  1  2  2

可以忽略该警告消息。它实际上是因为我们有 6 个而产生的NA值而是应用的结果dplyr::coalesce每个向量上有 1 个元素，从而用 4 个元素代替 6 个槽。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 dplyr 按行用以前的值填充缺失值的相关文章

ggplot 中的条形图，每组有不同数量的条形图

我的数据集如下所示 DSET lt data frame cbind c rep V1 3 rep V2 3 V3 c rep c X1 X2 X3 2 X1 c rep 1 7 names DSET lt c A B C DSET 3 l
使用 Rgraphviz 中的 pos 参数来固定节点位置

基于这个问题当弧与另一弧重叠时自动弯曲 https stackoverflow com questions 45721802 automatically curving an arc when it is overlapping with
Python - Pandas - 将特定函数应用于给定级别 - 多索引数据帧

我有一个多索引 DataFrame 并且我希望仅对分配给我的级别之一的向量应用一些计算使用下面的代码 import pandas as pd import datetime ticker date US datetime date tod
data.table 相当于 dplyr::filter_at

考虑数据 library data table library magrittr vec1 lt c Iron Copper vec2 lt c Defective Passed Error set seed 123 a1 lt sampl
最新的 Windows 10 更新后 R 将无法运行

我已经更新了我的 Windows 但 R 无法运行因此 R studio 也无法运行当我运行 R GUI 时它只是冻结并且没有响应我已允许防火墙豁免铬我正在使用 Windows Insider 计划并且刚刚更新到 Windows
写入抓取数据的 csv 文件时如何拆分项目名称

我有兴趣使用 R 从网上抓取的数据创建 csv 或类似的 Excel 兼容文件到目前为止我通过执行以下操作来存储数据 require textreadr spiegel lt read html http www spiegel de
R：从 Github 安装包时出现编码问题

我正在尝试安装dcStockR https github com yutannihilation dcStockR来自 Github 的包这是一个htmlwidgets http www htmlwidgets org 周围的包装纸dc
R：交换两个变量而不使用第三个变量

我有两个变量即 a lt 1 b lt 2 我想交换他们的价值观是否有任何内置的 R 函数能够执行该操作或者是否有其他优雅的方式而不使用第三个临时变量 Note 如果可能的话适用于字符串或其他数据类型有一个通用的解决方案或技
在 Shiny 应用程序中更改 bsModal 的背景

我正在开发一个 Shiny 应用程序我需要确保最终用户不会意外关闭 bsModal 因为它上面有一些操作按钮我做了一些研究并了解到我需要覆盖背景和键盘参数但即使我看到了一些建议我也不知道这到底需要放在我的代码中的哪里我不精通 Ja
数据框中按行相关

我正在尝试计算大型数据帧的所有行之间的相关性到目前为止已经提出了一个有效的简单 for 循环例如 name lt c a b c d col1 lt c 43 78 43 84 37 92 31 72 col2 lt c 43 80 4
正则表达式在 R 中同时多次包含字母/特殊字符时删除单词

我想删除那些单词中字母特殊字符的数量同时出现两次以上的单词例如输入就像 Google in theee lland of whhhat c c and e 输出应该是 Google in lland of c c and x lt G
如何从数据框中按降序获取前n家公司

我正在尝试从数据框中获取排名前 n 的公司下面是我的代码 data Forbes2000 package HSAUR sort Forbes2000 profits decreasing TRUE 现在我想从这个排序向量中获取前 50 个
为什么在 R 中绘图时，hovertemplate 无法正确显示某些数据点

mydat2 lt data frame subject c math english chemistry score c 80 50 65 class c A B A count c 50 60 70 library plotly plo
按边距（“全部”）值列对 Pandas 数据透视表进行排序

我试图根据 pandas 数据透视表中的行总和对最后一列边距 aggrfunc 进行降序排序我知道我在这里错过了一些简单的东西但我无法弄清楚数据框数据透视表 WIDGETS DATE 2 1 16 2 2 16 2 3 16 Al
有没有一种明智的方法可以在 R 中执行诸如文档字符串之类的操作？

这不仅仅是一个编码风格问题如果您了解 python 我认为 Ruby 也有类似的东西您可以在函数中拥有文档字符串这样您就可以通过发出 help 命令轻松获取该字符串例如 def something t None Do somethi
包什么时候需要为它自己的对象使用 :::

考虑这个 R 包有两个函数一个是导出函数另一个是内部函数 hello R export hello lt function internalFunctions hello internal 你好内部 R hello internal
如何在复杂的皂膜GAM中设置更平滑的边界条件？

我正在对南太平洋岛屿泻湖中宽吻海豚的分布进行建模我想使用肥皂膜平滑器来模拟海豚在二维表面经度 x 纬度上存在的概率考虑到陆地边界显然海豚不能在陆地上行走我想知道如何将我的研究区域陆地和近海水域的边界固定为等于零的条件因为我
当我添加形状时，分组哑铃图变得不稳定

我有以下数据显示白人与黑人在各个领域的一致性百分比我想创建一个分组哑铃图其中国家值和州值彼此相邻以便于比较 Domain c A B C D E F G A B C D E F G A B C D E F G A B C D E F
如何获取pandas中groupby对象中的组数？

我想知道有多少个独特的组需要执行计算给定一个名为 groupby 的对象dfgroup 我们如何找到组的数量简单快速 Pandaic ngroups 较新版本的 groupby API pandas gt 0 23 提供了此未记录的
使用 alpha 通道叠加两个 ggplot2 stat_密度2d 图

我想叠加两个ggplot2使用 alpha 通道进行绘图结果图像显示两个数据集这是我的测试数据 data read table text P1 1 0 4 nP2 0 0 2 nP3 2 1 8 nP4 2 2 6 nP5 0 5 2

随机推荐

如何选中/取消选中 ExpandableListView 内的 CheckedTextView（子项）项？

我的设计我创建了一个自定义适配器 SignalsExpandableListAdapter 与我的 ExpandableListView 的 CheckedTextView public class SignalsExpandableLi
尽管 CRC 错误，仍强制 gzip 解压缩

我认为有办法做到这一点但我不确定如何做基本上我正在编写一个压缩程序当我尝试解压缩压缩数据时该程序导致了 crc 错误通常这意味着解压缩器实际上将我的数据识别为正确的格式并将其解压缩但是当它将结果与 CRC 指示的预期长度进行
Android：如何按下软键盘上方的按钮

我有一个保存按钮我想将其与软键盘一起按下因此当用户单击布局中的 EditText 时按钮必须保持在键盘上方现在该按钮隐藏在键盘下方你怎么做到这一点提前致谢您需要将键盘的输入模式设置为adjustResize 您可以通过将
屏幕截图中低分辨率文本的 OCR

我正在编写一个 OCR 应用程序来从屏幕截图图像中读取字符目前我只关注数字我的方法部分基于这篇博文 http blog damiles com 2008 11 basic ocr in opencv http blog damiles
错误：从列表创建 Spark 数据帧时 TimestampType 无法接受对象

我正在尝试从以下列表创建一个数据框 data 1 abc 2020 08 20 10 00 00 I 1 abc 2020 08 20 10 01 00 U 1 abc 2020 08 21 10 02 00 U 2 pqr 2020 08
如何访问混合对象（stdClass）和数组构造中的特定值？

我的变量如下所示 var dump content object stdClass 5 1 errors gt array 1 0 gt object stdClass 6 2 message gt string 24 Invalid or
Material UI Icons npm 安装问题：无法解析依赖树

问题已解决问题末尾的解决方案我试图安装材质 UI 图标 https mui com components material icons 在我使用 npm 的 Netflix Clone React js 项目中但出现以下错误 PS D
IBM Worklight - $("#pagePort").load() 在 Windows Phone 8 中不起作用

我在用着 pagePort load 用于在我的应用程序的页面之间导航并且它在 Android 模拟器和设备中完美运行但是当我尝试从 Windows Phone 8 模拟器运行我的应用程序时它无法更改其页面为了使changePa
再次对存储库和持久性一无所知

这就是我要做的我有一个通用的存储库类Repository
std::mutex 和 std::shared_mutex 之间的区别

我遇到了一个std shared mutex in C 17 到底是什么std shared mutex以及它有何不同std mutex 如中所述文档 http en cppreference com w cpp thread shared
内存不足异常

我有一个非常占用内存的应用程序它在一些大数组中保存了大量的数据我最近注意到偶尔出现 OutOfMemoryException 这些 OutOfMemoryExceptions 早在我的应用程序 ASP Net 用完可用的 800mb 内
从 XML 文档生成嵌套列表

在 python 中工作我的目标是解析我制作的 XML 文档并创建一个嵌套的列表列表以便稍后访问它们并解析提要 XML 文档类似于以下代码片段
使用 python 从 hive 读取数据时的性能问题

我在 hive 中有一个表其中包含 351 837 110 MB 大小记录我正在使用 python 读取该表并写入 sql server 在此过程中从 hive 读取数据到 pandas dataframe 需要很长时间当我加载整
在 Haskell 中提升 State monad 中的值

我正在 Haskell 中编写一个数独生成器求解器作为学习练习 My solve函数接受一个UArray但返回一个State Int UArray 这样它也可以返回解决问题时发现的最大难度级别到目前为止这是我的功能仍处于实验性的早期
CSS/Javascript 将单词与特定字符对齐

我如何使用 CSS Javascript 将 html 中的单词与该单词中的任意字符对齐更改对齐字符的样式例如使其粗体以与其他字符形成对比如本例中所示对齐和粗体 k e t 和 f stack overflow stack ove
将supportedRuntime嵌入到exe文件中

我需要将仅包含supportedRuntime 设置的app config 文件嵌入到我的exe 文件中我尝试执行构建操作嵌入资源但它现在没有从配置文件中读取值并且它不起作用这是我的配置文件
使用自签名证书签署 PowerShell 脚本（并且不使用 makecert.exe）

我正在尝试签署一份 ps1使用自签名证书用例是我自己在私人开发站上编写的脚本因此无需使用或付费真正的 CA 但是无论我阅读多少关于证书生成和数字签名主题的指南我似乎都无法使其正常工作这是我到目前为止所取得的成就 Create
在iOS中启动应用程序时如何复制sqlite数据库？

每次启动应用程序时我想将带有最新更新的 sqlite 数据库从数据库位置复制到我的 iOS 应用程序有什么办法可以做到吗您可以将以下方法添加到您的应用程序委托中 void copyDatabaseIfNeeded Using NSFi
使用 spring data mongodb 存储库添加可选查询参数

我想使用 spring data mongodb 添加可选查询参数控制器代码 RestController private final ActionService actionService RequestMapping value ac
使用 dplyr 按行用以前的值填充缺失值

我正在使用 R 中的一个数据框该数据框跨行有一些缺失值数据框是下一个 dput添加到最后 df id V1 V2 V3 V4 1 01 1 1 1 NA 2 02 2 1 NA NA 3 03 3 1 NA NA 4 04 4 1 2

使用 dplyr 按行用以前的值填充缺失值

使用 dplyr 按行用以前的值填充缺失值 的相关文章

随机推荐

热门标签

使用 dplyr 按行用以前的值填充缺失值的相关文章