R - 查找行中的所有重复项并替换

2024-03-29

我有一个大数据框，正在尝试查找一行中的重复元素，然后用空字符串替换所有重复值：

  X1 X2 X3 X4 X5
x  1  2  3  3  4
y  1  1  2  3  4

应该成为

  X1 X2 X3 X4 X5
x  1  2        4
y        2  3  4

我可以在单个向量上执行此操作：

x <- c(1,2,3,3,4)
x[x %in% x[duplicated(x) == TRUE]] = ""
x

[1] "1" "2" ""  ""  "4"

但我无法让它适用于数据框中的所有行。我已尝试以下操作但无法使其工作：

apply(df,2,function(x) x[x %in% x[duplicated(x) == TRUE]] = "")

有任何想法吗？

像这样的事情，

找出数据框中重复的索引并将其替换为空格。

df[which(t(apply(df,1,function(x) 
     duplicated(x) | duplicated(x, fromLast = T))), arr.ind = T)] <- ""

df
#   X1 X2 X3 X4 X5
#x  1  2        4
#y        2  3  4

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

duplicates

apply

R - 查找行中的所有重复项并替换的相关文章

根据第二列求和并有条件地计数

我在试图解决这个看似简单的问题时感到沮丧我有一个像这样的数据集 df structure list Year c 2015L 2015L 2015L 2015L 2015L 2015L 2015L 2015L 2015L 2015L 20
删除特定值之前和之后的特定值的运行

我有一个包含几列的数据框基于 activity 列我想删除特定值 pt 的整个连续运行但前提是它们紧邻 outside 运行之前或之后发生在下面的简化数据中有一次运行的 activity 为 outside 并且前后都有大块 pt
R 中的县等值区域地图的阿拉斯加和夏威夷格式不正确

我正在尝试将美国的 Choropleth 地图格式化为特定颜色不幸的是当使用scale fill brewer改变颜色只有 48 个州这样做夏威夷和阿拉斯加没有是否可以知道我是否也可以将着色应用到夏威夷和阿拉斯加 library
如何在 Ubuntu 9.10 上安装 R 软件包 rgl？ [复制]

这个问题在这里已经有答案了可能的重复安装 rgl 时出现问题 https stackoverflow com questions 7473067 problem installing rgl 我正在尝试在 Ubuntu 9 10 上安装
在Shiny的conditionalPanel中添加多个条件

我想知道是否可以添加多个条件conditionalPanel闪亮的这是一个例子 conditionalPanel condition input SELECT 1 Slider sliderInput D FLAG Parameter X
如何使用 getSymbols 下载一组价格并按照请求的顺序存储它们？

我用 Quantmod 下载历史价格getSymbols函数用于多个代码并使用以下代码将它们转换为列表或多变量 XTS library quantmod myenv lt new env tickers lt c GSPC AAPL MS
将命名参数传递给调用非 mutate 函数的函数

我正在尝试做一些非常类似的事情here https community rstudio com t passing named list to mutate and probably other dplyr verbs 2553 11 本质
带插入符的主成分分析

我正在使用 Caret 的 PCI 预处理 multinomFit lt train LoanStatus train method multinom std TRUE family binomial metric ROC thresh 0
R: Knit 给出 SQL-chunk 错误

我想编织 R markdown 的输出其中包括几个 SQL 块但是如果我开始编织就会收到错误消息 Line 65 Error in eval expr envir enclos object pp dataset not found
如何在 R 中创建 for 循环来进行这种特殊的计算

我无法弄清楚这种显然简单的操作给定这两个不同的数据框df A nrow 10 ncol 3 和df B n行 3 n列 3 df A df B col1 col2 col3 col1 col2 col3 1 2 4 1 4 5 3 5
R Notebook 预览中的奇怪字符

当我预览 R Notebook 时 HTML 输出包含奇怪的字符该块代码和输出在 HTML 中呈现为我应该如何解决这个问题会话信息 R版本3 6 0 2019 04 26 平台 x86 64 w64 mingw32 x64 64位
在数据帧中的几行上提取具有匹配模式的 id

这是我正在处理的数据框的示例 id string 1 no 1 yes 1 yes 2 no 2 yes 3 yes 3 yes 3 no 我想提取id为此最后两行包含字符串 yes 对于列string 所以结果是 id string 1
有没有办法“source()”并在错误后继续？

我有一个大型 R 脚本其中包含 142 个小部分如果某一部分因错误而失败我希望脚本继续而不是停止这些部分不一定相互依赖但有些部分确实相互依赖如果中间的一个失败了也没关系我不想在这个脚本中加入try 来电而且我不想将文件分成许
拆分数字 yyyymmdd 列

我有一个包含 DATE 列的数据框我将其引用为 NM DATA DATE 它是一个 yyyymmdd 形式的数字我知道有一百个线程我尝试了所有能找到的解决方案但它们对我不起作用即将重新加载 RStudio NM DATA DAT
将模拟泊松分布添加到 ggplot

我做了泊松回归然后可视化模型 library ggplot2 year lt 1990 2010 count lt c 29 8 13 3 20 14 18 15 10 19 17 18 24 47 52 24 25 24 31 56 4
R：在组上应用函数

我希望将函数应用于数据框然后将该函数的结果存储在数据框中的新列中这是我的数据框 tradeData 的示例 Login AL Diff a 1 0 a 1 0 a 1 0 a 0 1 a 0 0 a 0 0 a 0 0 a 1 1 a
ggplot for 循环输出所有相同的图表

我编写了一个 for 循环它遍历数据帧的列并使用 ggplot 为每列生成一个图表问题是输出的图表都是相同的它们都是最后一列的图表我使用的代码是 library gridExtra library ggplot2 test1 lt
rbind 命名向量到不同长度的矩阵

我正在尝试将命名向量绑定到矩阵上命名向量的长度与矩阵不同 gt m lt matrix data c 1 2 3 nrow 1 ncol 3 dimnames list c c column 1 column 2 column 3 gt
ggplot2：从纵横比中排除图例

I use ggplot2 and knitr发布带有右侧图例的散点图图例包含在纵横比中因此破坏了绘图的方形如图所示默认主题 https github com hadley ggplot2 wiki themes 当图例文本变得比
读取 CSV 文件单列的更快方法

我正在尝试阅读一个列CSV文件至R尽快我希望将标准方法将列放入 RAM 所需的时间减少 10 倍我的动机是什么我有两个文件一个叫Main csv这是 300000 行和 500 列其中一个称为Second csv即 300000

随机推荐

在主干视图中访问el外部的点击事件

我如何访问外部的点击事件el scope 我拥有的 HTML div class right btn div div div
如何在 GCP 中执行数据沿袭？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案当我们使用GCP云存储实现数据湖并使用Dataproc Dataflow等云服务进行数据处理时我们如何在GCP中生成数据沿袭报告
为什么 ERD 中不允许使用特定基数？

在有关实体关系图的每个教程中我都读到不允许为关系指定固定基数只有对 ERD 的非正式评论才能澄清飞行员的数量exactly 2 因此例如航班和飞行员之间的关系其中每个航班恰好有 2 名飞行员必须表示为
将 ValidationRules 绑定在一行中？

我已经编写了几个单行绑定如果可能并且仍然是人类可读的我希望保持这种方式有什么办法可以重写这个
Fork-Join 相关： join() vs get() vs invoke()

我有必要使用吗join with fork 或者我也可以使用其中之一join get invoke 我检查了API http docs oracle com javase 7 docs api java util concurrent Fo
AutoMapper 具有来自 IDataReader 的列表数据

using IDataReader dr DatabaseContext ExecuteReader command if dr Read AutoMapper Mapper CreateMap
在 PHP 中通过用户标签将一个页面链接到另一个页面

这是我的海报代码在一页中 a href img href a 现在我想将其链接到另一个页面假设我单击说以获取 href mydomain com 1 它将重定向到另一个页面并播放该文件该页面的代码是 if playlistitem l
RESTKit - 将大量对象发布到服务器

如何使用 RESTKit 将对象数组发布到我的服务器我有一个名为的自定义对象Contact它有一些属性例如name phone等等我想发送这些的数组Contact向服务器发送对象我知道的方法是postObject path para
在 swift 4 中自动关闭视图控制器

假设我有 3 个ViewControllers标记为 A B 和 C 现在 A 是rootViewController窗口的形状它以模态方式呈现 B 当点击 B 中的按钮时应该立即以模态方式呈现 C 并自动关闭 B 我怎样才能做到这一点
使用 pyqtgraph 有效地绘制大型数据集

我正在尝试使用 pyqtgraph 生成散点图和直方图矩阵每个散点图的输入 x 和 y 值是长度大于 1 000 000 的 numpy 数组生成这些图需要很长时间 2x2 绘图矩阵 gt 1 分钟 matplotlib 实际上生成相
ModuleNotFoundError：使用tensorflow 2.6时没有名为“keras”的模块

我创建了一个新的 conda 环境 conda create name tf tensorflow 2 6 并尝试编译 import tensorflow as tf model tf keras models Sequential 导致
如何设置组合框宽度以适合最大的项目

我希望我的ComboBox必须适应其width到最长的String Item我的清单中代码示例 ComboBox model Banana Apple ThisIsTheLongestWordThatIHave Coconut 知道如何做
Android 中写入锁定文件

我将一些数据存储在 SD 卡上的文件上并从不同的线程读取相同的文件为了避免读取和写入的竞争条件我想在两种情况下锁定文件读取和写入我心里有两个选择 1 我可以使用同步来做到这一点 2 我可以使用文件锁来做到这一点我应该选择哪一个
批量插入 mysql - 我可以使用忽略子句吗？有限制吗？批量插入的记录？

我有一堆数据想要插入我决定对 mysql 使用批量插入插入朋友请求者好友值 value1 value2 value2 value1 value3 value4 value4 value3 我想了解以下信息 1 我可以使用忽略吗例
Json允许错误

这个错误在我们的 MVC 应用程序中随机出现有时做同样的事情不会有时却会有谁知道这是否与任何可以简单解决的问题有关或者这是否是你们很多人都见过的常见现象 System InvalidOperationException This r
注册 COM 互操作

当选中构建属性中的 Register for COM Interop 选项时出现错误无法注册程序集访问被拒绝取消选中该选项时项目构建时不会出现任何错误但我的要求是注册 COM 对象因为我需要在 VB 中使用相同的对象谁能帮我
与 WPF 和数据绑定一起使用的简单 CRUD

我是用于 Windows 应用程序开发的 WPF 新手只是想先将其介绍一下我正在使用 Visual Studio 2010 和 NET Framework 4 0 我正在开发一个相当简单的管理工具为了简单起见假设我正在处理员工数据
全屏嵌入 Bing 地图

有人知道是否可以全屏嵌入 bing 地图吗这样地图就可以始终填充背景并简单地在顶部覆盖一些元素我似乎无法用 100 iframe 实现这一点而且 bing 的帮助也没有那么有帮助谢谢如果我没理解错的话你想要实现让地图填满整个屏幕
C11 结构继承与匿名结构

I saw this way https stackoverflow com a 14523823 108802实施某种struct匿名继承struct在C11中想尝试一下这是我所拥有的 struct struct a int aa s
R - 查找行中的所有重复项并替换

我有一个大数据框正在尝试查找一行中的重复元素然后用空字符串替换所有重复值 X1 X2 X3 X4 X5 x 1 2 3 3 4 y 1 1 2 3 4 应该成为 X1 X2 X3 X4 X5 x 1 2 4 y 2 3 4 我可以在单个

R - 查找行中的所有重复项并替换

R - 查找行中的所有重复项并替换 的相关文章

随机推荐

热门标签

R - 查找行中的所有重复项并替换的相关文章