查找哪一行重复 data.frame 中的哪一行

2024-01-23

我有一个像这样的数据框：

data.frame(matrix(c(11:13, 21:23, 11:13, 11:13, 31:33, 41:43, 31:33), byrow = TRUE, ncol = 3))

现在我想知道哪一行是哪一行的重复项，返回具有重复行号最低的索引向量。如果一行不是前一行的重复项，则它应该获取下一个可用索引。在此示例中，输出应为：

c(1, 2, 1, 1, 3, 4, 3)

我可以通过循环所有行对来实现这一点，但必须有一种有效的方法来做到这一点。

很遗憾，duplicated只显示哪些行是重复的，但不显示它们精确重复的哪一行。有什么功能可以帮助这里吗？

另一种选择是使用grouping在较新版本的 R 中可以使用该函数。

获取相同值彼此相邻放置的行的顺序：

grs = do.call(grouping, dat)

并操纵结果的“属性”以获得想要的结果：

ends = attr(grs, "ends")
rep(seq_along(ends), c(ends[1], diff(ends)))[order(grs)]
#[1] 1 2 1 1 3 4 3

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

查找哪一行重复 data.frame 中的哪一行的相关文章

使用 R 中的 tidyverse 重新调整因子和重新排序因子

我想使用这些功能重新调平 and 重新排序在我的数据框中我了解重新调整级别的工作原理但我不明白为什么我在 data frame 中看不到级别的变化例如假设我有鸢尾花数据集 library tidyverse head iris g
无法在 Powershell 中运行 R.exe

我经常发现在命令行 Windows 上运行 R 更有用然而当我在 Powershell 中尝试时我往往会遇到问题但这可以通过第一次运行轻松克服cmd然后就可以了这是我执行此操作时遇到的错误R CMD BATCH Invoke Hi
在 R Shiny 中显示/隐藏整个框元素

我目前正在尝试找到一种方法来隐藏显示 R Shiny 中的整个 box 元素以及里面的所有内容我想创建一个可能的按钮它允许用户展开特定框然后使用相同甚至不同的按钮隐藏它我不想使用条件面板因为我的应用程序非常大并且会产生一些
如何将 mcmc.list 转换为 bugs 对象？

我正在使用rjagsR 库功能coda samples产生一个mcmc list 例如来自example coda samples library rjags data LINE LINE recompile LINE out lt c
Python Pandas 根据另一列的总计从另一个数据帧中选择值

我下面有一个 DataFrame 但我需要根据取消和订单列从每个代码中选择行假设代码 xxx 的阶数为 6 1 5 1 阶数为 11 我需要一种算法可以选择满足总共 11 行的行阶数为 6 5 如果没有行匹配则选择最接近的 id 并
使用 dplyr 的 select 引用变量名[重复]

这个问题在这里已经有答案了通常我会想要选择变量的子集其中该子集是函数的结果在这个简单的例子中我首先获取与宽度特征相关的所有变量名称 library dplyr library magrittr data iris width var
将 csv 文件上传到shinyApps.io

我的应用程序在本地运行良好并且我能够成功地将应用程序部署到shinyapps io 服务器但是当我尝试使用shinyapps URL 在浏览器中加载应用程序时收到以下错误消息错误对象数据不是成立我认为这是因为 data 变量从
替换rmarkdown/knitr/pdf中字幕的自动编号

我正在使用 Rmarkdown 生成 PDF 文档我想在其中手动定义图号下面是一个块的示例 r chunk26 fig cap Fig 5 3 My figure caption plot 1 1 我使用特殊的编号来遵循文档的章节问题
当在另一行中找到元素逗号分隔时合并行

您好我有一个数据框例如 species family Events groups 1 SP1 A 10 22 G1 2 SP1 B 7 G2 3 SP1 C D 4 5 6 1 3 G3 G4 G5 G6 4 SP2 A 22 10 G
DT数据表中的列对齐

In my shiny我正在使用的应用程序datatable函数来自DT库构建一个表格并希望将列居中对齐我可以用formatStyle column textAlign center 但它只影响列体而不影响标题我们必须设置columnD
dplyr：同一公式中全年每日值的总和以及特定每日值的总和

Using df数据框 date lt rep as Date seq as Date 2003 01 01 as Date 2005 12 31 by 1 format Y m d 9 site lt c rep Site 1 3 109
在 Travis 上使用 devtools 安装 R 包时遇到问题

Travis CI 构建于drakeR包手册 https github com ropenscilabs drake manual 最近开始失败 https travis ci org ropenscilabs drake manual b
在r中拆分数据并将所有拆分文件保存在csv中

我有一个名为 data 的数据集 Model Garage City Honda C Chicago Maruti B Boston Porsche A New York Honda B Chicago Honda C New York 它
计算不包括当前值的平均值

我有下表 a b avg 1 1 7 3 2 1 0 3 3 1 2 3 4 2 1 2 5 2 3 2 其中 a 和 b 是数据 avg 计算按 a 分组的 b 的平均值现在我想计算按 a 分组的 b 的平均值 avg2 不包括当前值
“未找到 JAVA 路径。请检查 JAVA 是否已安装。”初始化 RSelenium 时出错

我正在尝试启动一个 RSelenium 会话到 webscrape 但是当运行此代码时 driver lt rsDriver browser c chrome chromever 76 0 3809 126 port 4444L 我收到此
ggplot2 - 在绘图顶部添加辅助 y 轴

对于出版物我需要向现有绘图添加第二个 y 轴我遇到了一种方法来做到这一点 https rpubs com kohske dual axis in ggplot2 https rpubs com kohske dual axis in g
零膨胀泊松分布：无法估计参数，错误代码为 100

以下是我正在研究的一种数据集 data lt c 0 1 0 11 2 0 3 0 0 2 1 3 1 0 1 0 0 0 2 3 0 0 0 8 1 1 1 0 1 1 2 7 0 0 0 5 2 3 6 1 1 5 2 9 0 0 1
dplyr +“meta”-columns：当列包含要使用的其他列的名称而不是数据时

我想知道以下问题在 dplyr 中是否有一个优雅的解决方案要提供一个简单的可重现示例请考虑以下 data frame df lt data frame a 1 5 b 2 6 c 3 7 ref c a a b b c stringsA
R：中断 for 循环

你能确认下一个break是否取消了内部for循环吗 for out in 1 n old id velho lt old table df id out for in in 1 n id novo lt new table df ID in
为什么在 data.frame 中预先指定类型会比较慢？

我预先分配了一个大 data frame 以便稍后填写我通常这样做NA是这样的 n lt 1e6 a lt data frame c1 1 n c2 NA c3 NA 我想知道如果我预先指定数据类型是否会让事情变得更快所以我测试了 f1

随机推荐

如何在 Angular4 中获取 FormControl 的值

我对 Angular4 有一些经验但我只是继承了一段使用 FormControls 的代码我不知道如何使用它们我正在设置一个注释文本区域如果 isRegulatoryAuditRequired 的值等于 false 则需要该注释文本
jquery - 如何显示隐藏的div

我的页面中嵌入了一个谷歌地图其可见性设置为隐藏我想使用按钮在页面上显示地图应该使用jquery来完成我的代码不工作 div style height 350px border 1px solid 979797 div 任何人都可以
在 C++ Microsoft Visual Studio 2010 中调试器多个环境变量

在设置环境变量时我在 Visual Studio 2010 Professional C 调试器中遇到了一个非常简单的问题描述于 http msdn microsoft com en en library kcw4dzyf aspx h
是否可以使用eclipse仅构建一次java项目并共享？

是否有可能实际构建一个包含java代码的maven项目构建一次并且二进制文件可以共享问题我尝试构建的项目大约需要 3 4 小时并且需要高互联网带宽我正在尝试检查在其他几台机器中重新使用这个构建项目的可能性我之前曾处理过涉及 ma
如何在 using 语句中使用对象初始值设定项？

有没有什么方法可以重构此代码以便不必使用临时变量而仍然使用与对象初始值设定项关联的语法糖 FrmSomeForm someTempForm new FrmSomeForm SomePropA A SomePropB B SomeProp
Go 闭包变量作用域

我正在阅读 CreateSpace Go 2012 编程简介在第 86 页我发现了这个邪恶的魔法 func makeEvenGenerator func uint i uint 0 return func ret uint ret i i
TypeScript - 将动态属性名称传递给子级

我正在开发一个带有嵌套路由的路由库我试图定义一个推断父路径的子处理函数原因是我有另一种类型可以从字符串推断动态路径参数例如 users id to id string 因此我希望能够将推断的路径参数从父路由传递到每个子路由处理函数
使用 Jasmine 在 Angular 5 中进行单元测试模型绑定

我正在尝试编写一个单元测试来测试从组件方法调用返回的 JSON 数据是否成功绑定到打字稿模型我的模型如下所示 export interface IPlayerAccount playerId number name string phon
如何从 TFS 源代码管理中排除特定文件

我们有多个配置文件 app DEV config app TEST config 等和一个将正确的配置文件复制到 app config 的预构建事件显然配置特定文件位于源代码管理中但目前 App Config 也是如此但不应该如此
从后台工作程序中的循环更新文本框

我知道这个问题有人问过至少从我到目前为止在这里发现的情况来看但我无法真正理解它已经尝试过 msdn 的示例但仍然没有成功这是我想要做的我有一个连接到 TLL 标尺的 USB 计数器我想在循环中不断读取值并将读数写入文本框而不阻
如何从方法返回对对象的 const 引用？ [复制]

这个问题在这里已经有答案了 public Item getItem ulong itemId Item item items itemId return item 现在的问题是被调用者getItem必须能够检索以下信息item持有但不修
多处理代码重复运行

所以我希望使用 python 多处理模块创建一个进程我希望它成为更大脚本的一部分我还想从中得到很多其他东西但现在我会满足于此我从以下位置复制了最基本的代码多处理文档 https docs python org 3 6 library
在 ExtJS 4 中具有相同视图并多次存储的最佳实践

我想在 ExtJS 应用程序中同时拥有不同商店的同一视图的不同实例目前我在视口中创建了同一视图 Ext view View 的多个实例但是在每个视图中都有不同的商店的最佳实践是什么我发现的每个示例都在使用控制器的stores Con
MapKit (Swift 4) Xcode 9.2 - “无法从角 4 插入合法归属”

我正在做一个处理 MapKit 的项目我的问题是当我运行该应用程序时我收到无法从第 4 角插入法律归属的消息错误我可以采取什么解决方案来解决这个问题 error https i stack imgur com jw7rk pn
使用 Tf Estimator 时如何获得可训练变量计数？

我使用 tf 估计器框架创建了 CNN 分类器模型但是我无法访问模型中定义的变量 tf trainable variables 始终返回 0 如何使用 tf 估计器访问变量特别是我如何获得参数总数的计数将所有变量的维度相加谢谢
自动使用相对于函数调用位置的 __LINE__ 和 __FILE__

我有一个函数log text 这一切所做的就是写 text到数据库我想包括 LINE and FILE 但不想像我现在那样每次都将其作为参数包含在内 function log text file null line null write
无法使用面向 x64 的 VC++/VS2010 进行编译：LNK1158：无法运行 cvtres.exe

作为一名 C 开发人员我最近决定尝试编写一些 C 程序主要是因为我发现了一个我想使用的有趣的 C API 几天前我写了一个非常简单的程序在 x64 目标平台上编译它运行它一切都很顺利然而昨天我更改了一些代码尝试编译它但链接
ruby - 捆绑包安装/更新太慢

我刚刚在 virtualbox 中运行的虚拟 ubuntu 12 04 32 位上安装了 RVM Ruby Rails 等现在我遇到了我的第一个 Rails 项目的问题bundle install or bundle update需要很长
连接到不存在的 mongodb 服务器不会抛出异常

我正在尝试使用 Java 的 MongoDB 驱动程序所以我只是创建了一个简单的应用程序来连接到 MongoDB 服务器并选择一个数据库所以我创建了一个实例MongoClient并选择了一个数据库 try MongoClient cl
查找哪一行重复 data.frame 中的哪一行

我有一个像这样的数据框 data frame matrix c 11 13 21 23 11 13 11 13 31 33 41 43 31 33 byrow TRUE ncol 3 现在我想知道哪一行是哪一行的重复项返回具有重复行号最低

查找哪一行重复 data.frame 中的哪一行

查找哪一行重复 data.frame 中的哪一行 的相关文章

随机推荐

热门标签

查找哪一行重复 data.frame 中的哪一行的相关文章