data.table 重复后截断行

2023-12-27

假设我有以下数据集:

library(data.table)
dt <- data.table(x = c(1, 2, 4, 5, 2, 3, 4))

> dt
   x
1: 1
2: 2
3: 4
4: 5
5: 2
6: 3
7: 4

我想在第 4 行之后截止,因为那时出现了第一个重复项(数字 2)。

预期输出:

   x
1: 1
2: 2
3: 4
4: 5

不用说,我不是在寻找dt[1:4, ,][]因为真实的数据集更加“复杂”。

我尝试过shift(), .I,但没有成功。 一个想法是:dt[x %in% dt$x[1:(.I - 1)], .SD, ][].


也许我们可以使用duplicated

dt[seq_len(which(duplicated(x))[1]-1)]
#   x
#1: 1
#2: 2
#3: 4
#4: 5

或者按照@lmo 的建议

dt[seq_len(which.max(duplicated(dt))-1)]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

data.table 重复后截断行 的相关文章

  • R 绘制一些 unicode 字符,但不绘制其他字符

    我们的系统管理员刚刚将我们的操作系统升级到 SLES12SP1 我重新安装了 Rv3 2 3 并尝试绘图 我用cairo pdf并尝试绘制 x 标签为的图 u0298即太阳能符号 但它不起作用 标签只是空白 例如 cairo pdf Rpl
  • R ggplot结合颜色图例和不同因子长度的填充

    我正在使用不完整因子设计的数据绘制图表 由于设计的原因 我的颜色手动比例和填充手动比例的长度不同 因此 我得到了两个传说 我怎样才能删除其中之一或者更好地将它们组合起来 我看过这些问题 合并单独的大小并填充 ggplot 中的图例 http
  • igraph - 将文本添加到社区图

    使用下面的代码 我可以在 igraph 提供的 空手道俱乐部 示例中生成社区图 请参见第一张图片 library igraph karate lt make graph Zachary wc lt cluster walktrap kara
  • 按组渐进串联列[重复]

    这个问题在这里已经有答案了 假设我有这个输入 ID date 1 date 2 str 1 1 2010 07 04 2008 01 20 A 2 2 2015 07 01 2011 08 31 C 3 3 2015 03 06 2013
  • 没有适用于“filter_”的方法应用于类“c('double', 'numeric')”的对象

    使用下面的代码 我尝试过滤我的数据集 以便仅选择 CG less14 0 和 CG High14 0 的数据集 我收到错误 没有适用于 filter 的方法应用于 c double numeric 类的对象 我的代码有问题吗 married
  • 在子目录中构建共享库

    我正在尝试构建一个使用一些 C 代码的 R 包 我有一个编译为可执行文件的 C 库 可以从命令行调用 有一个与之关联的 Makefile 我正在尝试获取信息here http cran r project org doc manuals R
  • 为什么 NaN^0 == 1

    受到早期高尔夫代码的提示 为什么会 gt NaN 0 1 1 这非常有道理NA 0为 1 因为NA缺少数据 并且any数字提高到 0 将得到 1 包括 Inf and Inf 然而NaN应该代表非数字 那么为什么会这样呢 当帮助页面出现时
  • 数据框中的动物园滞后差异

    我想将滞后差异的结果放回到我的数据框中 这意味着我将拥有针对不同滞后的领先 NA 我在用 new df lag1 lt diff new df Close lag 1 differences 1 arithmetic TRUE na pad
  • 如何在 R 中的 SQLDF 中连接字符串

    我正在寻找一个在 R 中的 SQLDF 中连接两个字符串的函数 其工作原理类似于 Paste 但找不到任何函数 这样做的原因是我想在连接两个数据框时连接两列 我有时想使用 sqldf 而不是使用 merge 进行连接 然后使用 Paste
  • 如何在其他脚本中包含(源)R 脚本

    我创建了一个实用程序 R 脚本 util R 我想从项目中的其他脚本中使用它 确保此脚本定义的函数可在我的其他脚本中运行的正确方法是什么 我正在寻找类似的东西require函数 仅在尚未加载的情况下加载包 我不想打电话source util
  • R:根据排名重新排列数据框的列

    我有以下数据框 df1 Type CA AR OR alpha 2 3 5 beta 1 5 6 gamma 6 2 8 delta 8 1 9 Total 17 11 28 我想根据 总计 行重新排序该数据框 使其按降序排列 生成的数据框
  • R:读取多个Excel文件,提取第一个工作表名称,并创建新列

    我有多个 Excel 文件 并且它们具有唯一的工作表名称 在我的情况下是文件创建日期 我批量阅读它们 需要将工作表名称分配给新列 id 中的每个文件 我知道如何制作数字 id 或 id 文件名 但找不到将工作表名称获取为 id 的方法 li
  • int NA 的内部表示[重复]

    这个问题在这里已经有答案了 这是关于 R 内部结构的问题 R 中如何表示整数 NA 值 与浮点不同 没有神奇的位序列来表示 NaN Create big array newer versions of R won t allocate me
  • Stata的xtnbreg有R函数吗?

    一直在使用 Stata 在复制中运行负二项式回归 不确定 Stata 是如何做到这一点的 但想知道是否有 R 函数 包可以做同样的事情 R 会让我更好地了解它是如何工作的 因为我可以看到代码 看看glm nb函数在MASS包裹 如果您对 幕
  • 升级到 Mac OSX 10.10 后,从 R 控制台运行系统命令无法找到已安装的程序

    我一直有一些奇怪的问题 https stackoverflow com questions 26477679 texi2dvi error when compiling tex files using rstudio and knitr s
  • 在 R 中将数组转换为矩阵

    我有一个数组 其中包括名为 comp 的项目 是 否 的两个熟练度变量 theta0 theta1 这需要转换为一个矩阵 有什么方法可以转换像底部那样的矩阵吗 我的数组如下所示 gt priCPT i6 comp Yes theta1 th
  • tmap 仅在 sf 几何列中绘制第一个多边形

    tmap 仅绘制 sf 几何列中的第一个多边形 但是plot 得到他们全部 一些 github 问题tmap https github com mtennekes tmap issues 360 and leaflet https gith
  • 使Sweave + RweaveHTML将所有图形放在指定文件夹中

    作为细化这个问题 https stackoverflow com questions 4674567 how to make sweave copy generated graphics to a subfolder 有谁知道如何告诉 Sw
  • update() 具有局部协变量的函数内的模型

    我需要从函数内部更新回归模型 理想情况下 该函数应该适用于任何类型的模型 lm glm multinom clm 更准确地说 我需要添加函数内部定义的一个或多个协变量 这是一个例子 MyUpdate lt function model ra
  • 将多个ggplot2图保存为列表中的R对象并在网格中重新显示

    我想在大型 for 循环期间将多个绘图 使用 ggplot2 保存到列表中 然后随后在网格中显示图像 使用 grid arrange 我已经尝试了两种解决方案 1 将其存储在列表中 如下所示 pltlist qplot lt qplot 然

随机推荐

  • Kivy:如何使小部件表现得像溢出:隐藏

    我想在 Kivy 中创建 GridLayout 其中包含许多矩形按钮以及一些不同大小的自定义图像 为此 我想要缩放图像 我想要执行此操作的方式如下所示 然后裁剪 隐藏溢出小部件边框的部分 调整大小效果很好 但我不知道如何隐藏 裁剪矩形之外的
  • 条件/三元运算符如何工作? C++ [重复]

    这个问题在这里已经有答案了 以下代码的直译是什么 另外 请解释它的含义以及使用该运算符的不同方法 int i 1 j 2 cout lt lt i gt j i j lt lt is greater lt lt endl 有关三元运算符的任
  • 机器的.net核心cpu使用率

    我最近从 c 迁移到 net core 在 C 中 我使用以下方法获取 CPU 使用情况 PerformanceCounter cpuCounter PerformanceCounter ramCounter cpuCounter new
  • 全新安装后,Stenciljs 从 @types/babel__traverse 包抛出构建错误

    So for context I have just installed stencil And was wanting to mess around with it I m using latest version from the do
  • Quill JS - 检查表单提交上的文本是否更改

    我正在使用 Quill 富文本 需要找到一种方法来检查页面提交表单时文本是否已更改 我对使用 Quill 还很陌生 并且一直在查看事件here https quilljs com docs api events html 每次文本更改时 显
  • 循环遍历数组的数组

    我有一个数组的数组 比如图形 如何迭代所有数组 var parentArray 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 26 27 28 它只是一个示例数
  • Django:部署服务器上未显示静态文件

    我无法让我的网站正确加载静态文件 关于静态文件的settings py文件如下 Static files STATIC URL static STATIC ROOT var www str8red com static STATICFILE
  • 有资质的生产者消费者

    我是 clojure 的新手 正在尝试了解如何正确使用其并发功能 因此任何批评 建议都会受到赞赏 所以我尝试在 clojure 中编写一个小型测试程序 其工作原理如下 有 5 个生产者和 2 个消费者 生产者等待一段随机时间 然后将一个数字
  • 克服空数组的 ValueError

    In 这次讨论 https stackoverflow com questions 22853118 twiny in matplotlib changes the y axis scale 22856984 noredirect 1 co
  • 如何删除cllocation的缓存?

    我正在开发一个 iPhone 应用程序 它是一个位置感知应用程序 目前 除了先前位置的缓存之外 该应用程序运行良好 第一次启动应用程序位置管理器会获取当前位置 然后根据当前位置显示附近的事物 但从下一个开始 它会使用之前获取的位置 直到我重
  • 在 php 中解析 mIRC 颜色

    我想转换mirc 颜色代码 http www mirc com help colors html通过 php 转换为 html 这是示例 http searchirc com search php F exact T chan N 6246
  • Javascript异步执行:回调会中断正在运行的代码吗?

    我只是希望有人能为我澄清这一点 如果我使用 Node js 在服务器端运行以下代码 不在浏览器中 console log a db get select from table1 function result console log b c
  • 如何在WebBrowser控件中注入CSS?

    据我所知 有一种方法可以将 javascript 注入到 DOM 中 下面是使用 javascript 注入的示例代码webbrowser控制 HtmlElement head webBrowser1 Document GetElement
  • 在 HTML/JavaScript 扩展中使用 x-webkit-speech

    我正在尝试使用新的x webkit speech简单 HTML JavaScript 扩展中的函数谷歌浏览器 http en wikipedia org wiki Google Chrome 然而 我已经尝试并尝试查看一堆示例 但无法让它成
  • Number 上的 QueryDSL Like 操作

    我必须用通配符搜索数字字段 相应的 JQPL 查询将如下所示 SELECT e From Entity e where e personNumber LIKE numberPattern numberPattern 是一个像这样的字符串 1
  • Git-svn 可以在大型分支存储库上使用吗?

    我正在尝试使用 Git 作为 SVN 存储库的前端 以便能够使用 Git 的优秀功能 例如简单的分支 存储等 问题是 SVN 存储库非常大 8 000 转 并且包含大量分支和标签 旧的和新的 这是一个接近标准的布局 配置包含获取 分支和标签
  • AngularJS 返回 Object 对象

    我有一个返回数组的后端 REST 服务 我正在尝试在我的其中之一中显示此 REST 服务返回的值
  • 改进快速排序

    如果可能 我如何改进以下快速排序 性能方面 有什么建议么 void main quick a 0 n 1 void quick int a int lower int upper int loc if lower
  • 是否可以在 C# 中使用非类型化泛型列表?

    我正在尝试以下设计但没有成功 abstract class Foo
  • data.table 重复后截断行

    假设我有以下数据集 library data table dt lt data table x c 1 2 4 5 2 3 4 gt dt x 1 1 2 2 3 4 4 5 5 2 6 3 7 4 我想在第 4 行之后截止 因为那时出现了