R计算数据帧中相似行的出现次数

2024-01-08

我有以下格式的数据,称为 DF (这只是一个简化的示例):

eval.num, eval.count, fitness, fitness.mean, green.h.0, green.v.0, offset.0 random
1         1           1500     1500          100        120        40       232342
2         2           1000     1250          100        120        40       11843
3         3           1250     1250          100        120        40       981340234
4         4           1000     1187.5        100        120        40       4363453
5         1           2000     2000          200        100        40       345902
6         1           3000     3000          150        90         10       943
7         1           2000     2000          90         90         100      9304358
8         2           1800     1900          90         90         100      284333

但是,eval.count 列不正确,我需要修复它。它应该仅通过查看前面的行来报告具有相同值(green.h.0、green.v.0 和 offset.0)的行数。

上面的示例使用了预期值,但假设它们不正确。

如何添加一个新列(例如“计数”)来计算具有指定变量相同值的所有先前行?

我已经获得了有关类似问题的帮助,即仅选择指定列具有相同值的所有行,所以我想我could只需围绕它编写一个循环,但对我来说似乎效率低下。


好的,我们首先在只有一列的简单情况下进行操作。

> data <- rep(sample(1000, 5),
              sample(5, 5))
> head(data)
[1] 435 435 435 278 278 278

然后你可以使用 rle 来找出连续的序列:

> sequence(rle(data)$lengths)
[1] 1 2 3 1 2 3 4 5 1 2 3 4 1 2 1

或者完全:

> head(cbind(data, sequence(rle(data)$lengths)))
[1,]  435 1
[2,]  435 2
[3,]  435 3
[4,]  278 1
[5,]  278 2
[6,]  278 3

对于多列的情况,可能有多种应用此解决方案的方法。最简单的可能就是paste您关心的列一起形成一个向量。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R计算数据帧中相似行的出现次数 的相关文章

随机推荐

  • 如何在客户端使用 JavaScript 检查 webRTC 数据通道兼容性?

    WebRTC 数据通道仅在 Firefox nightly 中工作 如何在客户端查看 代码如下 if Firefox s d d test navigator userAgent test for Firefox x x or Firefo
  • 让 fields_for 与 has_many 关系一起工作

    我在生成嵌套模型表单时遇到问题 这是我的模型 class Workout lt ActiveRecord Base has many scores has many users through gt scores accepts neste
  • Fiddler 使网页浏览速度非常慢

    虽然 Fiddler 对我来说工作得很好 但它似乎确实使浏览速度变得非常慢 在 Fiddler 运行的情况下打开这个网站只需要大约十秒钟 如果我关闭它 它几乎会立即加载 我想知道这是否就是 Fiddler 的工作方式 或者是否有一个选项或设
  • 我如何克隆/复制某种 iOS 的 UIView?

    下面的屏幕截图有助于解释我想要做什么 这背后的想法是我有一个UIView 与各种不同的UI里面的元素 例如 假设我有一个UIView 里面有一个UILabel 现在我想复制UIView 里面有标签 但不知何故之后我可能需要对标签进行更改 例
  • Vue.JS 倒计时不起作用

    我有一个 vue 应用程序 但倒计时效果不好 其实我不知道为什么 View parent timer 我看到了很好的价值 视图数据 data function return timer 3 这是我的倒计时功能 countdown funct
  • 检查 windows/page/document/iframe 是否有焦点

    我已经问过类似的问题 但我需要它来解决更具体的情况 所以我决定提出一个新问题 以免混淆 检查窗口是否有焦点 https stackoverflow com questions 17389280 check if window has foc
  • 确保一次仅运行一个 setTimeout(处于活动状态)?

    递归setTimeout函数 getRandomProducts 被调用onload在html body标签中 如此不断地迭代 正在调用函数 setCategoryTreeonclick来自导航栏嵌套 ul 中的链接 然后 该函数将变量 m
  • 图像处理中的联合直方图和边缘直方图是什么?

    什么是图像处理中的联合直方图和边缘直方图 它们如何工作以及如何构建联合直方图和边缘直方图 如果可能的话 提供简单的示例 例如 如果我有 10 个维度的特征空间 并且想要构建一个直方图 每个维度量化为 20 个值 如何计算联合直方图和边缘直方
  • gem 已安装,但“rails”命令不起作用

    当我运行任何 Rails 命令时 例如rails s我收到以下错误 在任何来源中均找不到 diff lcs 1 1 2 尝试跑步bundle install 不过 我已经安装了 diff lcs 捆绑显示 diff lcs opt loca
  • 为什么使用 SpringJUnit4ClassRunner/MySQL/Spring/Hibernate 时事务不回滚

    我正在进行单元测试 我希望提交给 MySQL 数据库的所有数据都将被回滚 但事实并非如此 尽管我的日志显示正在发生回滚 但数据正在提交 我已经为此奋斗了几天 所以我的设置发生了很大变化 这是我当前的设置 登录DAOTest java Run
  • C++ 中紧密耦合的并行类层次结构

    对于上下文 我正在研究 C 人工生命系统 http github com taliesinb floatworld 涉及由循环神经网络控制的代理 但细节并不重要 我需要将代理的 大脑 和 身体 的两个对象层次结构分开 我想要各种不同的大脑和
  • 抛出新的异常最佳实践[关闭]

    很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 help reopen questions 以下是好的做法吗 如果不是 应该做什
  • 如何使用 .NET / GDI+ 禁用子采样?

    我正在尝试使用 Bitmap 类保存 JPEG 图像 我注意到无论我指定的质量级别如何 锐利的边缘总是模糊的 我发现这是由于一个或多个通道的二次采样造成的 如何在保存图像时禁用子采样 我目前正在使用这段代码 EncoderParameter
  • 在“世界风”中单击时禁用地球仪移动

    我正在尝试在 世界风 中单击鼠标禁用地球仪的移动 我期望能够做到 void disableGlobeDrag WorldWindowGLCanvas ww ww addMouseMotionListener new MyMouseMotio
  • 获取 S&P 500 股票代码列表

    所以我用这个在 Python for Finance 上 它总是给我错误 1 line 22 in
  • 在 Windows 上的 Emacs 内从 py-shell 运行 Matplotlib 或 enthought.mayavi.mlab

    我可以从常规 cmd shell 正常运行以下代码 import matplotlib pyplot as plt fig plt figure plt show 它启动一个 Matplotlib 窗口 然而 使用 shell 或 py s
  • 在 web.config 的 appSettings 中使用“&”

    我正在尝试将网站地址存储在 web config 文件的 appSettings 部分中 URL 末尾有两个查询字符串参数 因此我需要使用 符号 当我在代码文件中硬编码 URL 时 如果我替换它就可以工作 amp 在配置文件中 这些字母是红
  • django 查询集上的复杂注释

    我遇到一个问题 无法从复杂的环境中获取所需的所有信息 annotate 调用我的 django 视图 这是我的模型 RECORD STATUS 0 Hidden 1 Unhidden 2 Deleted class Activity mod
  • 模拟网络连接不良

    我正在开发一个可以通过 LAN 访问互联网的嵌入式设备 我现在正处于测试阶段 我想测试当互联网连接较差时设备的性能 目前 该设备通过集线器连接到路由器 我用集线器通过 Wireshark 监控数据包 降低设备的互联网速度以模拟可能发生的场景
  • R计算数据帧中相似行的出现次数

    我有以下格式的数据 称为 DF 这只是一个简化的示例 eval num eval count fitness fitness mean green h 0 green v 0 offset 0 random 1 1 1500 1500 10