R计算数据帧中相似行的出现次数

2024-01-08

我有以下格式的数据，称为 DF （这只是一个简化的示例）：

eval.num, eval.count, fitness, fitness.mean, green.h.0, green.v.0, offset.0 random
1         1           1500     1500          100        120        40       232342
2         2           1000     1250          100        120        40       11843
3         3           1250     1250          100        120        40       981340234
4         4           1000     1187.5        100        120        40       4363453
5         1           2000     2000          200        100        40       345902
6         1           3000     3000          150        90         10       943
7         1           2000     2000          90         90         100      9304358
8         2           1800     1900          90         90         100      284333

但是，eval.count 列不正确，我需要修复它。它应该仅通过查看前面的行来报告具有相同值（green.h.0、green.v.0 和 offset.0）的行数。

上面的示例使用了预期值，但假设它们不正确。

如何添加一个新列（例如“计数”）来计算具有指定变量相同值的所有先前行？

我已经获得了有关类似问题的帮助，即仅选择指定列具有相同值的所有行，所以我想我could只需围绕它编写一个循环，但对我来说似乎效率低下。

好的，我们首先在只有一列的简单情况下进行操作。

> data <- rep(sample(1000, 5),
              sample(5, 5))
> head(data)
[1] 435 435 435 278 278 278

然后你可以使用 rle 来找出连续的序列：

> sequence(rle(data)$lengths)
[1] 1 2 3 1 2 3 4 5 1 2 3 4 1 2 1

或者完全：

> head(cbind(data, sequence(rle(data)$lengths)))
[1,]  435 1
[2,]  435 2
[3,]  435 3
[4,]  278 1
[5,]  278 2
[6,]  278 3

对于多列的情况，可能有多种应用此解决方案的方法。最简单的可能就是paste您关心的列一起形成一个向量。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

count

duplicates

DataFrame

R计算数据帧中相似行的出现次数的相关文章

使用 dtypes read_csv 但列中没有值[重复]

这个问题在这里已经有答案了我使用以下代码来读取 csv 通过指定每个列的类型 clean pdf type pd read csv table updated csv usecols col names dtype col types 但
在 R 的 for 循环中创建动态命名对象并分配动态值

我正在尝试创建一套动态命名的新对象例如 temp2015 使用 for 循环并存储动态值具体来说其他对象的名称例如 Y2015 和 for 循环中使用的值例如 2015 在动态命名的新对象中我不确定为什么下面的代码不起作用 Y
R - 重塑 - 熔化错误

我正在尝试融化数据框但出现了这个奇怪的错误有什么想法吗 str zx7 data frame 519 obs of 5 variables calday new Date format 2011 01 03 2011 01 04 201
从 data.frame 在 ggplot 图例中添加信息

我想在图例中添加信息哪个传感器具有该值这是我的代码 z lt data frame a c sensor 1 sensor 2 sensor 3 sensor 4 sensor 5 sensor 6 sensor 7 sensor 8
R Shinydashboard 自定义 CSS 到 valueBox

我一直在尝试将 valueBox 的颜色更改为自定义颜色超出 validColors 中可用的颜色但一直无法这样做我知道有一种方法可以使用标签来包含自定义 CSS 但是我无法将它们放在正确的位置 ui lt dashboardPage
使用选定因子水平的值向 ggplot-barchart 添加水平线

在这个情节中 df lt data frame factor as factor c rep A 3 rep B 3 Treatment c rep c A B C 2 values runif 6 0 1 ggplot df aes Tr
如何根据 ggplot2 中的汇总数据创建堆积条形图

我正在尝试使用 ggplot 2 创建堆积条形图我的宽格式数据如下所示每个单元格中的数字是响应的频率 activity yes no dontknow Social events 27 3 3 Academic skills works
Django 独特的不工作

我在从查询中过滤掉重复项时遇到问题我正在使用 Django 1 4 和 Postgres 8 4 13 我在我的模型对象上使用这个查询它是一个 jquery 自动完成 term request GET get term field re
当将遗传算法与 lme4 一起使用时，glmulti 无限期运行

我在 R 中使用 glmulti 进行模型平均我的模型中有大约 10 个变量使得详尽的筛选不切实际因此我需要使用遗传算法 GA 调用 method g 我需要包含随机效应因此我使用 glmulti 作为 lme4 的包装器此处提供
R：如何将字符/数字转为1，NA转为0？

有没有一种简单的方法可以将列的字符数字变为 1 将 NA 变为 0 这里有一些示例数据我想将其应用于 3 4 structure list Item Code c 176L 187L 191L 201L 217L 220L Item x
使用数据帧的 R 中的 EWMA 波动性

我正在尝试从一系列股票每日收益中获取 EWMA 波动性这些收益来自一个名为base retorno diario Data IBOV ABEV3 AEDU3 ALLL3 BBAS3 BBDC3 BBDC4 1 2000 01 04 0 0
扩展数据框以使其具有与原始行中两列的范围一样多的行[重复]

这个问题在这里已经有答案了我有一个数据框如下 structure list symbol c u n v i a start c 9L 6L 10L 8L 7L end c 14L 15L 12L 13L 11L Names c symb
如何动态地将 sliderInput 添加到闪亮的应用程序中？

使用闪亮我上传一个 csv 文件并根据列名称我需要向 ui 添加滑块 sidebarPanel fileInput file1 Upload CSV File to Create a Model accept c text csv t
R 改变构面的顺序

我正在尝试将方面的顺序从 BA SLG 更改为 SLG BA 我发现了与此类似的问题但我认为我的解决方案可能不起作用因为我已经在Excel中汇总了数据因此我的数据框可能会有所不同无论如何我尝试实现这个但无济于事 df2 lt f
获取包含矩阵行内最大值的列名称，该矩阵在数组内包含单独的最大值

例如给出 dim1 lt c P PO C T dim2 lt c LL RR R Y dim3 lt c Jerry1 Jerry2 Jerry3 Q lt array 1 48 c 4 4 3 dimnames list dim1 di
将整个包传递给雪簇

我正在尝试并行化使用snow parLapply 一些依赖于包即除snow 调用函数中引用的对象parLapply必须使用显式传递给集群clusterExport 有没有办法将整个包传递到集群而不必显式命名每个函数包括用户函数调用的
是否有weighted.median()函数？

我正在寻找类似形式的东西weighted mean 我通过搜索找到了一些解决方案这些解决方案写出了整个函数但希望有一些更用户友好的解决方案以下软件包都有计算加权中位数的函数 aroma light isotone limma cwhm
安装 2.15 后 ggplot2 中的 alpha 通道不起作用

更新到 R 2 15 后 ggplot 中的 alpha 通道似乎不再起作用 plot rnorm 100 rnorm 100 bg cc000055 pch 21 工作得很好但是 qplot rnorm 100 rnorm 100 col
使用data.table进行聚合

经过 SO 用户的多次建议后我终于尝试将我的代码转换为使用data table library data table DT lt data table plate paste0 plate rep 1 2 each 5 id rep c
如何在R中分离两个图？

每当我运行这段代码时第一个图就会简单地覆盖前一个图 R中有没有办法分开得到两个图 plot pc title main abc xlab xx ylab yy plot pcs title main sdf xlab sdf ylab x

随机推荐

如何在客户端使用 JavaScript 检查 webRTC 数据通道兼容性？

WebRTC 数据通道仅在 Firefox nightly 中工作如何在客户端查看代码如下 if Firefox s d d test navigator userAgent test for Firefox x x or Firefo
让 fields_for 与 has_many 关系一起工作

我在生成嵌套模型表单时遇到问题这是我的模型 class Workout lt ActiveRecord Base has many scores has many users through gt scores accepts neste
Fiddler 使网页浏览速度非常慢

虽然 Fiddler 对我来说工作得很好但它似乎确实使浏览速度变得非常慢在 Fiddler 运行的情况下打开这个网站只需要大约十秒钟如果我关闭它它几乎会立即加载我想知道这是否就是 Fiddler 的工作方式或者是否有一个选项或设
我如何克隆/复制某种 iOS 的 UIView？

下面的屏幕截图有助于解释我想要做什么这背后的想法是我有一个UIView 与各种不同的UI里面的元素例如假设我有一个UIView 里面有一个UILabel 现在我想复制UIView 里面有标签但不知何故之后我可能需要对标签进行更改例
Vue.JS 倒计时不起作用

我有一个 vue 应用程序但倒计时效果不好其实我不知道为什么 View parent timer 我看到了很好的价值视图数据 data function return timer 3 这是我的倒计时功能 countdown funct
检查 windows/page/document/iframe 是否有焦点

我已经问过类似的问题但我需要它来解决更具体的情况所以我决定提出一个新问题以免混淆检查窗口是否有焦点 https stackoverflow com questions 17389280 check if window has foc
确保一次仅运行一个 setTimeout（处于活动状态）？

递归setTimeout函数 getRandomProducts 被调用onload在html body标签中如此不断地迭代正在调用函数 setCategoryTreeonclick来自导航栏嵌套 ul 中的链接然后该函数将变量 m
图像处理中的联合直方图和边缘直方图是什么？

什么是图像处理中的联合直方图和边缘直方图它们如何工作以及如何构建联合直方图和边缘直方图如果可能的话提供简单的示例例如如果我有 10 个维度的特征空间并且想要构建一个直方图每个维度量化为 20 个值如何计算联合直方图和边缘直方
gem 已安装，但“rails”命令不起作用

当我运行任何 Rails 命令时例如rails s我收到以下错误在任何来源中均找不到 diff lcs 1 1 2 尝试跑步bundle install 不过我已经安装了 diff lcs 捆绑显示 diff lcs opt loca
为什么使用 SpringJUnit4ClassRunner/MySQL/Spring/Hibernate 时事务不回滚

我正在进行单元测试我希望提交给 MySQL 数据库的所有数据都将被回滚但事实并非如此尽管我的日志显示正在发生回滚但数据正在提交我已经为此奋斗了几天所以我的设置发生了很大变化这是我当前的设置登录DAOTest java Run
C++ 中紧密耦合的并行类层次结构

对于上下文我正在研究 C 人工生命系统 http github com taliesinb floatworld 涉及由循环神经网络控制的代理但细节并不重要我需要将代理的大脑和身体的两个对象层次结构分开我想要各种不同的大脑和
抛出新的异常最佳实践[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 以下是好的做法吗如果不是应该做什
如何使用 .NET / GDI+ 禁用子采样？

我正在尝试使用 Bitmap 类保存 JPEG 图像我注意到无论我指定的质量级别如何锐利的边缘总是模糊的我发现这是由于一个或多个通道的二次采样造成的如何在保存图像时禁用子采样我目前正在使用这段代码 EncoderParameter
在“世界风”中单击时禁用地球仪移动

我正在尝试在世界风中单击鼠标禁用地球仪的移动我期望能够做到 void disableGlobeDrag WorldWindowGLCanvas ww ww addMouseMotionListener new MyMouseMotio
获取 S&P 500 股票代码列表

所以我用这个在 Python for Finance 上它总是给我错误 1 line 22 in
在 Windows 上的 Emacs 内从 py-shell 运行 Matplotlib 或 enthought.mayavi.mlab

我可以从常规 cmd shell 正常运行以下代码 import matplotlib pyplot as plt fig plt figure plt show 它启动一个 Matplotlib 窗口然而使用 shell 或 py s
在 web.config 的 appSettings 中使用“&”

我正在尝试将网站地址存储在 web config 文件的 appSettings 部分中 URL 末尾有两个查询字符串参数因此我需要使用符号当我在代码文件中硬编码 URL 时如果我替换它就可以工作 amp 在配置文件中这些字母是红
django 查询集上的复杂注释

我遇到一个问题无法从复杂的环境中获取所需的所有信息 annotate 调用我的 django 视图这是我的模型 RECORD STATUS 0 Hidden 1 Unhidden 2 Deleted class Activity mod
模拟网络连接不良

我正在开发一个可以通过 LAN 访问互联网的嵌入式设备我现在正处于测试阶段我想测试当互联网连接较差时设备的性能目前该设备通过集线器连接到路由器我用集线器通过 Wireshark 监控数据包降低设备的互联网速度以模拟可能发生的场景
R计算数据帧中相似行的出现次数

我有以下格式的数据称为 DF 这只是一个简化的示例 eval num eval count fitness fitness mean green h 0 green v 0 offset 0 random 1 1 1500 1500 10

R计算数据帧中相似行的出现次数

R计算数据帧中相似行的出现次数 的相关文章

随机推荐

热门标签

R计算数据帧中相似行的出现次数的相关文章