R 合并具有相似值的行

2024-04-23

我有一个数据框，行值首先从小到大排序。我计算相邻行之间的行值差异，组合具有相似差异（例如，小于 1）的行，并返回组合行的平均值。我可以使用 for 循环检查每一行的差异，但这似乎是一种非常低效的方法。还有更好的想法吗？谢谢。

library(dplyr)
DF <- data.frame(ID=letters[1:12],
                 Values=c(1, 2.2, 3, 5, 6.2, 6.8, 7, 8.5, 10, 12.2, 13, 14))
DF <- DF %>%
   mutate(Diff=c(0, diff(Values)))

DF 的预期输出为

ID        Values
a         1.0
b/c       2.6  # (2.2+3.0)/2
d         5.0
e/f/g     6.67 # (6.2+6.8+7.0)/3
h         8.5
i         10.0
j/k       12.6 # (12.2+13.0)/2
i         14.0

这是一个选项data.table

library(data.table)
setDT(DF)[, .(ID = toString(ID), Values = round(mean(Values), 2)),
          by = .(Diff = cumsum(c(TRUE, diff(Values)>=1)))][, -1, with = FALSE]
#        ID Values
#1:       a   1.00
#2:    b, c   2.60
#3:       d   5.00
#4: e, f, g   6.67
#5:       h   8.50
#6:       i  10.00
#7:    j, k  12.60
#8:       l  14.00

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

dplyr

diff

clusteranalysis

R 合并具有相似值的行的相关文章

如何在 dplyr 中使用切片来保留 R 中具有 NA 值的行

我有以下数据集我想知道每个组的最小单词如果没有最小单词它是 NA 我仍然想显示它 df data frame key c A A B B C word c 1 2 3 5 NA df gt group by key gt slice
PCA 图中带有名称的工具提示

我想用 ggplotly 生成交互式绘图工具提示应该显示变量的名称 interactive lt ggplotly pca dynamicTicks T tooltip c x y label list pca 是 PCA 的可视化 su
Pandas - 按每个可能的键组合聚合

我有一个 DataFrame Pandas 我想通过 A B C 和 D 列的组合尽可能按数据进行分组假设它具有以下形式 A B C D E F G 0 Y X Y Z 1 2 7 1 Y X Y Z 3 4 8 2 X Y U V 1
自动化 RStudio 处理 RMarkdown？

我有一个 RMarkdown 文件用于生成漂亮的 HTML 报告问题是我希望能够自动化它以便它可以在无头服务器上运行因此不会有人启动 Rstudio 并按下 knithtml 按钮而且 Rstudio 似乎正在做很多额外的魔法
计算分组序列中两个值之间的差异

这是这篇文章的后续问题循环遍历 R 中的数据帧并测量两个值之间的时间差 https stackoverflow com questions 44885856 loop through dataframe in r and measure
Python Pandas groupby、排名，然后根据自定义排名分配值

问题设置大熊猫数据框 df pd DataFrame Group A A A A A A A A A Subgroup Group 1 Group 1 Group 1 Group 1 Group 1 Group 1 Group 2 Gro
如何在 R 中执行随机森林/交叉验证

我无法找到对我尝试生成的回归随机森林模型执行交叉验证的方法因此我有一个数据集其中包含 1664 个解释变量不同的化学性质和一个响应变量保留时间我正在尝试生成一个回归随机森林模型以便能够预测给定保留时间的物质的化学性质 ID
使用 R 迭代读取、操作多个 Excel 文件并将它们附加到一个数据帧中

在一个目录下我有多个具有相似格式的excel文件您可以从以下位置下载示例文件 here https www dropbox com s ho3visres55kpoy test zip dl 0 我需要循环文件和read excel
如何在 conda 中静音或抑制 gfortran （或 clang？）后端？

我一直致力于构建一个非常特殊的 conda 环境专为python and R与串扰使用rpy2 我想出的方法可以安装正确的R包如下 install main environment sh now date T echo Start Tim
ggmap 错误：GeomRasterAnn 是使用不兼容版本的 ggproto 构建的

我正在使用 ggmap 并收到以下错误 Error GeomRasterAnn was built with an incompatible version of ggproto Please reinstall the package t
使用 ggplot_build 和 ggplot_gtable 后使用 ggsave 保存图形

我正在通过更改 ggplot build 生成的数据来修改使用 ggplot 构建的图表原因类似于包括 geom boxplot 中填充美学中使用的缺失因子水平的空间 https stackoverflow com questions 1
使用 gbuffer 在 R 中缓冲（地理）空间点

我正在尝试缓冲数据集中半径为 100 公里的点我正在使用该功能gBuffer从包装中rgeos 这是我到目前为止所拥有的 head sampledf postalcode lat lon city province 1 A0A0A0 47
如何处理重叠的因子水平？（例如，生成表格和图表时）

我面临一个数据集的问题重叠因素水平我想按因素级别生成时间线条形图和统计数据但是我希望因子水平是模棱两可的这意味着属于多个级别的观察结果应该在图中出现多次这是我的数据结构的示例 head lt c ID YEAR BRAZIL G
在 R 中使用 gamlss::lms 选择百分位数曲线

我正在使用 gamlss 包中的示例代码来绘制百分位数曲线 library gamlss data abdom lms y x data abdom n cyc 30 它正在绘制自己的一组百分位数曲线如何选择只绘制第 10 50 和 90
使用列表中的数据框：删除变量，添加新变量

定义一个列表dats有两个数据框 df1 and df2 dats lt list df1 data frame a sample 1 3 b sample 11 13 df2 data frame a sample 1 3 b sampl
VIM - 显示上次保存版本和当前未保存版本的差异[重复]

这个问题在这里已经有答案了可能的重复在 Vim 中保存文件之前我可以看到更改吗 https stackoverflow com questions 749297 can i see changes before i save my fi
如何从类外部更改公共 R6 类方法？

我希望能够在我的 R6 类中重新定义公共方法以便它根据该类保存的数据类型进行更改如下所示 library R6 Simple lt R6Class Simple public list dt mtcars my print functi
R：邻接表到邻接矩阵

Bonjour 我想将邻接列表 3 列转换为邻接矩阵在这个论坛中我找到了多个有关如何将边列表转换为邻接矩阵的示例我成功地为两列列表做到了这一点我已经尝试了在网上可以找到的所有解决方案但似乎我错过了一小步我尝试过的我的变量是用
如何从数据框的单元格中获取值？

我构建了一个条件从我的数据框中提取一行 d2 df df l ext l ext df item item df wn wn df wd 1 现在我想从特定列中获取一个值 val d2 col name 但结果我得到一个包含一行和一列
R markdown 引文标识符

R markdown 允许使用 YAML 元数据部分中的参考书目元数据字段指定参考书目文件例如 title Sample Document output html document bibliography bibliography bi

随机推荐

阻止 Typescript 编译器检查整个类以节省时间？

Typescript 编译需要很长时间才能运行所以我使用generateTrace from https github com microsoft TypeScript pull 40063 https github com micros
当Xcode 4.3.2已安装且缺少gcc时，如何使用RVM安装Ruby 1.9.3？

我买了一台装有 Lion 的新 iMac 并安装了 Xcode 4 3 2 运行后 curl L get rvm io bash s stable 我开辟了一个新的bash 并使用 rvm install 1 9 3 安装Ruby 1 9
Ruby：如何使用dump方法将数据输出到csv文件？

我尝试使用 ruby 标准 csv 库将对象的 arr 转储到 csv file 称为 a csv http ruby doc org stdlib 1 9 3 libdoc csv rdoc CSV html method c dump
Azure 云服务和 Git 持续部署？

有没有一种方法可以让我不仅可以使用 Git 作为代码存储库还可以用于构建和持续部署到 Azure 云服务而不是网站我怀疑没有给出缺少的构建环境除非但想在注销之前确认这一点理论上我可以看到将 Git 托管在 Windows 服务器
Android聊天服务器[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我需要为基于 Android 的客户
如何使用 Jasmine BDD 创建 ajax 函数的存根

我正在努力寻找有关如何使用 Jasmine BDD 伪造 ajax 调用的任何示例我有一个自定义的 ajax 函数其工作原理如下 ajax url JSON php dataType json onSuccess function re
在 sql server management studio 中运行任何查询时出错：文件存在

当我在 sql server management studio 中运行任何查询时出现以下错误执行批处理时出错错误消息是该文件存在重新启动 SSMS 没有帮助重新启动机器也没有我在 Google 上发现的唯一内容是有人说向微
如何在 Angular 中从同级组件导航到另一个同级组件？

下面是我的app routing ts export const Approute Routes path login component LoginComponent path home component HomeComponent c
具有接收器参数覆盖的方法是否等同于没有接收器参数的相同方法声明？

我有一个关于定义的相当技术性的问题覆盖等效项 JLS 8 4 2 https docs oracle com javase specs jls se9 html jls 8 html jls 8 4 2 在接收器参数的上下文中 Edit 发
html 标题属性在 Chrome 中不显示为工具提示

最近将我的 Google Chrome 更新到版本 32 0 1700 76 m 看起来工具提示已停止出现在设置了 title 属性的 html 元素上 span alt Testing title Testing hhh span 这是一
禁用/启用 MFC 功能包的功能区按钮

我正在使用 MFC 功能包并且功能区栏上有一些按钮即 CMFCRibbonButton 的实例问题是我想在某些条件下启用和禁用其中一些但在运行时我怎样才能做到这一点因为没有具体的方法我听说解决方案是在运行时附加分离事件处理程
我可以让 GCC 在将太宽的类型传递给函数时发出警告吗？

以下是一些明显有缺陷的代码我认为编译器应该发出诊断信息但两者都没有gcc nor g 确实如此即使有我能想到的所有警告选项 pedantic Wall Wextra include
从 C# 代码启动 Storyboard

我试图从 C 调用在 xaml 代码中声明的故事板
如何在 Entity Framework 4.1 的 Code-First Fluent API 中以编程方式定义关系

我正在玩新的 EF4 1 unicorn love 我试图了解我可以使用的不同方式代码优先 to 以编程方式定义几个简单 POCO 之间的关系我如何定义以下 gt 1 Team有0 多Users 和一个User是在 1Team 1 Use
djangorest框架模型序列化器 - 嵌套读取，扁平写入

我遇到一种情况我的客户正在尝试编写包含 fk 列表的表示 languages 1 last name Beecher settings 1 state NY 但是当读它时我想要一个嵌套表示来减少往返次数 languages id 1 c
在 Atom 中使用变量创建片段

是否可以将变量合并到 Atom 中的片段中例如当您想要预先填充即将出现的点时这对于 for 循环非常有用 The snippets cson我想以java作为源的条目不幸的是它不起作用 source java For Loop pr
MobX 自动运行行为

我正在探索 MobX 并对一个问题感兴趣如果我有这个可观察的 class ItemsStore observable items 1 2 3 const store new ItemsStore 然后像这样改变它 setInterval
Django Admin：为两个管理站点使用不同的模板

我有一个 Django 项目有两个不同的管理站点如中所述文档 http docs djangoproject com en 1 2 ref contrib admin multiple admin sites in the same u
完美平衡二叉搜索树

我有一个理论问题Balanced BST 我想建立Perfect Balanced Tree具有2 k 1节点从常规unbalanced BST 我能想到的最简单的解决方案是使用排序Array Linked list并递归地将数组划分为子
R 合并具有相似值的行

我有一个数据框行值首先从小到大排序我计算相邻行之间的行值差异组合具有相似差异例如小于 1 的行并返回组合行的平均值我可以使用 for 循环检查每一行的差异但这似乎是一种非常低效的方法还有更好的想法吗谢谢 library

R 合并具有相似值的行

R 合并具有相似值的行 的相关文章

随机推荐

热门标签

R 合并具有相似值的行的相关文章