R - 将数据框行拆分为两行

2024-01-12

我有 2 个表（数据和参考；下面的玩具示例）。这些表有 START 和 END 位置，我想检查它们是否重叠（使用 data.table 包中的 foverlaps 之类的东西），然后拆分值，如下所示。

>data  <- data.table(ID=c(1,2,3), Chrom=c(1,1,2), Start=c(1,500,1000), End=c(900,5000,5000), Probes=c(899,4500,4500))
>Ref.table <- data.table(Chrom=c(1,2), Split=c(1000,2000))

>Ref.table
Chrom    Split
1        1000
2        2000

>data
ID    Chrom    Start    End    Probes
1     1        1        900    899
2     1        500      5000   4500
3     2        1000     5000   4000

正如您所看到的，ID 1 与引用表没有重叠，因此它将被保留。但是，ID 2 和 3，我想根据 Ref.table 进行拆分。

我想要得到的结果表是：

>result
ID    Chrom    Start    End    Probes
1     1        1        900    899
2     1        500      1000   500
2     1        1001     5000   4000
3     2        1000     2000   1000
3     2        2001     5000   3000

我相信您可以看到，这有两个部分： 1. 根据单独的表将范围拆分为两列 2. 按比例将 # 个探针分成两部分

我一直在寻找一个可以做到这一点的 R 包（通过染色体臂分割范围），但一直无法找到一个可以实现如上所示的功能的包。任何指向函数包的链接将不胜感激，但我也愿意自己编写代码......在一点帮助下。

到目前为止，我只能使用 foverlaps 来确定是否存在重叠：例子：

>foverlaps(Ref.table[data[14]$Chrom], data[14], which=TRUE)
     xid   yid
1:    1     1

这是一个可能的foverlaps解决方案（如Q中所述）。

前两个步骤很简单并且非常惯用，添加一个End列至Ref.table所以我们会有重叠的间隔，然后将两个数据集键入Chrom和间隔列（在 v 1.9.5+ 中，您现在可以指定by.x and by.y相反）并简单地运行foverlaps

library(data.table)
setDT(Ref.table)[, End := Split]
setkey(Ref.table)
setkey(setDT(data), Chrom, Start, End)
res <- foverlaps(data, Ref.table)
res
#    Chrom Split  End ID Start i.End Probes
# 1:     1    NA   NA  1     1   900    899
# 2:     1  1000 1000  2   500  5000   4500
# 3:     2  2000 2000  3  1000  5000   4000

现在我们有了重叠，我们需要根据匹配增加数据集大小。我们可以将其作为条件is.na(Split)（这意味着没有发现重叠）。我不确定这部分是否可以更有效地完成

res2 <- res[, if(is.na(Split)) .SD else rbind(.SD, .SD), by = .(ID, Chrom)]
## Or, if you only have one row per group, maybe
## res2 <- res[, if(is.na(Split)) .SD else .SD[c(1L,1L)], by = .(ID, Chrom)]

现在，最后两个步骤将更新End and Start列，然后是Probes根据新列值的列

res2[!is.na(Split), `:=`(i.End = c(Split[1L], i.End[-1L]),
                         Start = c(Start[-1L], Split[1L] + 1L)), 
     by = .(ID, Chrom)]
res2[!is.na(Split), Probes := i.End - Start]
res2
#    ID Chrom Split  End Start i.End Probes
# 1:  1     1    NA   NA     1   900    899
# 2:  2     1  1000 1000   500  1000    500
# 3:  2     1  1000 1000  1001  5000   3999
# 4:  3     2  2000 2000  1000  2000   1000
# 5:  3     2  2000 2000  2001  5000   2999

（如果您愿意，可以删除不需要的列）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

R - 将数据框行拆分为两行的相关文章

R：如何将描述小时、分钟和秒的非直观字符串转换为可行的 POSIXct 格式以执行标准算术？

我在 R 中有一个数据集其值采用小时分钟和秒格式然而有些值只有小时和分钟有些值只有分钟和秒有些值只有分钟有些值只有秒它的格式也不是很有利样本数据如下 example lt as data frame c 22h28m 17
无效的命令名称“tk_chooseDirectory”错误

我使用 bioconductor 进行 WES 管道并使用 tk choose dir 选择用户存储输入文件的目录并将其存储以供进一步使用这里是命令行 library tcltk dataDir lt dirname tk choos
距数据帧中最近的非 NA 值的距离

我有以下数据帧 df 我想添加一列其中包含与每行最接近的非 NA 值的距离 df lt data frame x 1 20 df c 1 3 4 5 11 14 15 16 x lt NA 换句话说我正在寻找以下值 df distanc
R中无法连接odbc数据库

我一直在尝试使用以下命令将我公司的 DMS 连接到 RodbcConnect命令但收到以下消息 myConn lt odbcConnect NZSQL uid cejacobson pwd password Warning message
ggsubplot 是否适用于 R 3.2.1+？

CRAN 提供的 ggsubplot 版本与 R 的最新版本例如 3 1 1 不兼容运行 ggsubplot 示例会返回以下错误 Error in layout base data vars drop drop At least one
data.table 的包装函数

我有一个已经使用 data frame 上下文编写的项目为了缩短计算时间我尝试利用 data table 的速度我的方法是构造包装函数读取帧将它们转换为表进行计算然后转换回帧这是一个简单的例子 FastAgg lt func
根据 R 中的字符串模式选择行

假设我有以下数据 df lt data frame name c TO for Turnover for people HC people Hello world beenie man apple pears TO is number c
更新两组单选按钮 - 闪亮

我问了这个问题反应式更新两组单选按钮闪亮 https stackoverflow com questions 35040579 update two sets of radiobuttons reactively shiny 昨天但也
使用 roxygen2 导入两个同名函数

我是 CRAN 包的维护者在加载时收到以下消息 checking whether package qdap can be installed 10s 10s WARNING Found the following significant
如何在R中将英尺转换为厘米？

我得到了一个高度的字符向量如下所示 859 5 10 5 8 5 11 6 0 5 10 6 2 5 11 6 2 6 2 5 7 5 9 5 7 6 1 6 0 5 11 6 0 6 5 6 1 6 1 5 10 5 11 5 11 6
使用faceting()时如何连接geom_point()和geom_line？

我有一个问题但我在互联网上没有找到任何相关信息我很高兴得到一些提示我有一个数据集其中 x 轴是离散的但我想将这些点相互连接我可以做到我的问题是当我添加分面选项时我无法再将这些点相互链接起来我找到了一个替代方案但看起来不太
如何通过组度量的平均值在 df 内排列 dplyr:: 组？

借鉴吴卡拉的设计https stackoverflow com a 26555424 9350837 https stackoverflow com a 26555424 9350837答案我希望根据各个组汇总测量的平均值对分组 df 进
将模式的所有元素与向量以相同的顺序匹配

我创建了一个函数yes seq需要两个参数一个模式pat和数据dat 该函数以相同的顺序查找数据中是否存在模式例如 dat lt letters 1 10 dat 1 a b c d e f g h i j pat lt c a c g
在 Windows / Linux 中创建 Mac 包

我自己努力制作一个 r 包我按照 stackoverflow 中上一个问题的说明进行操作如何为外行开发软件包 http cran r project org bin windows Rtools 以下是我根据上一个问题采取的步骤在新的
使用 R 将日期格式的字符串列表/向量转换为 posix 日期类

我有一个日期格式的字符串列表我想将其转换为可以使用 R 操作的 posix 日期列表我该怎么做这就是我所拥有的但我最终得到了一个列表 a lt c 2009 01 01 00 00 00 2009 01 01 00 00 00 z
R 3.5 - read.csv 无法读取 UTF-16 csv 文件

我的代码如下 read csv http asic gov au Reports YTD 2018 RR20180420 001 SSDailyYTD csv skip 1 fileEncoding UTF 16 sep t header
ggplot2 中的中心图标题

这个简单的代码以及今天早上我的所有脚本已经开始在 ggplot2 中给我一个偏离中心的标题 Ubuntu version 16 04 R studio version Version 0 99 896 R version 3 3 2 G
如何将 Shiny 中生成的反应图传递到 Rmarkdown 以生成动态报告

简而言之我希望能够通过单击按钮从我的闪亮应用程序生成动态 Rmarkdown 报告文件 pdf 或 html 为此我想我将使用 Shiny 的参数化报告但不知何故我无法将单个谜题转移到所需的目标使用此代码我们可以在 R Shin
ggplot2 + 使用比例 X 的日期结构

我真的需要帮助因为我已经迷路了我正在尝试创建一个折线图显示几个团队一年来的表现我将一年分为几个季度 2012 年 1 月 1 日 2012 年 4 月 1 日 2012 年 8 月 1 日 12 1 12 并将 csv 数据帧加载到
如何在闪亮的observeEvent中监听多个事件表达式

我想要两个不同的事件触发观察者有人建议here https stackoverflow com questions 34731975 how to listen for more than one event expression wit

随机推荐

如何处理 ASP.net 的神秘隐藏值？ (__VIEWSTATE)

当您尝试使用 Python 请求 POST 页面时我试图弄清楚如何处理神秘的 VIEWSTATE 和 Cie 它是我的脚本中许多问题的主要根源并且我意识到当我寻找答案解决方案时您没有那么多的解决方案几乎为 0 在本主题中无法使
如何获取字符串的瑞典语排序顺序

我在对瑞典语字符串进行排序时遇到问题我在使用以下字符时遇到问题 v w new wa va wb vb a OrderBy x gt x new CultureInfo sv SE CompareInfo GetStringCompare
iOS 按住手势 + 点击

我有一个按住手势在按住期间我想检测屏幕上其他地方的单击问题是当我开始点击屏幕上的其他位置时按住手势会被中断并且不会调用触摸功能有没有办法在点击其他地方时保持按住 UIKit 提供了多种机制来创建多个UIGestureRec
如果可能的话，实现复制的类型是否会被移动？

如果将一个类型传递给一个非指针类型的函数并且它实现了 Copy Rust 是否仅在必要时才复制它下面是一些具体的代码 derive Clone Copy struct Data u8 2 derive Clone Copy struct
Haskell 中 IO Monad 中元组的模式匹配

我一直在业余时间研究 Haskell 最近涉足了一元函数领域我将我一直在进行的练习中的代码提炼成这个非常人为的示例以隔离我遇到的确切问题 import System Random rndPermu a gt IO a a rndPerm
使用 awk 捕获行范围，多行记录不起作用

我试图理解为什么在调用 RS 和 ORS 选项时不能使用 awk 有一个更好的方法吗这有效 awk password space test awk password test 但我需要这个才能工作 awk v RS v ORS n n p
OpenCV projectPoints()：估计姿势的协方差/标准差不一致

我在姿态估计算法中使用 OpenCV 我还尝试获得估计姿态的不确定性的估计我的姿态估计是通过 3D 2D 对应关系和 PNP 算法来执行的为了实现不确定性估计我尝试使用 projectPoints 函数将 3D 点重新投影回图像平面
如何向asp.net中的动态控件添加事件处理程序以进行回发？除了使用Javascript之外，还有可能吗？

如何向asp net中的动态控件按钮添加事件处理程序以进行回发除了使用Javascript之外还有可能吗是的这是可能的所以举例来说在你的Page Load您可以创建按钮本例使用VB 这必须在回发时重新创建因此不要将其包
Dart 多个上限

我需要使用实现 3 个接口的泛型来实现一个解决方案但据我所知 dart 中的泛型仅支持 1 个上限我有一个看起来像这样的模型 abstract class Category implements Built
我们如何在 Rust 中检测主机操作系统类型（而不是目标操作系统）？

检测目标操作系统的方法有很多种 e g cfg windows cfg unix std env consts OS 对于交叉编译我们如何检测编译 Rust 程序的操作系统 Since build rs在工作站不是目标上运行我猜它可
UITableView 和选择项目

我目前正在创建一个简单的分组 UITableView 当用户选择 Apple 时我希望将项目中的图像加载到 Apple 的图像视图中我在互联网上看到了一些例子但我正在尝试看看还有什么任何建议将不胜感激谢谢要么设置cell ima
FileChannel 返回资产文件夹中文件的错误文件大小

我正在尝试阅读File从我的资产中的原始文件夹中使用FileInputStream 这就是我创建的方式FileInputStream AssetManager assetManager getAssets AssetFileDescript
具有复杂对象的 MVC WebApi HttpGet

我有一个现有的 WebApi 操作我想将其从 HttpPost 切换到 HttpGet 目前它采用单个复杂对象作为参数该模型 public class BarRequest JsonProperty catid public int C
HTML5“数字”类型输入 - 向上/向下箭头不精确的点击错误

为标题的血腥道歉今天我们发现单击 HTML5 数字输入上的向上箭头周边附近将在第一次单击时触发向上箭头上的事件但在每次后续单击时都会触发向下箭头上的事件这是演示该问题的一行小提琴我能够在 Chrome 59 中一致地重
Android 中浏览 XML（特别是 rss）的 Intent 过滤器

我有一个活动我想在每次用户访问浏览器中的 xml 特别是 rss 页面时运行该活动至少假设用户从可以支持它的应用程序列表中获取它我目前已经有了当前的意图过滤器
UITableViewCells 周围的黑角

我正在尝试在图像前面显示 UITableView 这是我要遵循的步骤在视图内添加一个 UIImageView 并将图像设置为项目中适当的文件在父视图中添加一个UITableView 与图像视图相同的父视图将表格视图的背景颜色设置为清
如果删除重复的构造函数，通用类表达式就会被破坏

我偶然发现了这种奇怪的行为如果我删除其中的构造函数签名之一IFoo编译器触发以下错误 Type typeof Anonymous class is not assignable to type IFoo 到底发生了什么 type Foo
翻转图例的顺序而不改变绘图中的顺序

我发现当添加coord flip 对于使用 ggplot2 的某些绘图图例中的值的顺序不再与绘图中的值的顺序一致例如 dTbl data frame x c 1 2 3 4 5 6 7 8 y c a a b b a a b b z c
为什么交错的 scanf() + printf() 语句会导致两个 scanf() 调用先执行，然后再执行两个 printf() 调用？

您能否解释一下以下代码中的一件事 include
R - 将数据框行拆分为两行

我有 2 个表数据和参考下面的玩具示例这些表有 START 和 END 位置我想检查它们是否重叠使用 data table 包中的 foverlaps 之类的东西然后拆分值如下所示 gt data lt data table

R - 将数据框行拆分为两行

R - 将数据框行拆分为两行 的相关文章

随机推荐

热门标签

R - 将数据框行拆分为两行的相关文章