根据一个列值是否位于其他两个列值（范围）之间，将新列添加到带标签的数据框中

2024-04-08

我有一个数据框（大约有 300 行），其中一列称为“geneID”：

geneID   distance  pvalue
4        30        0.05
409      0         0.001
60       41        0.02
...

我有第二个数据框，指示构成更大抗生素生物合成基因簇的基因范围（染色体中大约有 30 个基因簇）：

ClusterID           start   end
Chloramphenicol     100     130
NRPS                403     489
Terpene             5021    5109
...

我想要做的是，如果基因 ID 位于该基因簇的“开始”和“停止”之间，则向数据帧 1 添加另一列，标记为数据帧 2 的相应“簇 ID”：

geneID   distance  pvalue  ClusterID
4        30        0.05    NA
409      0         0.001   NRPS
60       41        0.02    NA

我尝试过使用向量作为 mutate 函数中的值：

ChIP_table %>%
  mutate(ClusterID = case_when((ID >= biosynthetic_clusters$start & ID <= biosynthetic_clusters$end) ~ biosynthetic_clusters$Cluster,
                               TRUE ~ "NA"))

这不起作用。不知道从这里去哪里。我尝试构建一个 for 循环，但仍然无法找到使用向量/列值作为排序/标签条件的方法。

任何帮助，将不胜感激！

你可以使用cut功能。假设你的数据框是df:

breaks <- c(100, 130, 403, 489, 5021, 5109)
labels <- c("Chloramphenicol", NA, "NRPS", NA, "Terpene")

df$ClusterID <- cut(df$geneID, breaks = breaks, labels = labels, include.lowest = TRUE)

中断是开始值、结束值。标签是每个可行范围的 ClusterID 名称。 NA 标签用于可行的范围间隙。因此，对于属于 ClusterID 范围内的基因 ID，它们将被分配 ClusterID 名称，否则为 NA。因此，需要一些预先的工作来输入标签向量。（你可以编写一个函数来做到这一点。）但我认为它会起作用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

dplyr

根据一个列值是否位于其他两个列值（范围）之间，将新列添加到带标签的数据框中的相关文章

如何将同一行中以逗号分隔的值拆分到R中的不同行

我有一些数据来自谷歌表格 https forms gle rGQQL3tvA1PrE4dD8我想拆分以逗号分隔的答案 and 复制参与者的 ID 数据如下 gt head data names Q2 Q3 Q4 1 PART 1 fruit
读取R中打开的Excel文件

有没有办法将打开的Excel文件读入R 当Excel中打开一个excel文件时 Excel会对文件加锁比如R中的read方法无法访问该文件你能绕过这个锁吗 Thanks 编辑这发生在带有原始 Excel 的 Windows 下发生错
当有很多列时，使用 readr::read_csv() 导入数据时覆盖列类型

我正在尝试使用 R 中的 readr read csv 读取 csv 文件我导入的 csv 文件大约有 150 列我只包含示例的前几列我希望将第二列从默认类型我执行 read csv 时为日期覆盖为字符或其他日期格式 GIS Jo
按特定样本前缀对列名称向量进行子集化

假设我有一个如下所示的数据框 ca01 lt c 1 10 ca02 lt c 2 11 ca03 lt c 3 12 stuff 1 lt rep test 10 other lt rep 9 10 data lt data frame
通过使用 navbarPanel() 并隐藏导航栏构建多页闪亮应用程序用户端（在 ui.R 中）？

我想构建一个多页闪亮应用程序我可以在其中控制用户可以看到哪个页面迪安阿塔利确实这个演示应用程序中有类似的东西 https github com daattali advanced shiny tree master multiple
使用大矩阵操作

我必须使用 big matrix 对象并且无法计算某些函数让我们考虑以下大矩阵 create big matrix object x lt as big matrix matrix sample 1 10 20 replace TRUE
对 data.table 中的列表列执行操作

假设我有一个data table 例如dt lt data table foo list 1 3 4 6 bar c 2 7 如何使用 dt 框架对 foo 向量列表执行操作操作可能是将 bar 添加到 foo 返回列表 3 5 11 1
融化R中的下半矩阵

如何融化下半三角形加对角矩阵 11 NA NA NA NA 12 22 NA NA NA 13 23 33 NA NA 14 24 34 44 NA 15 25 35 45 55 A lt t matrix c 11 NA NA NA NA
R 中按时间划分的平均值

我每秒测量一次化合物浓度我想求 30 秒和 60 秒的平均值我一直在阅读这里的帖子我尝试过lubridate and dplyr 但没有运气我正在努力完成这项工作但我一直没能做到我正在从 SAS 过渡到 R 所以请耐心等待这是
如何在ubuntu的conda环境中更改Rstudio中的R版本

我在基本系统中安装了 R 4 3 和 Rstudio 在 conda 环境中安装了旧版本的 R 4 2 3 命令which R返回环境中安装的 R 的目录 home 用户 miniconda3 envs anndata2ri pip bin
一段 R 代码会影响 foreach 输出中的随机数吗？

我使用运行模拟foreach and doParallel并与随机数名为random在代码中简而言之我模拟一个足球联赛随机生成所有比赛的获胜者以及相应的结果在dt base没有比赛进行在dt ex1 and dt ex24场比赛
如何添加链接以从我的 R闪亮应用程序在新窗口中打开 pdf 文件？

我可以使用 a 从我的 Shiny 应用程序添加到外部站点的超链接 a google href http www google com 但如何创建一个链接来打开 pdf 或类似文件看起来应该很简单但我找不到任何例子我的问题与此类似
无法更新/编辑从 R 中的包（`gratia`）导出的 ggplot2 对象

我希望我在这里遗漏了一些令人痛苦的明显的东西我希望更新例如修复标题实验室等由生成的 ggplot 对象gratia draw 不太确定为什么我无法更新该对象有一个简单的解决方案吗 devtools install github
从 n,k 维矩阵数组中减去 n,k 维矩阵

如果我有一个数组A A lt array 0 c 4 3 5 for i in 1 5 set seed i A i lt matrix rnorm 12 4 3 如果我有矩阵 B set seed 6 B lt matrix rnorm
在 R 传单中添加不透明度滑块

如何在 R leaflet 应用程序中添加滑块来控制特定图层的不透明度对于这个应用程序我不想使用闪亮这里建议在 R 传单应用程序中添加滑块 https stackoverflow com questions 37682619 add
尝试使用 JRI 将 R 与我的 Java 应用程序集成，但出现错误。谁能解释一下原因和解决办法吗？

我需要将 Java 与 R 集成来运行一些数学命令并使用 R 的功能进行绘图以下部分代码给出了错误 public static void main String args HelloRWorld r new HelloRWorld r h
R中的重叠矩阵

我有以下数据框 id channel 1 a 1 b 1 c 2 a 2 c 3 a 我想创建并重叠矩阵它基本上是一个方阵行和列标签为 a b c 表中的每个条目显示每个通道共有多少个 id 例如在上面的例子中矩阵看起来像 a b
R 可以创建带有可单击条形图的条形图图像以插入网页吗？

我知道如何创建条形图以及如何将其粘贴在网页上例如使用hwriteImage in the 作家包 http www embl de gpau hwriter 我想要的是每个栏都是一个在鼠标悬停时突出显示的区域并且每个栏在单击时都有不
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
绘制 Cox 回归的 Kaplan-Meier 图

我使用 R 中的以下代码设置了一个 Cox 比例风险模型来预测死亡率添加协变量 A B 和 C 只是为了避免混淆即年龄性别种族但我们真正对预测变量 X 感兴趣 X 是一个连续变量 cox model lt coxph Surv t

随机推荐

以编程方式更改滑动时的 ViewPager 动画持续时间

我正在使用以下代码更改幻灯片 viewPager setCurrentItem index true 但变化太快了有没有办法手动设置动画速度 I ve wanted to do myself and have achieved a sol
我可以在全局范围内只安装 Gulp 吗？

我一直致力于新的网络开发项目这些项目在实践中并不需要他们的node modules部署时的文件夹如果我能够创建一个小的它会更适合我gulpfile js对于每个项目而不是包含在 6000 多个文件node modules每个项目的文
在 Restful Web 服务中下载文件

我的要求是我应该通过restful服务向客户端发送一个10MB的zip文件我在论坛中找到了发送StreamingOutput对象是更好的方法但是我如何创建一个StreamingOutput以下代码中的对象 Path PDF file
使用“Object.create”而不是“new”

Javascript 1 9 3 ECMAScript 5 介绍Object create 其中道格拉斯克罗克福德 Douglas Crockford 等人提倡 http javascript crockford com prototyp
如何从一组 N 个对象中选择 n 个对象，最大化它们之间的成对距离之和

您有一组 N 400 个对象每个对象在 19 维空间中都有自己的坐标您计算欧几里德距离矩阵所有成对距离现在您想要选择 n 50 个对象使得所选对象之间所有成对距离的总和最大我设计了一种通过线性编程来解决这个问题的方法下面的
如何使用完成处理程序将图像放入 SwiftUI 视图中

我已经尝试过这个但我不知道如何在 SwiftUI 视图中使用结果 func getProfilePicture completion escaping UIImage gt Void Alamofire request GIDSignIn
关于如何构建 HTML Diff 工具的建议？

In 这个帖子 https stackoverflow com questions 48669 are there any tools out there to compare the structure of 2 web pages我问是
SQL Server 进程队列竞争条件

我有一个订单队列多个订单处理器通过存储过程访问该队列每个处理器都会传递一个唯一的 ID 该 ID 用于锁定接下来的 20 个订单以供自己使用然后存储过程将这些记录返回给订单处理器以进行操作有些情况下多个处理器能够检索相同的 Ord
MYSQL限制特定列值的出现次数

从数据库中提取一些优惠券每张优惠券都有一个merchantid包含优惠券所属商家 ID 的列我正在尝试构建一个提取 5 张优惠券的查询但我只想要每张 1 张优惠券merchantid 我不想要多张相同的优惠券merchantid 你可
strtol 重用参数

该代码似乎按预期工作使用单个指针填充数字数组 include
您可以指定嵌入 IPython 后运行的命令吗？

打电话时IPython embed 是否可以给它一个命令或魔术函数来在嵌入发生后运行我想运行这样的东西 import IPython IPython embed command pylab qt4 我当前的解决方法是将命令字符串复制到剪贴
在 boost::spirit 语法中翻转规则内的子规则顺序会导致段错误

警告虽然我试图将代码缩短到最少我仍然需要包含相当多的内容以确保提供所需的信息该代码编译文件并运行导致语法错误 name simple name qi val qi 1 qualified name qi val qi 1 虽然这
将前导零填充到公共宽度[重复]

这个问题在这里已经有答案了我正在处理具有小时格式的数据库例如 HOUR ID 1 2 10 4 5 6 20 6 我想在 1 个字符的值中放置一个零并将它们存储在名为 NHOUR 的新列中例如 NHOUR HOUR ID 01 1
如何以角度从一个组件打开模态到另一个组件？

我创建模态模态组件并在 modal component html 文件中编码我的模态我想在标头组件的 header component html 文件中使用此模式我的 header component html 的相关部分如下 div
可以从 http（javascript 客户端）直接向 Amazon SQS 发送请求吗？

是否可以直接从 JavaScript 向 Amazon 的 SQS 发送消息请求我正在尝试创建一个日志系统并且希望绕过将请求发送到中间人服务器另外有人知道我可以利用这个解决方案的任何替代方案吗 SQS 事实上所有 aws 服务都公
SQL 内连接。 ON 条件与 WHERE 子句

我正忙于将使用旧样式语法的查询转换为新的联接语法我的查询的实质如下原始查询 SELECT i FROM InterestRunDailySum i InterestRunDetail ird InterestPayments p WHE
对动态大小的对象进行排序

Problem 假设我有一个包含一些数据的大字节数组最多 4GB 这些字节对应于不同的对象使得每个s字节认为 s 最多 32 将构成单个对象一个重要的事实是这个尺寸s对于所有对象都是相同的不存储在对象本身中并且在编译时不知道目
如何设置 BufferedImage 中的 RGB 像素以显示 16 位深度的 PNG？

我正在尝试读取并显示 PNG 文件我处理 8 位深度的图像没有问题我按如下方式进行 BufferedImage result new BufferedImage width height BufferedImage TYPE INT R
使用 RAISERROR 在 SQL Server 2005 中不起作用？

我有以下代码 BEGIN TRY BEGIN TRANSACTION DO SOMETHIING COMMIT TRAN END TRY BEGIN CATCH IF TRANCOUNT gt 0 ROLLBACK TRANSACTION
根据一个列值是否位于其他两个列值（范围）之间，将新列添加到带标签的数据框中

我有一个数据框大约有 300 行其中一列称为 geneID geneID distance pvalue 4 30 0 05 409 0 0 001 60 41 0 02 我有第二个数据框指示构成更大抗生素生物合成基因簇的基因范围染

根据一个列值是否位于其他两个列值（范围）之间，将新列添加到带标签的数据框中

根据一个列值是否位于其他两个列值（范围）之间，将新列添加到带标签的数据框中 的相关文章

随机推荐

热门标签

根据一个列值是否位于其他两个列值（范围）之间，将新列添加到带标签的数据框中的相关文章