使用数据框中的另一列标记 x 轴

2023-12-03

我有一个从运行 GWAS 的输出得出的数据帧。每行都是基因组中的一个 SNP，及其染色体、位置和 P 值。从这个数据框中，我想生成一个曼哈顿图，其中 x 轴从 Chr 1 上的第一个 SNP 到 Chr 5 上的最后一个 SNP，y 轴是 -log10(P.value)。为此，我生成了一个索引列，以沿着 x 轴以正确的顺序绘制 SNP，但是，我希望 x 轴由染色体列而不是索引来标记。不幸的是，我无法使用染色体来绘制 x 轴，因为任何给定染色体上的所有 SNP 都将绘制在单列点中。

这是一个可以使用的示例数据框：

library(tidyverse)

df <- tibble(Index = seq(1, 500, by = 1),
             Chromosome = rep(seq(1, 5, by = 1), each = 100),
             Position = rep(seq(1, 500, by = 5), 5),
             P.value = sample(seq(1e-5, 1e-2, by = 1e-5), 500, replace = TRUE))

到目前为止我所掌握的情节：

df %>%
    ggplot(aes(x = Index, y = -log10(P.value), color = as.factor(Chromosome))) +
    geom_point()

我尝试过使用scale_x_discrete选项，但无法找到解决方案。

这是我在网上找到的曼哈顿图的一个例子。看看 x 轴是如何根据染色体来标记的？这就是我想要的输出。

Example Manhattan Plot

geom_jitter是你的朋友：

df %>%
    ggplot(aes(x = Chromosome, y = -log10(P.value), color = as.factor(Chromosome))) +
    geom_jitter()

编辑给定OP的评论：

使用基本 R 图，您可以执行以下操作：

cols = sample(colors(), length(unique(df$Chromosome)))[df$Chromosome]

plot(df$Index, -log10(df$P.value), col=cols, xaxt="n")
axis(1, at=c(50, 150, 250, 350, 450), labels=c(1:5))

您需要准确指定每个染色体标签的位置axis功能。多亏了这个post.

Edit #2:

我找到了一个答案ggplot2。您可以使用annotate函数通过坐标绘制点，以及scale_x_discrete函数（如您所建议的）根据染色体将标签放置在 x 轴上。我们还需要定义pos向量来获取绘图标签的位置。我用的是平均值Index以每个组的列为例，但如果您愿意，您可以手动定义它。

pos <- df %>% 
    group_by(Chromosome) %>% 
    summarize(avg = round(mean(Index))) %>% 
    pull(avg)

ggplot(df) +
    annotate("point", x=df$Index, y=-log10(df$P.value),
          color=as.factor(df$Chromosome)) +
    scale_x_discrete(limits = pos, 
          labels = unique(df$Chromosome))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

ggplot2

使用数据框中的另一列标记 x 轴的相关文章

返回带有参数的函数的函数

创建一个应返回包含原始函数参数的函数时我应该如何处理例如考虑这个函数 a lt function value function x x value 我希望它返回我在结果函数的参数中指定的值如下所示 b lt a 3 gt b gt f
profvis() 何时以及为何显示“源不可用”？

我经常分析 R 代码并大量使用 profvis 对于某些函数浏览器窗口的上半部分会显示源代码有时则不会我不知道什么时候会出现这种情况对我来说这似乎是随机的有谁知道 profvis 何时以及为什么无法在顶部窗口中显示代码发生这种
包检查时如何有效处理未压缩的保存？

在最近开发一个包的过程中我将数据集包含在data 我的包的文件夹在我的具体情况下我有 5 个数据集所有这些数据集都位于data table格式尽管我在下面描述的问题仍然存在如果我将它们保留为data frame 我已将每个人单独
readRDS() 加载额外的包

什么情况下会出现readRDS R 中的函数尝试加载包命名空间我很惊讶地在新的 R 会话中看到以下内容 gt loadedNamespaces 1 base datasets graphics grDevices methods sta
仅在具有重复块名称的另一个 Rmarkdown 文档中运行一个 Rmarkdown 文档中的代码

我正在 Rmarkdown 中编写一系列相互补充的报告我想将上一份报告的结果纳入我目前正在编写的报告中我看到其他建议使用的问题purl从 Rmarkdown 文档中提取 R 代码然后运行它所以我尝试了以下操作 r read previ
为什么我在 ddply 中看到“错误：length(rows) == 1 is not TRUE”？

我有一个数据框比如工资单例如 payroll lt read table text AgencyName Rate PayBasis Status NumRate HousingAuthority 26 843 00 Annual Fu
R中有字典功能吗

有没有办法在 R 中创建一个字典使其具有对一些效果 x dictionary c Hi Why water c 1 5 4 x Why 5 我问这个是因为我实际上正在寻找两个分类变量函数所以如果 x dictionary c a b
R 中带有边缘箱线图的直方图

如何使直方图中的 X 轴与边缘箱线图匹配 data lt rnorm 1000 nf lt layout mat matrix c 1 2 2 1 byrow TRUE height c 1 3 layout show nf par mar
分割单个 SpatialPolygons 对象的多边形部分

在 R 中我有一个SpatialPolygons包含数百个多边形的对象即多个多边形我想分割这个SpatialPolygons对象放入列表中Polygons 即孔应保持连接到父多边形知道如何做到这一点吗 EDITED 使用以下提供的示
使用 R 中的 tidyverse 重新调整因子和重新排序因子

我想使用这些功能重新调平 and 重新排序在我的数据框中我了解重新调整级别的工作原理但我不明白为什么我在 data frame 中看不到级别的变化例如假设我有鸢尾花数据集 library tidyverse head iris g
如何优化 R 中的 sapply 来计算数据帧上的运行总计

我在 R 中编写了一个函数来按月份计算累积总数但随着数据集变大我的方法的执行时间呈指数增长我是一名 R 程序员新手你能帮我提高效率吗该函数以及我调用该函数的方式 accumulate lt function recordnum d
如何在 R 中查找平衡面板数据（又名，如何查找面板中的哪些条目在给定窗口内完整）

我有来自 Compustat 的大量数据我向其中添加了一些手工收集的数据认真地从一堆旧书中手工收集但我不想手工收集整个面板只想随机选择一个子集为了找到更大的集合我从中随机选择我想从 Compustat 的平衡面板开始我看到p
无法在 Powershell 中运行 R.exe

我经常发现在命令行 Windows 上运行 R 更有用然而当我在 Powershell 中尝试时我往往会遇到问题但这可以通过第一次运行轻松克服cmd然后就可以了这是我执行此操作时遇到的错误R CMD BATCH Invoke Hi
R：如何更改ggvis闪亮应用程序中特定范围的绘图背景颜色

I have a simple shiny app like below and you can run it The plots are created by ggvis and user can choose student name
使用 dplyr 的 select 引用变量名[重复]

这个问题在这里已经有答案了通常我会想要选择变量的子集其中该子集是函数的结果在这个简单的例子中我首先获取与宽度特征相关的所有变量名称 library dplyr library magrittr data iris width var
在 R 中收集多组列[重复]

这个问题在这里已经有答案了我有一个宽数据框需要将其收集或融化成一个高数据框我遇到的问题是我有几组列需要保持关联分组我每个表单提交有 2 个用户每个用户有 3 列数据我想将这 6 列基本上以 3 组的形式堆叠起来以便每个用户都
求解非线性方程组

我正在尝试求解以下四个方程组我尝试过使用 rootSolve 包但似乎我无法通过这种方式找到解决方案我正在使用的代码如下 model lt function x F1 lt sqrt x 1 2 x 3 2 1 F2 lt sqrt
替换rmarkdown/knitr/pdf中字幕的自动编号

我正在使用 Rmarkdown 生成 PDF 文档我想在其中手动定义图号下面是一个块的示例 r chunk26 fig cap Fig 5 3 My figure caption plot 1 1 我使用特殊的编号来遵循文档的章节问题
R 在安装包依赖项时不考虑最大版本

假设我正在开发一个名为magicr做一些统计魔术我希望它使用另一个名为的包中的函数fairydust 假设存在于 CRAN 上很遗憾fairydust刚刚向 CRAN 发布了 2 0 0 版本完全破坏了我计划使用的功能所以我更新了
DT数据表中的列对齐

In my shiny我正在使用的应用程序datatable函数来自DT库构建一个表格并希望将列居中对齐我可以用formatStyle column textAlign center 但它只影响列体而不影响标题我们必须设置columnD

随机推荐

bash_profile 未与 Chef-run 一起生效

如果我与厨师一起运行以下食谱则会添加条目 bash profile 但是当我这样做时echo PATH or echo JAVA HOME 命令行返回空白值那里发生了什么事 ruby block set env java home do
如何对矩阵中的一行求和

写出方法 public int sumRow int matrix int row 求和行row在二维数组中称为矩阵 Given public void run System out println sumRow new int 70 93
使用 Visual Studio 开发时在哪里可以找到 .pro 文件？

我想向我的程序添加声音所以我需要添加头文件QSound 要添加头文件我需要修改 pro file 问题是我使用Visual Studio开发项目所以找不到 pro file 如果您使用的是 Qt VS Tools 请使用Create
在非英语设备上将国家/地区代码转换为国家/地区名称

这是我正在使用的代码取自将国家地区代码转换为国家地区名称 NSLocale locale NSLocale currentLocale NSString countryCode locale objectForKey NSLocal
write.csv 许可闪亮服务器 - R

我似乎无法在闪亮的服务器上使用 write csv 我收到此错误 cannot open file data Available csv Permission denied 我读过这篇文章 https groups google com f
memmove 和 memcpy 有什么区别？

有什么区别memmove and memcpy 您通常使用哪一种以及如何使用 With memcpy 目标根本不能与源重叠和memmove它可以这意味着memmove可能比memcpy 因为它不能做出相同的假设例如 memcpy可能总
使用 HTML，如何将文件作为 Excel 文件打开？

我有一个名为new xls我已经保存在 html格式为new html 我已经删除了扩展名因此文件名只是new 现在如果我将文件重命名为new xls 对于以下代码
java.util.zip.ZipException：重复条目：android/support/v4/view/MotionEventCompatEclair.class

我是 android studio 的新手正在尝试从 eclipse 导入一个项目但我觉得我遇到了所有可能的问题我目前收到的错误是 Error Execution failed for task jobFlexwithInvoice
将TextureView上显示的帧录制为mp4

我设法编写了一个在TextureView上显示3D模型的演示并且该模型可以根据手机的传感器移动 3D引擎是用C 编写的我需要做的就是将TextureView的SurfaceTexture给3D引擎引擎调用函数 ANativeWindo
使用 python azure 函数从 azure blob 存储读取文件

我创建了一个天蓝色函数Python 3 9我将使用执行该功能Http Trigger via Azure data factory 现在在我的 python azure 函数中我想从我的存储帐户访问存储容器并从同一容器读取文件以便对文
Rails 创建连接表不需要在迁移中添加主键？

我使用这个命令 rails g migration CreateJoinTableUserPloy user ploy 我检查了迁移文件 create join table Users Posts do t t index user id
如何使用 jQuery Tablesorter 对包含两个 div 的列进行排序？

我在用着jQuery 表排序器对表进行排序我的其中一篇专栏如下所示 td div span class green Yes span a href unverify a div div class hidden span class re
Gson:java.lang.StackOverflowError: null

我有一个类Delete 我想使用Gson库将其转换为json 但是当我转换它时它会抛出异常java lang StackOverflowError null这是我的课 import models UserNotifications Mai
了解上周有多少用户连接到我的计算机，以及每个用户连接了多少次

我需要一个脚本来显示上周连接到我的计算机的用户及其频率的摘要我知道我可以使用last并过滤时间列awk 但是如何呢我必须让每个用户在上周连接并计算连接数加上所有连接的总时间这是我到目前为止所想出的 for USER in last a
一个有趣的图形任务

一棵树有n个顶点我们被要求计算多重集 S 的最小大小使得树中的每条边 u v 至少满足以下条件之一你 in S v S S 中至少有两个顶点每个顶点都与 u 或 v 相邻由于 S 是多重集因此一个顶点可能多次出现在 S 中我的
我如何检查哪些所有用户都登录到我的应用程序

我有一个基于网络的应用程序它使用用户名和密码进行登录现在我如何检查所有用户在该时间登录的特定时间我正在使用会话管理并且应用程序中没有使用数据库所有内容都在文件系统上编辑 1个更愚蠢的疑问如何定义具有应用程序范围的变量是这样的
带 boost 的类型列表

在我继续之前 boost 中是否已经有一个类型列表实现或使用它的小型实现到目前为止我还没有发现任何有用的东西我正在尝试使用 boost pp 生成各种大小的列表类 define BOOST PP LOCAL MACRO n templa
JSP：制作可重用的代码（标签、宏）并在同一页面上使用

有没有办法在一个 JSP 页面上制作某种参数化宏并在同一页面上重复使用它几次可以使用 JSP 标签但我必须为每个标签创建一个文件多年来我一直想要这个功能在再次谷歌搜索后我编写了自己的功能我认为标签 jsp 文件和自定义标签类很
mdOption 的 (onSelectChange) 输出始终传递列表中的第一项

我正在使用 Angular 4 4 3 4 的 Angular Material 我需要挂钩选择事件以清除输入并将对象存储在单独的列表中但有一个问题 onSelectChange 输出始终获取第一项作为参数这是怎么回事这是我的模板
使用数据框中的另一列标记 x 轴

我有一个从运行 GWAS 的输出得出的数据帧每行都是基因组中的一个 SNP 及其染色体位置和 P 值从这个数据框中我想生成一个曼哈顿图其中 x 轴从 Chr 1 上的第一个 SNP 到 Chr 5 上的最后一个 SNP y 轴是

使用数据框中的另一列标记 x 轴

使用数据框中的另一列标记 x 轴 的相关文章

随机推荐

热门标签

使用数据框中的另一列标记 x 轴的相关文章