非时间数据的 R 运行平均值

2023-12-03

This is the plot I'm having now. enter image description here

它是从这段代码生成的:

ggplot(data1, aes(x=POS,y=DIFF,colour=GT)) + 
  geom_point() +
  facet_grid(~ CHROM,scales="free_x",space="free_x") + 
  theme(strip.text.x = element_text(size=40),
        strip.background = element_rect(color='lightblue',fill='lightblue'),
        legend.position="top",
        legend.title = element_text(size=40,colour="lightblue"),
        legend.text = element_text(size=40),
        legend.key.size = unit(2.5, "cm")) +
  guides(fill = guide_legend(title.position="top",
                             title = "Legend:GT='REF'+'ALT'"),
         shape = guide_legend(override.aes=list(size=10))) +
  scale_y_log10(breaks=trans_breaks("log10", function(x) 10^x, n=10)) + 
  scale_x_continuous(breaks = pretty_breaks(n=3)) +
  geom_line(stat = "hline",
            yintercept = "mean",
            size = 1)

最后一行,geom_line为每个面板创建平均线。

但现在我想在每个面板中获得更具体的运行平均值。

i.e. If panel1('chr01')x 轴范围从 0 到 100,000,000,我想要每个 1,000,000 范围的平均值。

mean1 = mean(x=0 to x=1,000,000)

mean2 = mean(x=1,000,001 to x=2,000,000)

提供运行平均值的一种方法是geom_smooth()使用loess局部回归方法。为了演示我提出的解决方案,我使用 R 函数创建了一个假基因组数据集。您可以调整span的参数geom_smooth使运行平均值更平滑(更接近 1.0)或更粗糙(更接近 1/数据点数量)。

# Create example data.
set.seed(27182)

y1 = rnorm(10000) + 
     c(rep(0, 1000), dnorm(seq(-2, 5, length.out=8000)) * 3, rep(0, 1000))
y2 = c(rnorm(2000), rnorm(1000, mean=1.5), rnorm(1000, mean=-1, sd=2), 
       rnorm(2000, sd=2))
y3 = rnorm(4000)
pos = c(sort(runif(10000, min=0, max=1e8)),
        sort(runif(6000,  min=0, max=6e7)),
        sort(runif(4000,  min=0, max=4e7)))
chr = rep(c("chr01", "chr02", "chr03"), c(10000, 6000, 4000))

data1 = data.frame(CHROM=chr, POS=pos, DIFF=c(y1, y2, y3))

# Plot.
p = ggplot(data1, aes(x=POS, y=DIFF)) +
    geom_point(alpha=0.1, size=1.5) +
    geom_smooth(colour="darkgoldenrod1", size=1.5, method="loess", degree=0, 
        span=0.1, se=FALSE) +
    scale_x_continuous(breaks=seq(1e7, 3e8, 1e7), 
        labels=paste(seq(10, 300, 10)), expand=c(0, 0)) +
    xlab("Position, Megabases") +
    theme(axis.text.x=element_text(size=8)) +
    facet_grid(. ~ CHROM, scales="free", space="free")

ggsave(filename="plot_1.png", plot=p, width=10, height=5, dpi=150)

enter image description here

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

非时间数据的 R 运行平均值 的相关文章

  • 如何动态地将 sliderInput 添加到闪亮的应用程序中?

    使用闪亮 我上传一个 csv 文件 并根据列名称 我需要向 ui 添加滑块 sidebarPanel fileInput file1 Upload CSV File to Create a Model accept c text csv t
  • R 中 SVG 图形的最佳设备? [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我想从 R 导出 SVG 图形 似乎有两种选择 RSvgDevice 和 Cairo 有人可以对这些包发表评论吗 是默认的还是明显比另一个
  • ggplot 中的 ggsave() for python 不保存

    我已将 ggplot 导入到 python 中 并运行以下脚本 希望 ggsave 实际上将我的绘图保存在某处 但它似乎实际上并未将任何内容写入 png 文件以供以后使用 当我在解释器中将其作为 p 返回时 该图就会返回 但我必须手动保存它
  • rvest 函数 html_nodes 返回 {xml_nodeset (0)}

    我正在尝试抓取以下网站的数据框 http stats nba com game 0041700404 playbyplay http stats nba com game 0041700404 playbyplay 我想创建一个表格 其中包
  • 我如何查看 quantmod 包中所有可用的数据系列?

    如何显示可用的所有报价 数据系列的列表 例如使用雅虎的 getSymbols 我不知道有什么办法 TTR包有一个功能 stockSymbols 下载 NYSE AMEX 和 NASDAQ 的所有当前代码 它试图将它们采用雅虎可接受的格式 但
  • R 数据结构的运算效率

    我想知道是否有任何关于操作效率的文档R 特别是那些与数据操作相关的 例如 我认为向数据框添加列是有效的 因为我猜您只是向链接列表添加一个元素 我想添加行会更慢 因为向量保存在数组中C level你必须分配一个新的长度数组n 1并将所有元素复
  • 将整个包传递给雪簇

    我正在尝试并行化 使用snow parLapply 一些依赖于包 即除snow 调用函数中引用的对象parLapply必须使用显式传递给集群clusterExport 有没有办法将整个包传递到集群 而不必显式命名每个函数 包括用户函数调用的
  • R:改变堆积条形图的颜色

    library ggplot2 df2 lt data frame supp rep c VC OJ each 3 dose rep c D0 5 D1 D2 2 len c 6 8 15 33 4 2 10 29 5 head df2 g
  • 安装 2.15 后 ggplot2 中的 alpha 通道不起作用

    更新到 R 2 15 后 ggplot 中的 alpha 通道似乎不再起作用 plot rnorm 100 rnorm 100 bg cc000055 pch 21 工作得很好但是 qplot rnorm 100 rnorm 100 col
  • 如何在R中分离两个图?

    每当我运行这段代码时 第一个图就会简单地覆盖前一个图 R中有没有办法分开得到两个图 plot pc title main abc xlab xx ylab yy plot pcs title main sdf xlab sdf ylab x
  • 如何在R中实现countifs函数(excel)

    我有一个包含 100000 行数据的数据集 我尝试做一些countifExcel 中的操作 但速度慢得惊人 所以我想知道R中是否可以完成这种操作 基本上 我想根据多个条件进行计数 例如 我可以指望职业和性别 row sex occupati
  • devtools::test() 有效,但 devtools::check() 无效。为什么?

    我正在测试this https github com beanumber etlR 包 以下三件事就可以正常工作 devtools test devtools test file tests testthat R Travis CI 与 R
  • 如何使用 ggplotGrob 创建自定义图例?

    我发布了一个question https stackoverflow com questions 29174774 how to create legend text elements being different colours in
  • R:根据列名部分匹配计算行平均值

    我有一个看起来像这样的表 er er 1 as as 1 as 2 rt op a 1 6 90 8 6 4 87 b 1 8 56 7 5 5 9 c 8 7 6 4 5 9 6 d 1 0 8 6 4 3 6 e 9 7 2 4 3 8
  • ggplot 的每个方面都有不同的 `geom_hline()`

    这个问题在这里已经有答案了 library tidyverse ggplot mpg aes cty hwy geom point facet grid year fl geom hline yintercept mean mpg hwy
  • 使用行内 r 代码作为 R markdown 标头的一部分

    我希望使用行 R 代码作为 r markdown 文件中标头的一部分 然而 当我编织文件时 标题上使用的字体是不同的 如何确保字体相同 下面是一个简单的例子 r 1 1 Header 您可以将内容括在反引号中以表示内联 r 代码 如下所示
  • 将动物园转换为数据框

    我转换了一个zoo time series到数据框中R日期成为数据框的索引 有没有办法将日期表示为数据框中的普通列 monthly df lt data frame monthly zoo head monthly zoo head mon
  • ggplot geom_bar - 条形太宽

    对于这个非信息性的标题 我感到很抱歉 gt y read csv textConnection scan sep n what raw org art type length 191 gk Finish short 4 147 ik Att
  • 导入 .sav 时出现警告/错误

    我工作中有两个版本的 SPSS SPSS 11 在 Windows XP 上运行 SPSS 20 在 Linux 上运行 SPSS 的两个副本都工作正常 使用任一版本的 SPSS 创建的文件在其他版本的 SPSS 上打开时不会出现任何问题
  • autoplot.microbenchmark 实际绘制了什么?

    根据文档 microbenchmark autoplot 使用 ggplot2 生成更清晰的微基准计时图 凉爽的 让我们尝试一下示例代码 library ggplot2 tm lt microbenchmark rchisq 100 0 r

随机推荐

  • 如何使 Eclipse Partstack 在最后一个部分关闭时不消失?

    我正在开发一个项目 该项目的主窗口由 mpartstack 组成 我在其中动态地从另一个部分添加部分 问题是 当最后一部分关闭时 mpartstack 消失 而另一部分占用所有空间 当我尝试添加新零件时 什么也没有发生 我尝试通过尝试添加新
  • 当 C 按值传递时,我的数组如何修改?

    我用 C 编写了一个简单的程序来检查两个单词是否是字谜 我的问题是 如果我传递 word one 和 word two 作为参数 这是否意味着我没有修改原始数组 我认为我正在有效地处理这些未归还的副本 这意味着我不应该能够将它们与我的 eq
  • 如何获取芒果的承运商详细信息?

    有没有API可以告诉我们手机是哪个运营商的 例如 沃达丰 祖国 当前国家 详细信息 我在 Microsoft Phone Net NetworkInformation 中找不到此类内容 我是否遗漏了某些内容 感谢帮助 您可以通过静态属性获取
  • 自定义类的比较重载方法

    我想重载个人类的比较方法 例如 如果我这样写 object1 function compare a b if a gt attribute b gt attribute return 0 else return a gt attribute
  • 用换行符绑定文本

    我绑定到带有换行符的字符串 例如 Hello nWorld 在我的模型中 现在我想使用显示模板中的值 x 但换行符未正确显示 聚合物是否为输出提供任何支持 br 用于换行 现在你最好的选择是创建一个Nl2br PolymerElement
  • Windows Phone 7 中的媒体播放器

    我正在使用 Windows Phone 7 中的媒体播放器来播放手机歌曲集中的音乐 但是当它播放音乐时 它们将是一个例外 并且错误指出 尚未调用 Framework Dispatcher Update 定期调用 Framework Disp
  • 代码不等待用户输入?

    我必须为我的计算机科学课做一个项目 问题是 图书馆的读者最多可以借三本书 因此 赞助人有一个名字和最多三本书 一本书有作者和标题 设计并实现两个类 Patron 和 Book 来表示这些对象和以下行为 客户端可以实例化一本书 并带有标题和作
  • 为什么在 Scala 中对 Option.getOrElse 的返回值使用隐式转换时类型推断失败?

    例如我有一堂课Value和一个隐式函数将字符串转换为值 case class Value v String implicit def strToValue s String Value Value s 这是一个有方法返回值的特征 trait
  • Swift:在另一个 UIView 下进行 UIView 的 hitTest

    我在RedOrGreenUIView 之上有TransparentUIView TransparentUIView 附加了一个 UILongPressGestureRecognizer 一旦用户开始长时间触摸它 我就会检查此 LongPre
  • 窗口向左无闪烁扩展(调整大小)

    假设您有一个可以向左展开以显示其他控件的表单 折叠 扩展 在 Delphi 中实现这一点的最简单方法是使用alRight作为所有控件的主要锚点 而不是alLeft 然后只需调整表单的宽度和 X 坐标即可 您可以设置Width and Lef
  • 如何防止 UpdatePanel 中 GridView 分页的回发

    我已在 UpdatePanel 中的 GridView 中应用分页 当我前进到下一个结果集时 我的页面上会发生完整回发 我需要在 web config 文件或代码中进行一些修改吗 ASPX
  • MySQL:从查询中获取列名或别名

    我不是要求SHOW COLUMNS命令 我想创建一个与 heidisql 类似的应用程序 您可以在其中指定 SQL 查询 并在执行时返回一个结果集 其中包含表示查询结果的行和列 结果集中的列名称应与 SQL 查询中定义的所选列匹配 在我的P
  • 如何使用 jQuery 在单击时显示 div,隐藏其他 div?

    我想在我的页面上有一个文本区域 显示一个 div 并隐藏其他 div 假设有 8 个其他 div 单击时 我希望显示所选的 div 并隐藏当前的 div 和其他 div 有一个简单的解决方案吗 可以构建 显示当前单击的 div 隐藏先前单击
  • IE8 上的 YUI:参数在 dom-style.js 上无效

    我已经到处问过这个问题 但仍然没有得到任何反馈 这让我抓狂 我们在正在使用的门户网站 Liferay 6 2 上使用了一些 Alloy UI 小部件 并且在除 IE8 之外的所有浏览器中一切正常 由于某种原因 我收到一条错误消息 涉及有关
  • Python TypeError:传递给对象的非空格式字符串.__format__

    我最近遇到了这个 TypeError 异常 我发现它很难调试 我最终将其简化为这个小测试用例 gt gt gt 20 format b hi Traceback most recent call last File
  • 无法在 VS Code 上启动 Jupyter 笔记本

    在 64 位 Windows10 上使用最新的 miniconda VS Code 全新安装 VS Code 后 我无法再从其中启动 jupyter 笔记本 当我第一次尝试创建新的 jupyter 文件时 安装了 Python 扩展ipyk
  • JavaFX 打开新窗口

    看着这段代码他们展示了一种在登录后显示新窗口的方法 当用户名和密码正确时 它将打开新对话框 我想要单击按钮打开新对话框 而不检查用户名和密码 如果您只想要一个按钮来打开一个新窗口 那么可以使用以下方法 btnOpenNewWindow se
  • MongoDb 对日期范围的唯一约束

    我将 MongoDb 与 Mongoskin 一起使用 在集合中我正在保存事件 在其他字段中 这些事件有开始和结束 保存为Dates在 Mongodb 中 events start Date1 end Date2 在此集合中插入新文档时 我
  • 递归ftp下载,然后解压gz文件

    我有一个多步骤文件下载过程 我想在 R 中执行 我已经完成了中间步骤 但没有第一步和第三步 STEP 1 Recursively find all the files at an ftp site ftp prism oregonstate
  • 非时间数据的 R 运行平均值

    This is the plot I m having now 它是从这段代码生成的 ggplot data1 aes x POS y DIFF colour GT geom point facet grid CHROM scales fr