读取注释行以“##”开头的表格

2023-12-19

我正在努力使用 R 读取变体调用格式 (VCF) 的表格。 每个文件都有一些以以下开头的注释行##,然后是标题开头#.

## contig=<ID=OTU1431,length=253>
## contig=<ID=OTU915,length=253>
#CHROM  POS ID  REF ALT QUAL    FILTER  INFO    FORMAT  /home/sega/data/bwa/reads/0015.2142.fastq.q10sorted.bam
Eubacterium_ruminantium_AB008552    56  .   C   T   228 .   DP=212;AD=0,212;VDB=0;SGB=-0.693147;MQ0F=0;AC=2;AN=2;DP4=0,0,0,212;MQ=59    GT:PL   1/1:255,255,0

如何在不丢失标题的情况下读取这样的表? 使用read.table() with comment.char = "##"返回错误:"invalid 'comment.char' argument"


如果你想阅读VCF,你也可以尝试使用readVcf from VariantAnnotation在生物导体中。https://bioconductor.org/packages/release/bioc/html/VariantAnnotation.html https://bioconductor.org/packages/release/bioc/html/VariantAnnotation.html

否则,我强烈推荐fread函数于data.table包裹。 它允许您使用skip参数以允许它在找到子字符串时开始导入。

e.g.

fread("test.vcf", skip = "CHROM")

应该管用。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

读取注释行以“##”开头的表格 的相关文章

  • 按列分组的数据帧上 R 中的行之间的差异

    我希望通过 app name 获得不同版本的计数差异 我的数据集如下所示 app name version id count difference 这是数据集 data structure list app name structure c
  • 在 R 中使用 spplot 将多个绘图放在一个页面上?

    我知道如何在使用简单函数图时绘制两个图 old par lt par mfrow c 1 2 plot faithful main Faithful eruptions plot large islands main Islands yla
  • R 中的 as.numeric 有什么问题? [复制]

    这个问题在这里已经有答案了 gt X864291X8X74 1 8 0000000000 9 0000000000 10 0000000000 6 0000000000 8 0000000000 10 Levels 0 0000000000
  • 获取所有矩阵列逐元素乘积对的快速方法

    假设我有一个数字matrix set seed 1 mat lt matrix rnorm 1000 ncol 100 我想生成所有向量 它们是中所有唯一向量对的逐元素乘积的结果mat 我们如何改进下面的代码 all pairs lt t
  • 确定向量中是否存在元素的最有效方法

    我有几种算法取决于确定元素是否存在于向量中的效率 在我看来 这 in 这相当于is element 应该是最有效的 因为它只返回一个布尔值 在测试了几种方法之后 令我惊讶的是 这些方法是迄今为止效率最低的 以下是我的分析 随着向量大小的增加
  • R-在多个图的外缘绘制居中图例

    我想在具有多个绘图的设备中的绘图区域之外绘制居中图例 SO 中提出了许多关于更改 R 图中图例位置的问题 略有不同 例如 1 R 组合图的通用标题和图例 https stackoverflow com questions 8736966 r
  • 对于多项式,获取其所有极值并通过突出显示所有单调部分来绘制它

    有人问我这个有趣的问题 我认为值得将其发布在这里 因为 Stack Overflow 上还没有任何相关线程 假设我有长度为的多项式系数n vector pc 其中次数多项式n 1对于变量x可以以其原始形式表示 pc 1 pc 2 x pc
  • ggplot2 - 添加具有不同中断和标签的辅助 y 轴

    是否可以使用 ggplot2 手动向辅助 y 轴添加中断和标签 see bottom right 我希望在右侧 y 轴上有更紧凑的中断 代表条形 该图将作为基本情况 然后我将展示如何更改辅助 y 轴上的分隔符和标签 sapply c pip
  • 使用starts_with() 将 NA 替换为 0

    我正在尝试替换我的一组特定列的 NA 值tibble 这些列都以相同的前缀开头 所以我想知道是否有一种简洁的方法来使用starts with 函数从dplyr包可以让我做到这一点 我已经看到了有关 SO 的其他几个问题 但是它们都需要使用特
  • 在 R 中将时间间隔数据扩展为天数

    假设我有如下所示的数据 interval id indiv id role start date end date 1 1 A 2006 05 01 2006 06 16 2 1 B 2006 06 16 2006 10 16 3 1 A
  • 如何将 R 数据框中的多个字符列合并为单个列

    我正在处理人口普查数据 需要将四个字符列合并为一列 Example LOGRECNO STATE COUNTY TRACT BLOCK 60 01 001 021100 1053 61 01 001 021100 1054 62 01 00
  • R:编写抛硬币的随机采样程序

    假设我们有以下情况 有一枚硬币 如果它正面朝上 那么下一次抛掷正面的概率是 0 6 如果是反面 那么下一次抛掷反面的概率也是 0 6 一个班有100名学生 每个学生随机抛掷硬币几次 Student n 的最后一次抛硬币不会影响 Studen
  • R:为什么 boxplot(x,log="y") 与 boxplot(log(x)) 不同?

    delme lt exp rnorm 1000 1 5 0 3 boxplot delme log y boxplot log10 delme 为什么这两个图中的胡须不同 谢谢 阿古斯 我想说的是 在您的第一个图中 您只是将 y 轴更改为对
  • 从向量中删除元素在 R 中出现的时间量

    我想从一个向量中删除元素在另一个向量中出现的时间 就像我要减去它们一样 鉴于我想要删除的元素向量中的每个元素也存在于我想要从中删除的主向量中 a lt c A B B C C C b lt c A B C C a a in b return
  • jupyter 中的 r 图形 - 无法启动 png() 设备

    我在 Jupyter 中使用 R 但无法在笔记本本身中绘制图表 这是一个可重现的示例 set seed 123 mat as matrix x rnorm 100 y rnorm 100 plot mat 在朱皮特中 Error in pn
  • R texreg:如何选择要显示的 gof 统计信息?

    我正在使用 texreg 通过 plm 生成面板回归的输出表 我想抑制所有 gof 统计数据的输出 这不是显示 R2 adj R2 和 N 我只想显示 adj R2 有谁知道一个简单的方法来做到这一点 好吧 这实际上很简单 只需在调用中包含
  • 聚合日期时间以总结在特定条件下花费的时间

    我很困惑我应该如何继续 我下面有一些虚拟数据 Date lt as POSIXct c 2018 03 20 11 52 25 2018 03 22 12 01 44 2018 03 20 12 05 25 2018 03 20 12 10
  • stat_function 从函数生成平线

    我有以下代码 library ggplot2 f lt function x if x gt 2 1 x 0 3 else 0 graph lt ggplot data frame x c 0 10 aes x graph lt graph
  • 将所有分号替换为空格 pt2

    我尝试对 2000 多行关键字的列表运行文本分析 但它们的列出方式如下 战略 管理风格 组织 所以当我使用 tm 删除标点符号时 它就变成了 组织的战略管理风格 我认为这在某种程度上破坏了我常用术语的分析 我尝试过使用 vector lt
  • R闪亮:使用闪亮的JS从数据表中获取信息

    我想读出所有列名称以及它们在数据表中显示的顺序 由于不同的原因 我无法使用 stateSave 等选项 我对 JS 没有什么把握 但我确信用它可以完成 所以我需要你帮助我 我尝试过类似的代码片段 datatable data callbac

随机推荐

  • 填充共现矩阵

    我正在寻找一种快速有效的方法来填充共现矩阵 可以这么说 这是我正在使用的数据示例 col1 col2 a e a f a e b f c g a e d f a e a g b e c e 我想要一个以下形式的矩阵 e f g a b c
  • 如何让 Fiddler 过滤特定的 localhost 端口

    与通常的请求相反 我如何让 Fiddler 捕获请求localhost 如何阻止它获取特定端口 自从安装 IE 9 RC 以来 我收到了大量对 Mesh 的请求 http localhost 2048 V4 0i Sync Devices
  • 从 Kafka 获取消息,发送到 Rsocket 并从 React 客户端接收消息

    我正在尝试使用 Spring 云流将数据从 kafka 发送到 Rsocket 然后在 React 上表示数据 这是我的配置 Configuration public class RsocketConsumerConfiguration B
  • 如何使用数据库和 PHP 会话来存储用户的购物车?

    如何使用数据库和 PHP 会话来存储用户的购物车 我正在使用 CodeIgniter 如果有帮助的话 示例代码也很好 我建议你看看CodeIgniter 会话类 http codeigniter com user guide librari
  • WAN 上的 TCP 和 UDP 套接字服务器

    我正在尝试创建一个同时使用 TCP 和 UDP 的服务器和客户端 服务器在 LAN 设置中运行良好 但通过 WAN 传输时无法接收 UDP 消息 我相信这是因为用于发送数据的 UDP 套接字在 NAT 表中保留的时间不够长 无法返回任何信息
  • iPad/iPhone 上 CSS 提交按钮奇怪的渲染

    我注意到 如果我使用 CSS 使用半径 颜色和边框来设计按钮的样式 它们看起来不错 但在 iphone ipad ipod 中它们看起来很糟糕 不应该与 Safari 桌面中的渲染相同吗 哎呀 我刚刚自己发现了这个 只需将此行添加到您需要的
  • 无法在 Eclipse 中引用 jdbc.SQLServerDriver (ClassNotFoundException)

    我正在尝试使用 JDBC 的 MSSQL 驱动程序 我已按照有关如何将外部 JAR 文件添加到 Eclipse Windows IDE 的说明进行操作 如下所示 从这里下载安装http msdn microsoft com en us sq
  • 如何验证 SMTP 服务器

    我正在开发一个项目 我必须验证给定的 SMTP 服务器 即用户在文本框中提供详细信息 然后单击测试按钮 我想检查用户输入的服务器是否是Smtp服务器 任何想法 您可能希望通过适当的异常处理来改进此快速代码 并且还可能设置超时 如果无法连接
  • 在 typedef 结构体上使用 sizeof 运算符

    这可能是太明显的事情了 然而 尽管许多 stackoverflow 线程讨论了这个问题的不同方面 但我找不到具体的答案 typedef struct tmp unsigned int a unsigned int b tmp int mai
  • 平面图内的 rxjs 条件

    我想在 flatMap 中有一个条件来检查第一个可观察值返回的内容 如果不满足条件 我想中断并导航到不同的页面 this service getData id flatMap data gt if data return Observabl
  • 如何创建常见的 xsd 生成的 java 类

    我想生成java课程通过XSDs 我想使用 包括一个XSD文件在另一个文件中 但是当我将它们包含在另一个文件中时XSDs same java两个包中都会生成类 我也在使用maven jaxb2 plugin plugin Do 单独 又名模
  • Windows 7 中的时钟如何工作?

    我在某处读过这个答案 但我不太明白 我了解Windows每次curTimeIncrement都会增加时钟 156001 100 纳秒 与 curTimeAdjustment 的值 156001 N 但是 当使用 GetSystemTime
  • 将 PHP 项目从 Git 部署到未安装 Git 的服务器

    我需要找到一种将存储在 git 存储库中的 PHP 项目部署到临时和生产服务器的方法没有安装git 到目前为止我发现的脚本 即 Capistrano 需要目标服务器上的 Git 不幸的是 我的主机不允许这样做 到目前为止唯一的方法是通过标准
  • CSS“位置:固定”:移动缩放

    我正在尝试解决移动浏览器上的 css position fixed 属性问题 我有一个固定的div div other content here div 与CSS logo position fixed webkit backface vi
  • 如何创建加起来等于特定数字的数字列表

    我需要一些帮助 在 Prolog 中编写一个谓词 给定一个数字作为输入 返回一个列表列表 其中的数字相加 让我们调用谓词添加列表 2 它应该像这样工作 addUpList 3 P P 1 2 2 1 1 1 1 expected resul
  • 如何保存所有 Docker 镜像并复制到另一台机器

    我的系统上有以下图像列表 并且想要将所有这些图像复制到远程计算机 REPOSITORY TAG IMAGE ID CREATED VIRTUAL SIZE u14 py269 latest 6a1ec0b508b3 4 days ago 8
  • 实体设计器缺失

    正如标题所示 不知何故 实体设计器从我安装的 Visual Studio 2010 中消失了 当尝试打开 edmx 文件时 它仅在 XML 编辑器中打开它 当我选择 打开方式 时 实体设计器不会显示在列表中 它以前有用过 但我不知道我可以做
  • ViewBinding - 不同风格的布局资源

    我的风格包含与我的布局资源相同的布局资源main源集 这样一来 它就会用特定风味的风味覆盖主要风味 我在很多地方都这样做过并且效果很好 直到我介绍ViewBinding 为了准确起见 布局是 包含 在片段中的嵌套布局 结构如下 main r
  • 没有任何改变,但 eclipse egit 将文件标记为已更改

    我正在使用 eclipse egit 和 github 我发现了一些奇怪的事情 我没有更改任何内容 但 egit 将文件标记为 已更改 看图片 文件 run bat 被标记为 已更改 与 Git索引中的文件 相比 你可以看到没有什么不同 与
  • 读取注释行以“##”开头的表格

    我正在努力使用 R 读取变体调用格式 VCF 的表格 每个文件都有一些以以下开头的注释行 然后是标题开头 contig