RNA-seq——三、使用Hisat2进行序列比对

2023-11-06

为什么要比对:https://www.jianshu.com/p/681e02e7f9af

Jimmy老师主要演示了四种比对工具,分别为hisat2、subjunc、bowtie2、bwa。除了subjunc能够直接生成bam文件外,这些软件的用法都很相似。需要根据自己的需求来选择对应的软件。
这里以使用hisat2为例。

1. 下载对应的index

为什么要下载index:https://www.jianshu.com/p/681e02e7f9af

Hisat2官网下载:https://daehwankimlab.github.io/hisat2/download/
挂了梯子,使用edge浏览器,一小时左右下完。之后再导入服务器,再花一小时,淦!!!
在这里插入图片描述
解压文件

tar -zxvf hg19_genome.tar.gz
tar -zxvf mm10_genome.tar.gz

看一下里面都有什么
在这里插入图片描述

2. 序列比对

# 激活环境
conda activate rna

# -p 设置线程
# -x 参考基因组索引文件的前缀
# -U 单端测序文件
# -S 指定输出文件
hisat2 -p 10 -x ./hg19/genome -U ../sra/SRR957677.fastq.gz -S ../aligned/SRR957677.sam

在这里插入图片描述

一次比对多个文件的例子:https://www.jianshu.com/p/479c7b576e6f

# 双端测序数据
# -t 显示比对时间
# -1 双端测序结果的第一个文件
# -2 双端测序结果的第二个文件

# 人的比对
for ((i=56;i<=58;i++));do hisat2 -t -x /mnt/f/rna_seq/data/reference/index/hg19/genome -1 /mnt/f/rna_seq/data/SRR35899${i}.sra_1.fastq.gz -2 /mnt/f/rna_seq/data/SRR35899${i}.sra_2.fastq.gz -S SRR35899${i}.sam ;done
# 小鼠比对
$ for ((i=59;i<=62;i++));do hisat2 -t -x /mnt/f/rna_seq/data/reference/index/mm10/genome -1 /mnt/f/rna_seq/data/SRR35899${i}.sra_1.fastq.gz -2 /mnt/f/rna_seq/data/SRR35899${i}.sra_2.fastq.gz -S SRR35899${i}.sam; done

3. samtools:将sam文件转为bam文件

sort 默认按照染色体位置进行排序
-n 根据read名进行排序
-t 根据TAG进行排序
参考:https://www.jianshu.com/p/681e02e7f9af

详细参数解释见使用SAMtools将SAM文件转换为BAM文件、排序、建立索引

# -O 设置最终输出的文件格式,可以是bam,sam或者cram,默认为bam
# -@ 设置线程,加快运行速度
# -o 设置最终排序后的输出文件名
samtools sort -O bam -@ 2 -o SRR957677.bam SRR957677.sam

# 必须对bam文件进行默认情况下的排序后,才能进行index,否则会报错。
# 建立索引后将产生后缀为.bai的文件,用于快速的随机处理。
samtools index SRR957677.bam
samtools view SRR957677.bam | less -SN

# 给出BAM文件的比对结果
samtools flagstat -@ 2 SRR957677.bam

在这里插入图片描述
在这里插入图片描述
这里比对结果异常,应该是使用的数据为单端测序数据造成的。

一次转换多个文件的例子:https://www.jianshu.com/p/479c7b576e6f

# 首先将比对后的sam文件转换成bam文件
# 利用的是samtools的view选项,参数-S 输入sam文件;参数-b 指定输出的文件为bam;最后重定向写入bam文件
$ cd mnt/f/rna_seq/aligned
$ for ((i=56;i<=62;i++));do samtools view -S SRR35899${i}.sam -b > SRR35899${i}.bam;done
# 将所有的bam文件按默认的染色体位置进行排序
$ for ((i=56;i<=62;i++));do samtools sort SRR35899${i}.bam -o SRR35899${i}_sorted.bam;done
# 将所有的排序文件建立索引,索引文件.bai后缀
$ for ((i=56;i<=62;i++));do samtools index SRR35899${i}_sorted.bam;done

Jimmy老师的方法

ls *.sam | while read id; do (samtools sort -O bam -@ 5 -o $(basename ${id} ".sam").bam ${id}); done
ls *.bam | xargs -i samtools index {}

ls *.bam | while read id; do (samtools flagstat -@ 10 $id > $(basename ${id} ".bam").flagstat); done

4. 将bam文件载入IGV

将bam文件导入igv,在chr位置输入":10039",结果如图。看不懂…
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

RNA-seq——三、使用Hisat2进行序列比对 的相关文章

  • 安装Hisat2

    一 xff08 MobaXterm Personal xff09 安装aspera 首先进行预编译解压安装 xff1a mkdir Biosofts unzip hisat2 2 2 1 Linux x86 64 zip d Biosoft
  • RNAseq---Hisat2 标准输出中比对率信息解读

    RNA Seq Hisat2 标准输出中比对率信息解读 本文具体解释部分 xff08 一 xff09 中内容复制自Biostar内容 xff0c 后面附上我实际的例子 xff0c 二者略有不同 xff0c 整体理解上没大问题 xff0c 有
  • hisat2-build

    The hisat2 build indexer 使用dna文件构建索引 xff0c 输出后缀为 1 ht2到 8 ht2的八个文件 如果索引较大 xff0c 后缀改为ht2l 后续的比对需要这八个文件 xff0c 并且一旦索引构建成功 x
  • RNA-Seq比对软件HISAT2的用法

    参考网址 xff1a http blog sciencenet cn blog 759995 990471 html 感谢原作者 转载于 https www cnblogs com lmt921108 p 7442839 html
  • edger和deseq2_转录组分析(二)Hisat2+DESeq2/EdgeR

    一 序列比对 在2016年的一篇综述A survey of best practices for RNA seq data analysis xff0c 提到目前有三种RNA数据分析的策略 那个时候的工具也主要用的是TopHat STAR和
  • Hisat2 Bowtie2比对结果解读

    Bowtie的中文意思是 xff1a 领结 xff0c 蝴蝶结 Bowtie2用户手册 xff1a http bowtie bio sourceforge net bowtie2 manual shtml 在看比对结果前需要了解三个概念 x
  • 用rs_lidar雷达跑lio_sam

    1 准备工作 imu绑定串口有线连接雷达并能用rviz显示雷达点云用两个imu标定包标定imu在完成第二步必要的工作后 xff0c 配置LIO SAM config 下的params yaml参数 xff0c 更改之前建议备份在旁边复制粘贴
  • SAM-Segment Anything Model进行单张图片的检测记录

    一 代码和模型下载 下载链接 GitHub facebookresearch segment anything 将代码下载并解压到一个没有中文的路径下 页面往下滑找到需要下载的模型 nbsp 这里提供了三个模型 vit b的大小是358m
  • lio-sam中点云地图保存

    在 src save map srv 中有如下的定义 float32 resolution string destination bool success 注意 下面指的是feedback xff0c 接下来看save map这个服务是如何
  • lio-sam中雅克比推导

    lio sam做的是scan map xff0c 点变到世界系下 xff0c 优化本帧在是世界系下的位姿 xff0c 和loam有所不同 符号 xff1a 本帧特征点云 xff08 相对机体系 xff09 P s c a
  • 视觉大模型 | SEEM:比SAM更强!

    作者 派派星 编辑 CVHub 点击下方卡片 xff0c 关注 自动驾驶之心 公众号 ADAS巨卷干货 xff0c 即可获取 点击进入 自动驾驶之心 语义分割 技术交流群 Title Segment Everything Everywher
  • 记录编译测试LVI-SAM遇到的问题(附测试数据百度云下载链接)

    在测试开源的视觉 雷达 IMU紧耦合的工作LVI SAM时遇到一些问题 xff0c 在此记录 xff1a 参考博客 xff1a https blog csdn net learning tortosie article details 11
  • LIO-SAM中的mapOptmization

    前言 最近在学习LIO SAM源码的时候 xff0c 发现LIO SAM这套代码调用了比较多库的内置API xff0c 里面涉及的一些细节也比较多 xff0c 整个工程还是比较清晰的 xff0c 值得学习 xff01 LIO SAM这个框架
  • 用rs_lidar雷达跑lio_sam

    1 准备工作 imu绑定串口有线连接雷达并能用rviz显示雷达点云用两个imu标定包标定imu在完成第二步必要的工作后 xff0c 配置LIO SAM config 下的params yaml参数 xff0c 更改之前建议备份在旁边复制粘贴
  • 【SLAM】LVI-SAM解析——综述

    LVI SAM可以认为是LIO SAM和VINS MONO的合体 xff0c 在此基础上的修改不大 github xff1a https github com TixiaoShan LVI SAM paper LVI SAM Tightly
  • 一键分块,轻松拼图!使用Segment Anything让你的设计更加高效!

    目录 第一步 第二步 第三步 第四步 如果你是一名设计师或者摄影爱好者 那么你一定经常需要将图片分割成不同的块 以便在不同的场合下使用 例如 在网页设计中 你可能需要将图片分割成不同的块 以便在不同的区域中使用 而分块的难度不小 需要一定的
  • 生信学习——基于R的可视化习题30个(附详细答案解读)

    题目目录 一 基础绘图 1 对RNAseq expr的每一列绘制boxplot图 2 对RNAseq expr的每一列绘制density图 3 对RNAseq expr的每一列绘制条形图 4 对RNAseq expr的每一列取log2后重新
  • 利用SAM实现自动标注

    利用SAM实现自动标注 目录 利用SAM实现自动标注 一 下载安装 1 1 下载SAM Tool和SAM 1 2 下载SAM模型文件 1 3 安装SAM 二 配置项目 三 提取信息 四 获得SAM onnx文件 五 标注 六 格式转换 6
  • FunctionName 的调用容器没有响应

    尝试端口转发docker化的Lambda to my 本地主机使用命令 sam local start api docker network host 每次尝试访问 Lambda 时都会出错 FunctionName 的调用容器没有响应 也
  • Sam 在 intellij 中构建:错误:JavaMavenWorkflow:MavenBuild - 'utf-8' 编解码器无法解码位置 150889 中的字节 0xbb:无效的起始字节

    我正在使用带有 Spring Boot 应用程序的 aws 无服务器架构 当我在 intellij 中使用 sam build 构建项目时 出现以下错误 Building codeuri runtime java11 metadata fu

随机推荐