RNA-seq流程学习笔记（4）-使用FastQC软件对fastq格式的数据进行质量控制

2023-05-16

今天开始学习使用FastQC软件对范例SRA测序文件的质量进行分析。
主要参考文章：
RNA-seq(3):sra到fastq格式转换并进行质量控制
转录组入门（3）：了解fastq测序数据
用FastQC检查二代测序原始数据的质量
FastQC Tutorial & FAQ
从零开始完整学习全基因组测序（WGS）数据分析：第2节 FASTA和FASTQ

数据质控是一个综合的评价标准，其中主要指标为碱基质量与含量分布，如果这两个指标合格，后面大部分指标都可以通过；如果这两项不合格，其余都会受到影响。
其中一些指标并不适合所有数据，例如DNA测序数据与RNA测序数据之间的差异等，要根据具体数据类型具体分析。

FASTA的介绍
我们接触到的序列信息有FASTA和FASTQ两种格式，这是存储核苷酸序列信息（DNA序列）或者蛋白质序列信息最常使用的两种纯文本文件。
FASTA存的都是已经排列好的序列（如参考序列），起源于一款“FASTA”的比对软件，之后便以FASTA作为这种存储有顺序的序列数据的文件后缀，文件后缀除了.fasta之外，也常用.fa或者.fa.gz（gz压缩），包括常用的参考基因组序列、蛋白质序列、编码DNA序列（coding DNA sequence，简称CDS）、转录本序列等文件。
FASTA文件主要由两个部分构成：序列头信息（有时包括一些其它的描述信息）和具体的序列数据。序列头信息独占一行，以大于号（>）开头作为识别标记，其中除了记录该条序列的名字之外，有时候还会接上其它的信息。紧接的下一行是具体的序列内容，直到另一行碰到另一个大于号（>）开头的新序列或者文件末尾。

>gene_00284728 length=231;type=dna
GAGAACTGATTCTGTTACCGCAGGGCATTCGGATGTGCTAAGGTAGTAATCCATTATAAGTAACATG
CGCGGAATATCCGGGAGGTCATAGTCGTAATGCATAATTATTCCCTCCCTCAGAAGGACTCCCTTGC
GAGACGCCAATACCAAAGACTTTCGTAAGCTGGAACGATTGGACGGCCCAACCGGGGGGAGTCGGCT
ATACGTCTGATTGCTACGCCTGGACTTCTCTT

FASTQ的介绍
FASTQ存的则是产生自测序仪的原始测序数据，它由测序的图像数据转换过来，也是文本文件，文件大小依照不同的测序量（或测序深度）而有很大差异，小的可能只有几M，大的则常常有几十G上百G，文件后缀通常都是.fastq，.fq或者.fq.gz（gz压缩）。
FASTQ有独特的格式：每四行成为一个独立的单元，我们称之为read。具体的格式描述如下：
第一行：以‘@’开头，是这一条read的名字，这个字符串是根据测序时的状态信息转换过来的，中间不会有空格，它是每一条read的唯一标识符，同一份FASTQ文件中不会重复出现，甚至不同的FASTQ文件里也不会有重复；
第二行：测序read的序列，由A，C，G，T和N这五种字母构成，这也是我们真正关心的DNA序列，N代表的是测序时那些无法被识别出来的碱基；
第三行：以‘+’开头，在旧版的FASTQ文件中会直接重复第一行的信息，但现在一般什么也不加（节省存储空间）；
第四行：测序read的质量值，这个和第二行的碱基信息一样重要，它描述的是每个测序碱基的可靠程度，用ASCII码表示。

@DJB775P1:248:D0MDGACXX:7:1202:12362:49613
TGCTTACTCTGCGTTGATACCACTGCTTAGATCGGAAGAGCACACGTCTGAA
+
JJJJJIIJJJJJJHIHHHGHFFFFFFCEEEEEDBD?DDDDDDBDDDABDDCA
@DJB775P1:248:D0MDGACXX:7:1202:12782:49716
CTCTGCGTTGATACCACTGCTTACTCTGCGTTGATACCACTGCTTAGATCGG
+
IIIIIIIIIIIIIIIHHHHHHFFFFFFEECCCCBCECCCCCCCCCCCCCCCC

FastQC的介绍
FastQC aims to provide a simple way to do some quality control checks on raw sequence data coming from high throughput sequencing pipelines. It provides a modular set of analyses which you can use to give a quick impression of whether your data has any problems of which you should be aware before doing any further analysis.
The main functions of FastQC are：

Import of data from BAM, SAM or FastQ files (any variant)
Providing a quick overview to tell you in which areas there may be
problems
Summary graphs and tables to quickly assess your data
Export of results to an HTML based permanent report
Offline operation to allow automated generation of reports without running the interactive application

1. 首先进入待分析数据的目录中，查看需要分析的SRA名称：

xiaomotong@VirtualBox: cd ~/Public/SRA/sra
xiaomotong@VirtualBox:~/Public/SRA/sra$ ll
总用量 2262608
drwxrwxr-x 2 xiaomotong xiaomotong       4096 5月  17 15:04 ./
drwxrwxr-x 8 xiaomotong xiaomotong       4096 5月  14 15:40 ../
-rw-rw-r-- 1 xiaomotong xiaomotong 1057984832 5月  14 12:02 SRR390728_1.fastq
-rw-rw-r-- 1 xiaomotong xiaomotong 1057984832 5月  14 12:02 SRR390728_2.fastq
-rw-rw-r-- 1 xiaomotong xiaomotong  195044834 5月  14 11:40 SRR390728.sra
-rw-rw-r-- 1 xiaomotong xiaomotong    5867015 5月  14 11:40 SRR390728.sra.vdbcache

2. 使用fastqc命令对目标数据进行分析：

xiaomotong@VirtualBox:~/Public/SRA/sra$ fastqc -t 3 ./SRR390728_1.fastq
Started analysis of SRR390728_1.fastq
Approx 5% complete for SRR390728_1.fastq
。。。。。。
Approx 95% complete for SRR390728_1.fastq
Analysis complete for SRR390728_1.fastq

fastqc 命令的用法

fastqc [-o output dir] [--(no)extract] [-f fastq|bam|sam] [-c contaminant file] seqfile1 .. seqfileN

#参数：
-o --outdir 输出目录，需自己创建目录
–(no)extract 是否解压输出文件，默认是自动解压缩zip文件。加上–noextract不解压文件。
-f 指定输入文件的类型，支持fastq|bam|sam三种格式的文件，默认自动识别。
-t --threads选择程序运行的线程数，即同时处理的文件数目。
-c --contaminants，污染物选项，输入的是一个文件，格式是Name [Tab] Sequence，里面是可能的污染序列，如果有这个选项，FastQC会在计算时候评估污染的情况，并在统计的时候进行分析，一般用不到。

fastqc -o .  *.fastq.gz
#将所有的数据进行质控，得到zip的压缩文件和html文件
# -o后面有空格，表示输出到当前文件夹，之后的.后也有空格

3. 质控结果解读
处理后产生.html和fastqc.zip两个文件，如下：

xiaomotong@VirtualBox:~/Public/SRA/sra$ ll
总用量 2264264
drwxrwxr-x 2 xiaomotong xiaomotong       4096 5月  19 15:21 ./
drwxrwxr-x 8 xiaomotong xiaomotong       4096 5月  14 15:40 ../
-rw-rw-r-- 1 xiaomotong xiaomotong 1057984832 5月  14 12:02 SRR390728_1.fastq
-rw-rw-r-- 1 xiaomotong xiaomotong     526256 5月  19 15:20 SRR390728_1_fastqc.html
-rw-rw-r-- 1 xiaomotong xiaomotong     316413 5月  19 15:20 SRR390728_1_fastqc.zip

报告保存在.html文件中，可以调用Linux系统上的firefox命令来打开(参考文章)

xiaomotong@VirtualBox:~/Public/SRA/sra$ firefox ./SRR390728_1_fastqc.html

3.1. FastQC报告概览
**Basic Statistics**

左边是目录概要，可以点击想要看的结果，右边会跳转到特定详细的可视化结果。绿色代表“通过”，黄色代表“警告”，红色代表“不通过，失败”。
右边是Basic Statistics，基本的数据统计包括文件名，文件类型，编码形式，总的序列数，质量差的序列，序列平均长度，GC含量。

3.2. 每个位置的碱基测序质量
在这里插入图片描述

Per base sequence quality，每个read各位置碱基的测序质量。横轴是碱基的位置，纵轴是质量分数，Quality
score=-10log10p（p代表错误率），所以当质量分数为40的时候，p就是0.0001，质量算高了。红色线代表中位数，蓝色线代表平均数，黄色线是25%-75%区间，触须是10%-90%区间（黄色和触须我不是特别明白）。若任一位置的下四分位数低于10或者中位数低于25，出现“警告”；若任一位置的下四分位数低于5或者中位数低于20，出现“失败，Fail”。通常认为从第二个碱基开始，平均每个碱基的测序质量boxplot下四分位线在30分以上，则认为测序质量非常好。

3.3. 每条序列的测序质量分数
在这里插入图片描述

Per sequence quality scores，reads质量的分布，当峰值小于27时，警告；当峰值小于20时，fail。
一般认为，90%的reads测序质量在35分以上，则认为该测序质量非常好。

3.4. ATGC碱基在各个位置上的分布
在这里插入图片描述

Per base sequence content，对所有reads的每一个位置，统计ATCG四种碱基的分布，横轴为位置，纵轴为碱基含量，正常情况下每个位置每种碱基出现的概率是相近的，四条线应该平行且相近。当部分位置碱基的比例出现bias时，即四条线在某些位置纷乱交织，往往提示我们有overrepresented sequence的污染。本结果前10个位置，每种碱基频率有略微的差别，说明可能有污染。当任一位置的A/T比例与G/C比例相差超过10%，报"WARN"；当任一位置的A/T比例与G/C比例相差超过20%，报"FAIL"。
一般来说，AT含量高于CG含量，AT含量约28%，CG含量约22%。由于测序问题，通常第一二位置的碱基测序质量比较低，ATCG含量也不正常。这种情况不影响数据质量，如果实在介意，可在后续bowtie mapping的时候将前两个碱基去掉。

3.5. GC碱基在各个位置上的分布
在这里插入图片描述

Per Sequence GC Content，统计reads的平均GC含量的分布。红线是实际情况，蓝线是理论分布（正态分布，均值不一定在50%，而是由平均GC含量推断的）。曲线形状的偏差往往是由于文库的污染或是部分reads构成的子集有偏差（overrepresented reads）。形状接近正态但偏离理论分布的情况提示我们可能有系统偏差。偏离理论分布的reads超过15%时，报"WARN"；偏离理论分布的reads超过30%时，报"FAIL"。

3.6. N碱基（无法识别的碱基）在各个位置上的分布
在这里插入图片描述

Per base N content，当测序仪器不能辨别某条reads的某个位置到底是什么碱基时，就会产生“N”，统计N的比率。正常情况下，N值非常小,所以图上常常看到一条直线，但放大Y轴之后会发现还是有N的存在，这不算问题。当Y轴在0%-100%的范围内也能看到“鼓包”时，说明测序系统出了问题。当任意位置的N的比例超过5%，报"WARN"；当任意位置的N的比例超过20%，报"FAIL"。

3.7. reads长度分布
在这里插入图片描述

Sequence Length Distribution，reads长度分布，当reads长度不一致时报"WARN"；当有长度为0的read时报“FAIL”。

3.8. 序列不同拷贝数的水平
在这里插入图片描述

Sequence Duplication Levels，统计不同拷贝数的reads的频率。测序深度越高，越容易产生一定程度的duplication，这是正常的现象，但如果duplication的程度很高，就提示我们可能有bias的存在。****横坐标是duplication的次数，纵坐标是duplicated reads的数目，以unique reads的总数作为100%。如果原始数据很大（事实往往如此），做这样的统计将非常慢，所以fastqc中用fq数据的前200,000条reads统计其在全部数据中的重复情况。如果重复数目大于等于10的reads被合并统计，我们会看到最右侧略有上扬。当非unique的reads占总数的比例大于20%时，报"WARN"；当非unique的reads占总数的比例大于50%时，报"FAIL“。

3.9. 一条序列的重复数（此条选取参考文章中数据）
在这里插入图片描述

Overrepresented sequences，一条序列的重复数，因为一个转录组中有非常多的转录本，一条序列再怎么多也不太会占整个转录组的一小部分（比如1%），如果出现这种情况，不是这种转录本巨量表达，就是样品被污染。这个模块列出来大于全部转录组1%的reads序列，但是因为用的是前200,000条，所以其实参考意义不大，完全可以忽略。
如果有某个序列大量出现，就叫做over-represented。fastqc的标准是占全部reads的0.1%以上。和上面的duplicate analysis一样，为了计算方便，只取了fq数据的前200,000条reads进行统计，所以有可能over-represented reads不在里面。而且大于75bp的reads也是只取50bp。如果命令行中加入了-c contaminant file，出现的over-represented sequence会从contaminant_file里面找匹配的hit（至少20bp且最多一个mismatch），可以给我们一些线索。

3.10. 接头含量
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

RNA-seq流程学习笔记（4）-使用FastQC软件对fastq格式的数据进行质量控制的相关文章

RNA-seq数据分析(HISAT2+featureCounts+StringTie)

RNA seq数据分析简介1 生物基础1 1 中心法则1 2 RNA seq Protocol1 3 RNA seq总的路线图 2 数据分析2 1 前期准备2 1 1 创建目录 amp 安装conda2 1 2 常用文件格式简介 2 2
RNA-seq数据上游分析流程（从原始数据开始）

数据分析的基本思路 xff08 1 xff09 从ncbi的geo或者其它数据库中查找自己感兴趣的RNASeq数据 xff0c 至少要求给出如下信息 xff1a xff08 2 xff09 对芯片数据进行质量控制评价及处理 xff08 如果
RNA-seq：转录组数据分析处理（上）

RNA seq xff1a 转录组数据分析处理 xff08 上 xff09 目录 RNA seq xff1a 转录组数据分析处理 xff08 上 xff09 一流程概括二准备工作1 fastq测序文件2 注释文件和基因组文件的获取三
RNA-seq流程学习笔记（15）-使用DESeq2进行差异基因分析

参考文章 xff1a RNA seq 7 DEseq2筛选差异表达基因并注释转录组入门7 用DESeq2进行差异表达分析 Analyzing RNA seq data with DESeq2 RNA seq练习第三部分 xff08 DE
RNA-seq流程学习笔记（18）- Heatmap图

1 准备感兴趣基因集 xff08 genelist xff09 并进行适当格式转换 span class token comment 对基因list进行整理 span span class token comment 设置工作目录 span
【1】RNA-seq 测序数据之Hisat2比对-featurecount计算-EdgeR分析

一拿到测序数据之后 xff0c 首先选择参考基因组及比对工具进行比对 1 Hisat比对 xff1a xff08 6个G的测序数据耗时20分钟 xff0c 比对率78 4 xff09 物种差异度大导致比对率低 build index h
Shell中表示数字跨度的几种方式

在Shell脚本中如果要输出数字为0 20中3的倍数可以使用下面三种方式来完成方式一 i 0 i lt 20 i 3 for i 0 i lt 20 i 3 do echo i done 方式二 0 20 3 for i in 0 2
为什么 Seq.iter 和 Seq.map 慢这么多？

考虑 F 中的以下代码 let n 10000000 let arr Array init n fun gt 0 let rec buildList n acc i if i n then acc else buildList n 0 ac
为什么我不能使用 seq 强制执行 IO 操作？

鉴于此代码片段 someFunction x print x seq 1 main do print someFunction test 为什么不print x print test代码什么时候执行 seq test 1 如果我把它替换为e
仅第一次记录显示，除非强制处置

我正在使用 vs 2017 写一个netcoreapp2 0库并使用 UnitTest 项目对其进行测试 XUnit 和 NUnit 给出相同的结果我注意到除非我强行处置我的Serilog记录器只有第一行会出现在Seq 这是我的两堂课
R重复序列每次重复加1

我的 R 类作业簿有一个问题我无法解决我需要编写一个使用rep 创建一个包含元素1 2 3 4 2 3 4 5 3 4 5 6 4 5 6 7的向量的R命令它似乎是一个 1 到 4 的重复序列重复 4 次并且每次重复时向起始元素
在 R 循环中使用开始值和结束值的示例

我试图在一系列值之间进行采样作为 R 中较大循环的一部分随着循环进行到每一行j 我想对给定值之间的一个数字进行采样start列和中给出的值end列将该值放入sampled该行的列结果应该是这样的 ID start end sampl
Bash 脚本将文本文件与文件名中的特定子字符串连接起来

在某个目录中我有许多包含一堆文本文件的目录我正在尝试编写一个脚本仅将每个目录中文件名中包含字符串 R1 的文件连接到该特定目录中的一个文件中以及将那些文件名中包含 R2 的文件连接到另一个这是我写的但它不起作用 bin bash
seq 和 == 运算符的神秘行为。精度问题？

我遇到了该函数的某种奇怪或只是出乎意料的行为seq 创建简单序列时某些值无法与运算符正确匹配看这个最小的例子 my seq lt seq 0 0 4 len 5 table my seq ok returns 0 0 1 0 2
F# 中序列表达式的类型推断

我想我不太明白 F 如何推断序列表达式中的类型以及为什么即使我直接从 seq 指定元素的类型也无法正确识别类型在以下 F 代码中我们有一个基类 A 和两个派生类 B 和 C type A x member a X x type B x
将项目添加到不可变的 Seq

假设我有一个字符串序列作为输入我想获得一个新的不可变的Seq它由输入的元素和一个项目组成 c 以下是我发现有效的两种方法 assert Seq a b c Seq a b Seq c 这个的问题是似乎实例化了一个临时序列 Seq c 只
R seq函数产生错误的结果[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案似乎我的一台机器为 seq 函数产生了错误的结果而另一台机器或在线 r fiddle http www r fiddle org
seq 和 list 之间的区别

Clojure 语言中的 seq 和列表有什么区别 list 1 2 3 gt 1 2 3 seq 1 2 3 gt 1 2 3 这两种形式似乎被评估为相同的结果首先它们可能看起来相同但实际上并非如此 class list 1 2 3
如何生成具有指定增量步骤的列表？

如何生成具有指定增量步长例如 2 的向量例如我如何生成以下内容 0 2 4 6 8 10 执行中seq 1 10 1 做什么1 10做您可以更改最后一个参数seq i e by 任意大小的台阶 gt a vector of even
当其长度不是所需总长度的倍数时重复向量

我有一个 1666 行的数据框我想添加一列其中包含重复序列1 5与使用cut 进行交叉验证它看起来像这样 Y x1 x2 Id1 1 15 3 6 1 0 1 1 2 2 2 0 05 3 3 3 0 45 2 8 4 1 85 3

随机推荐

巧用nautilus解决ubuntu文件目录、文件的权限问题

有没有遇到这样的烦恼 xff1a 有时想给一个目录的文件进行增删 xff0c 单是因为权限问题 xff0c 无法进行操作虽然可以用sudo 43 命令行来解决 xff0c 但是觉得操作起来还是不太方便如果可以跟平时一样 xff0c 在图
Android 屏幕旋转的处理

1 不做任何处理的情况下如果没有针对性地做任何处理的话 xff0c 默认情况下 xff0c 当用户手机的重力感应器打开后 xff0c 旋转屏幕方向 xff0c 会导致app的当前activity发生onDestroy gt onCreat
Python txt文件创建，写入，保存

实现功能介绍 xff1a 新建文本文件 xff0c 以日期命名 xff0c 判断如果存在则后缀加1 xff0c 循环按行写入内容并保存首先指定要写入文件的内容 xff0c 并使用 datetime 模块获取当前日期然后 xff0c 我们
Centos 7 / 8 安装oracle jdk 和jenkins步骤及一些常见的问题。

废话不多说 xff0c 先说自己总结的经验 xff0c 不推荐用解压jdk压缩包 xff08 jdk 8u321 linux x64 tar gz xff09 然后配置环境变量的方式安装java 最好用yum包安装java或者是用rpm方式
adobe xd_如何在Adobe XD中创建Finance App UI设计

adobe xd 在本教程中 xff0c 您将学习如何在Adobe XD中创建财务应用程序设计 xff0c 以及 xff08 更重要的是 xff09 如何轻松对其UI的各个部分进行动画处理您将在本Adobe XD教程中学到什么如何在Ad
今天配置问题总结2023/3.13

关于SSL库的安装 openssl和openssl devel Ubuntu系统上首先安装openssl sudo apt get install openssl 在安装openssl devel sudo apt get install
分辨率PPI(Pixel Per Inch)与DPI(Dot Per Inch)

分辨率PPI与DPI xff0c 关于这个问题 xff0c 现在很多人容易混淆 xff0c 现摘录几份资料图像分辨率所使用的单位是PPI xff08 Pixel Per Inch xff09 xff0c 意思是 xff1a 在图像中每英寸
【自动驾驶技术】优达学城无人驾驶工程师学习笔记（七）——计算机视觉基础

计算机视觉基础目录前言颜色选择 xff08 Color Selection xff09 理论基础代码实践区域筛选 xff08 Region Masking xff09 理论基础代码实践 Canny边缘检测问题背景Canny边缘检测原理代
Fragment 实现底部导航栏的切换（Kotlin语言）

整个过程 1 整体结构图与效果图2 引入Kotlin扩展插件3 创建各页面布局文件 xff08 1 xff09 底端导航栏 xff08 2 xff09 信息 xff0c 联系人 xff0c 个人信息界面信息页面布局 xff1a 联系人界面
关于onNewIntent()

普通的Activity之间的跳转 xff0c 如 xff1a 新打开一个Activity xff0c 此时的执行顺序是0nCreat xff0d onStart xff0d onResume 此时使用Intent 传递数据没有问题 xff0
Java中的纳秒

Java中的纳秒前言JDK8获取纳秒的问题JDK9之后获取纳秒的问题参考资料前言最近在使用InfluxDB保存系统的操作日志 xff0c 如果在插入的时候不指定time字段 xff0c influxDB会默认设置time xff0c
IDEA中Maven项目连接MySQL数据库

分两步进行 xff08 前提是MySql数据库及数据库表存在 xff0c 且有访问的必要权限 xff09 xff1a 第一步 xff1a pom xml中引入jdbc依赖 xff1a lt dependency gt lt groupId
WIN10使用网线远程连接的一种方法

一主要内容 xff1a 用一根网线连接笔记本和台式机 xff0c 笔记本作为控制端 xff0c 台式机作为被控端 xff0c 通过笔记本对台式机进行远程控制二实现步骤 xff1a 1 将控制端笔记本和被控端台式机用网线连接 2 在被控
MLT框架简介与部分命令解析

本文仅仅做为一篇入门文章 xff0c 带领大家认识一下MLT这个框架 xff08 库 xff09 一简介 MLT的英文全称为MLT Multimedia Frameword xff0c 翻译过来为MLT多媒体框架该框架国内用的人比较少
Android Studio2.3.3开启Kotlin开发模式以及模式切换

最近在用Kotlin语言开发Android xff0c 本文主要将两个方面 1 总结下配置上遇到的注意事项 2 方便快捷的使用kotlin开发Android 项目首先要先安装Kotlin插件 xff0c 到Setting的Plugin中搜
如何在Adobe XD中创建酒店预订UI设计

在本教程中 xff0c 您将学习如何在Adobe XD中创建酒店预订应用程序设计作为Adobe XD xff0c 我们不仅可以构建静态设计 xff0c 还可以构建更多内容我们将构建一个交互式的动画原型首先 xff0c 我们将介绍任何酒
记录一下docker 部署nginx遇到的坑

启动后 xff0c docker ps 无法查看到对应的进程使用 docker ps a查看到后 xff0c 用docker logs f pid 前4位查看到日志文件 xff0c 里面说未找到日志文件 xff08 若能成功访问 xff0
SQL Server 2016、2014、2012、2008、2005版本清除用户名和密码

SQL Server Management Studio 2016 删除文件 xff1a C Users username AppData Roaming Microsoft SQL Server Management Studio 13
[刷机交流]谷歌Pixel 2手机刷入官方安卓10工厂镜像图文详细教程

一下载Pixel 2安卓10工厂镜像刷机包工厂镜像刷机包下载官方地址如下 https dl google com dl android aosp walleye qq3a 200805 001 factory a3367352 zip
RNA-seq流程学习笔记（4）-使用FastQC软件对fastq格式的数据进行质量控制

今天开始学习使用FastQC软件对范例SRA测序文件的质量进行分析主要参考文章 xff1a RNA seq 3 sra到fastq格式转换并进行质量控制转录组入门 xff08 3 xff09 xff1a 了解fastq测序数据用Fas

RNA-seq流程学习笔记（4）-使用FastQC软件对fastq格式的数据进行质量控制

RNA-seq流程学习笔记（4）-使用FastQC软件对fastq格式的数据进行质量控制 的相关文章

随机推荐

热门标签

RNA-seq流程学习笔记（4）-使用FastQC软件对fastq格式的数据进行质量控制的相关文章