RNA-seq——学习路线、学习经验、实战项目、学习总结

2023-11-17

1. 参考课程和博客

B站:
RNA-seq转录组数据分析入门实战
【生信技能树】转录组测序数据分析

简书:
RNA-seq(1) :用conda安装RNA-seq所需要的工具 - 简书
RNA-seq(2)-1:原始数据下载的几种方法 - 简书
RNA-seq(2)-2:下载数据 - 简书
RNA-seq(3):sra到fastq格式转换并进行质量控制 - 简书
RNA-seq(4):下载参考基因组及基因注释 - 简书
RNA-seq(5):序列比对:Hisat2 - 简书
RNA-seq(6): reads计数,合并矩阵并进行注释 - 简书
RNA-seq(7): DEseq2筛选差异表达基因并注释(bioMart) - 简书
RNA-seq(8): 探索分析结果:Data visulization - 简书
RNA-seq(9):功能富集分析 - 简书
RNA-seq(10):KEGG通路可视化:gage和pathview - 简书

上述教程大约是18年左右的,不过很是经典,能够帮助我们快速入门,之后就可以根据自己的需求进行某方面的延伸学习。

2. 前期准备

在做转录组分析实战的时候,我们需要有一个Linux系统的服务器。因为很多生信分析软件都是在Linux上,所以我们要有一些shell语言的基础,这样才能顺利安装所需要的软件。

我本人是按需租了一个阿里云的服务器,2核8G的配置,使用时是每小时8毛,不用的时候关机,每小时2毛,还是很便宜的,而且能满足练习需求。反正比在自己电脑上安装虚拟机好用!!!

关于在Linux安装软件,可以参考:RNA-seq——一、Linux软件安装

3. 上游分析

上游分析主要包括:数据集下载、数据集质量检测、质控与序列比对。
其中我做了两个上游分析的实战练习
(1)单端测序
文章:《Promiscuous RNA binding by Polycomb Repressive Complex 2》
参考:http://www.bio-info-trainee.com/2218.html

具体步骤见:
RNA-seq——二、sra数据下载、fastqc与质量控制
RNA-seq——三、使用Hisat2进行序列比对

(2)双端测序
文章:《AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors》

具体步骤见:
RNA-seq——上游分析练习(数据下载+hisat2+samtools+htseq-count)

上游分析只需要掌握流程即可,基本上都外包给公司做了,重点应该放在对结果的处理以及可视化。

3. 下游分析

下游分析基本上就脱离了服务器,一般在Rstudio上就可以完成了。需要有一定的R语言基础。

下游分析的内容很多很多,包括根据比对结果筛选差异基因,差异基因的的分析及可视化,差异基因GO富集分析及可视化,差异基因KEGG分析及可视乎等等,对于我来说,最重要的就是可视化这一部分了。一个好看的图才能牢牢抓住审稿人的眼球,好看的图真的会让人身心愉悦!!!

在这里,我只做了差异基因的火山图展示以及GO富集分析,并且加入了自己的一些理解,绘制更好看的图。
其余的可以查看Y大宽的简书,写的很好,很基础。

我的实战练习:
RNA-seq——四、根据序列比对结果筛选差异基因
RNA-seq——五、根据差异基因画火山图、在火山图上标记基因名
RNA-seq——六、差异基因富集分析(画一个上下调基因分别富集的双Y轴柱状折线图)

4. 总结

从一开始的一脸懵逼,到现在的略知一二,已经过去了一个月了。这一个月学习的动力完全是每天扣我钱的服务器给予的!!!

关于转录组的学习,我的经验就是:找几篇RNA-seq的文章,熟悉上游分析流程。上游分析做不来也没关系,重点要放在下游分析。找几个基因比对结果文件,去练习如何处理。熟悉R语言,达到所想即所得的完美状态。
最好的情况就是课题需要~我很幸运,学的东西真的派上用场了,嘿嘿。

至此,RNA-seq的学习告一段落,祝大家学习顺利~
完结撒花~❀❀❀

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

RNA-seq——学习路线、学习经验、实战项目、学习总结 的相关文章

随机推荐

  • 【核磁共振成像】部分傅里叶重建

    目录 一 部分傅里叶重建 二 部分傅里叶重建算法 2 1 填零 2 2 零差处理 一 部分傅里叶重建 在部分傅里叶采集中 数据并不是绕K空间中心对称收集的 而是K空间的一半是完全填充的 另一半只收集了一小部分数据 部分傅里叶采集所依据的原理
  • 公钥私钥证书与https

    公钥私钥 非对称加密 在一个过程中使用两个密钥 公共密钥用于加密信息 私用密钥用于解译加密的信息 这种加密方法称为非对称加密 也称为公钥加密 因为其中一个密钥是公开的 另一个私钥则需要自己保密 私钥签名 如果我用私钥加密一段数据 当然只有我
  • Request 获取请求数据(方法)

    1 Request 继承体系 2 Request 获取请求数据 2 1 请求行 String getMethod 获取请求方式 GET String getContextPath 获取虚拟目录 项目访问路径 request demo Str
  • java占用cpu最高的线程堆栈信息

    jstack找出占用cpu最高的线程堆栈信息 package com example demo public class Math public static final int initData 666 public int comput
  • Swagger3的使用

    本篇涉及到的swagger注解 速记 EnableSwagger2 开启swagger EnableOpenApi 开启swagger的Api功能 EnableWebMvc 是为了解决swagger和springmvc整合之后总是出现空指针
  • 解决idea打不开的两种可能性

    一 如果 IDEA 下载完成后打不开 可能是因为 dea64 exe vmoptions 文件中保留了之前版本的破译配置 注释或者删除就可以了 1 打开 C Users Administrator AppData Roaming JetBr
  • python stm32-STM32 上面跑Python

    By Derrick Wang 之前我一直在找一种方案 可以把stm32打造成一个真正的创客平台 因为传统的开发环境安装编译 眼花缭乱的工具栏和按钮并不实用于非电子类专业的爱好者设计出自己的作品 这样的高门槛把很多有兴趣者拒之门外 一个没有
  • UDP协议介绍

    UDP 是一个简单地面向数据报的运输层协议 进程的每个输出操作都正好产生一个 UDP 数据报 并组装成一份待发送的 IP 数据报 UDP 不提供可靠性 它把应用程序传给 IP 层的数据发送出去 但是并不保证他们能到达目的地 UDP数据报封装
  • [蓝桥杯] 分数 (Python 实现)

    题目 代码 b 0 a 1 for i in range 0 20 b a a 2 print d d b a 2 结果 1048575 524288
  • C++案例

    目录 一 while循环猜数组 二 水仙花数 三 for循环敲桌子游戏 四 9 9乘法表 五 一维数组 元素逆置 六 冒泡排序 七 封装一个函数 利用冒泡排序 实现对整型数组的升序排序 八 结构体嵌套结构体 九 结构体排序 一 while循
  • 哈夫曼编码最大编码长度

    概念 层数 叶子节点为待编码的数据 根为第0层 编码长度 第 L L L层数据编码后的长度为 L L L 节点概率 若节点为叶子节点 则概率为叶子所编码数据的频率
  • Linux INPUT 子系统实验

    按键 鼠标 键盘 触摸屏等都属于输入 input 设备 Linux 内核为此专门做了一个叫做 input子系统的框架来处理输入事件 输入设备本质上还是字符设备 只是在此基础上套上了 input 框架 用户只需要负责上报输入事件 比如按键值
  • Python3之异常with语句

    高级语法之异常with 语法 with 表达式1 as 变量1 表达式2 as 变量2 语句块 with的作用 使用于对资源进行访问的场合 确保使用过程中不管是否发生异常都会执行必须的 清理 操作 并释放资源 如 文件打开后自动关闭 线程中
  • 如何判断是否适合学编程?

    能问出这个问题的人 肯定是心里有点想学习编程 但是又担心自己不适合学习编程 学不会反而浪费时间 那么 如何判断自己是否适合学习编程呢 可以从如下几个方面入手 1 明确自己为什么要学编程 因为不同的编程语言适用的领域不一样 比如我认识一个做互
  • 使用COLMAP进行三维重构

    提示 文章写完后 目录可以自动生成 如何生成可参考右边的帮助文档 文章目录 前言 一 COLMAP是什么 二 数据准备 2 1 数据采集 2 2 数据组织 三 重构 3 1 提取图像特征 3 2 特征点匹配 3 3 稀疏重建 SfM 3 4
  • QT开发遇到的问题(1)——程序循环执行的问题

    我之前一直直接用C 开发工程 有需求需要跨平台开发 前期使用时候感觉还可以 转到工程应用时候 就遇到好多坑 今天就遇到个大坑 在开发时候需要不断循环一块代码来实现某种功能 QT不像C 那种 这个更加专业 下面我对这个问题进行详细说明分析 问
  • ResultSet详解

    结果集 ResultSet 是数据中查询结果返回的一种对象 可以说结果集是一个存储查询结果的对象 但是结果集并不仅仅具有存储的功能 他同时还具有操纵数据的功能 可能完成对数据的更新等 结果集读取数据的方法主要是getXXX 他的参数可以是整
  • docker 入门指南

    docker Docker is an open platform for developing shipping and running applications Docker enables you to separate your a
  • Matlab零基础入门

    前言 本篇是随笔 一段时间没用Matlab 简单复习了下 都是入门知识 零基础可读 文章目录 1 初步认识界面和命名 2 数据类型和矩阵 3 元胞数组和结构体 3 1 元胞数组 3 2 eye 3 3 3 magic 3 4 结构体 4 矩
  • RNA-seq——学习路线、学习经验、实战项目、学习总结

    1 参考课程和博客 B站 RNA seq转录组数据分析入门实战 生信技能树 转录组测序数据分析 简书 RNA seq 1 用conda安装RNA seq所需要的工具 简书 RNA seq 2 1 原始数据下载的几种方法 简书 RNA seq