单细胞测序基础知识

2023-11-11

构建文库在这里插入图片描述

上机测序

根据不同的荧光检测不同的碱基
在这里插入图片描述

质量控制(质控QC)

去除低质量的序列
在这里插入图片描述

表达定量

统计reads数,进而得到表达矩阵
在这里插入图片描述

标准化

让所有样本处在同一起跑线上
在这里插入图片描述

主成分分析PCA

在这里插入图片描述
图中每个点都代表一个样本,不同颜色表示不同类别,在绿色簇中,出现了一个红色样本,这个样本就是异常样本,需要进行剔除才能进行后续的分析。
在这里插入图片描述

差异表达分析与富集分析

在这里插入图片描述
找出差异表达显著的基因,对结果进行可视化。

火山图

左侧表示下调的基因,右侧表示上调的基因。横坐标为log2,表示差异的大小。纵坐标为矫正过的P Value值,用来衡量差异的显著性。

经典的热力图和MA图。

在这里插入图片描述
热力图中,每一列表示一个样本,顶端显示了分组信息和重复设置。RNA-seq的每个组别一般需要设置2~3个重复,可以减少误差,这是由于RNA分子本身不稳定的性质决定的。

每一行表示一个基因,单元格中颜色深浅表示表达量的高低。

KEGG富集分析和GO富集分析

在这里插入图片描述
对差异表达具有显著性的所有基因做一个整体来进行富集分析。
即看看这些基因涉及到了哪些代谢通路或者生物学过程。
也可以对每个具体的通路做进一步分析。
在这里插入图片描述
上述所介绍的RNA为mRNA(信使RNA),还有一些非常规的RNA,
在这里插入图片描述

RNA-seq分析软件

TopHat and Cufflinks

在这里插入图片描述
在这里插入图片描述

HISAT, StringTie and Ballgown

在这里插入图片描述

在这里插入图片描述

原始数据质控及对比

测试数据

下载地址: ftp://ftp.ccb.jhu.edu/pub/RNAseq_protocol/chrX_data.tar.gz

在这里插入图片描述
该数据集仅包含了X染色体的数据,方便测试,共12个样本,大约2G左右。

有需要的话还可以下载全染色体数据。
在这里插入图片描述

原始数据质控

fastp
下载地址:http://opengene.org/fastp/fastp
GitHub地址:https://github.com/OpenGene/fastp
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

序列比对

HISTA2

在这里插入图片描述

基因表达定量

gtf文件

在这里插入图片描述

基因表达定量

String Tie
在这里插入图片描述

质量控制

RSeQC
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

差异表达分析

Read counts矩阵
在这里插入图片描述

差异表达分析与富集分析

前期准备

差异表达基因

差异表达作图

富集分析

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

单细胞测序基础知识 的相关文章

  • RNAseq---Hisat2 标准输出中比对率信息解读

    RNA Seq Hisat2 标准输出中比对率信息解读 本文具体解释部分 xff08 一 xff09 中内容复制自Biostar内容 xff0c 后面附上我实际的例子 xff0c 二者略有不同 xff0c 整体理解上没大问题 xff0c 有
  • RNA-seq——上游分析练习(数据下载+hisat2+samtools+htseq-count)

    步骤 0 练习前准备 1 找到文章对应的数据集 2 下载数据集 3 与参考基因组进行比对 4 reads计数 5 踩过的一点小坑 写在前面 之前使用的数据是单端测序 但是现在的数据基本都是双端测序 所以又找了个双端测序的例子来练习 之前在单
  • 基因富集分析 GSEA for time-course

    基因富集分析 Gene Set Enrichment Analysis GSEA 是一种针对全基因组表达谱芯片数据的分析方法 将基因与预定义的基因集进行比较 即综合现有的对基因的定位 性质 功能 生物学意义等信息基础 构建一个分子标签数据库
  • RNA-seq——快速下载SRA数据、解决fq文件中测序质量全为 ‘?‘ 的问题

    写在前面 在学习RNA seq时 需要从网上下载公开数据集来上手分析 大部分教程都很古老 其中在ncbi中ftp的下载链接已经不存在了 甚至可以直接下载fastq文件 但是 直接下载的fastq文件做fastqc之后结果为一条直线 因为文件
  • 【学习笔记】R数据科学(R for Data Science)—第1章 使用ggplot2进行数据可视化

    1 代码模板 ggplot data
  • 生信入门(六)——单细胞分析(Seurat)

    生信入门 六 单细胞分析 Seurat 文章目录 生信入门 六 单细胞分析 Seurat 一 数据导入 1 数据来源 2 数据导入 二 标准预处理 1 QC和选择细胞进行进一步分析 2 规范化数据 3 识别高度可变的特征 特征选择 4 缩放
  • RNA-seq——上游分析练习2(数据下载+trim-galore+hisat2+samtools+featureCounts)

    目录 软件安装 新建文件夹 一 下载数据 二 质控过滤 1 数据质量检测 2 数据质量控制 3 对处理后的数据再次QC 三 序列比对 1 hisat2比对 2 flagstat检查一下结果 四 featureCounts定量 写在前面 本文
  • 【学习笔记】R数据科学(R for Data Science)—第3章 使用dplyr进行数据转换

    dplyr包是tidyverse中的一个核心R包 dplyr的5个核心函数 按值筛选观测 filter 对行进行重新排序 arrange 按名称选取变量 select 使用现有变量的函数创建新变量 mutate 将多个值总结为一个摘要统计量
  • 单细胞测序的原理及应用

    单细胞测序技术自2009年问世 2013年被Nature Methods评为年度技术以来 越来越多地被应用在科研领域 2015年至今 10X Genomics Drop seq Micro well Split seq等技术的出现 彻底降低
  • 对FPKM/RPKM以及TPM的理解

    虽然一直在接触FPKM RPKM以及TPM 但是仅仅是知道它们是转录本定量的值 并未究其根本 最近看了几篇文献 对其深层次的含义有了进一步的理解 因而在这里记录下来 首先来看FPKM RPKM的起源 在RNA Seq中 最简单的定量基因表达
  • 单细胞专题

    单细胞测序的概念 上节我们讲到转录组测序相关内容 这期将继续学习单细胞转录组测序 单细胞测序技术 single cell sequencing 简单来说 就是在单个细胞水平上 对基因组 转录组及表观基因组进行测序分析的技术 图1 图1 单细
  • R包安装记录

    因为重复安装会引起某些问题以及冲突 已安装 library pheatmap 热图包 library corrplot 热图包 library Hmisc library dplyr
  • 阿里云E-HPC+i4p大内存实例,加速寻因生物单细胞数据分析效率

    寻因生物是一家专注于单细胞技术的生物科技企业 拥有自主研发的微孔芯片与油包水双技术单细胞捕获平台 致力于通过国产高通量单细胞全链条产品及服务 将单细胞技术普适化应用于临床及药物研发 助力相关疾病研究 单细胞测序技术呼唤更高计算性能 自单细胞
  • 单细胞测序基础知识

    构建文库 上机测序 根据不同的荧光检测不同的碱基 质量控制 质控QC 去除低质量的序列 表达定量 统计reads数 进而得到表达矩阵 标准化 让所有样本处在同一起跑线上 主成分分析PCA 图中每个点都代表一个样本 不同颜色表示不同类别 在绿
  • 新版TCGA的突变数据SNP下载和整理

    关于TCGAbiolinks包的学习前面一共介绍了5篇推文 今天继续学习如何使用TCGAbiolinks下载和整理MAF格式的突变数据 之前的TCGA的MAF文件是可以下载的 每个癌症包含4种软件得到的突变文件 后来就改版了 不让你随便下载
  • RNA-seq——学习路线、学习经验、实战项目、学习总结

    1 参考课程和博客 B站 RNA seq转录组数据分析入门实战 生信技能树 转录组测序数据分析 简书 RNA seq 1 用conda安装RNA seq所需要的工具 简书 RNA seq 2 1 原始数据下载的几种方法 简书 RNA seq
  • 生信入门(二)——使用limma、Glimma和edgeR,RNA-seq数据分析

    生信入门 二 使用limma Glimma和edgeR RNA seq数据分析 文章目录 生信入门 二 使用limma Glimma和edgeR RNA seq数据分析 一 简介 二 数据背景 三 初始配置 四 数据整合 1 数据下载 2
  • 单细胞测序数据的降维方法和细胞亚型鉴定聚类方法

    单细胞测序数据的降维方法和细胞亚型鉴定聚类方法是单细胞转录组分析中常用的技术 下面是对这些方法的总结 1 降维方法 主成分分析 PCA PCA是一种常用的降维方法 通过线性变换将高维数据转化为低维表示 保留最大的方差 t SNE t SNE
  • RNA-seq——四、根据序列比对结果筛选差异基因

    目录 1 合并矩阵并进行注释 2 筛选差异基因 DESeq2 写在前面 经过前面的一系列分析 我们得到了几个counts数据 接下来就需要根据这些数据来进行分析 本文使用Rstudio 从序列比对结果中筛选出差异基因 目的是 根据不同基因的
  • 肿瘤的转录调控:Cell子刊揭示原发性肝癌中转录因子活性的全基因组图谱|国自然热点

    转录调控的研究历史比较长 相关研究在近十年来仍一直增长 也是近年来高分文章的焦点之一 在2023年最佳国自然 中标 研究热点 转录调控中标率高达189 作为国自然热点之一的肿瘤微环境的研究在近几年也一直处于上升趋势 转录调控在肿瘤发生 发展

随机推荐

  • 英特尔服务器新消息,英特尔10nm Ice Lake-SP服务器处理器或将延迟到2021年第一季度...

    10月6日消息 据报道 服务器品牌供应链表示 第四季度出货存在较大变数 出货量将有所疲软 主要是业界内称英特尔 10nm 的 Ice Lake SP 服务器处理器到明年第一季度才能出炉 导致大部分品牌出货推迟 报道指出 英特尔已通知其合作伙
  • 【算法基础】时间复杂度和空间复杂度

    目录 1 算法的评价 2 算法复杂度 2 1 时间复杂度 Time Complexity 2 1 1 如何计算时间复杂度 2 1 2 常见的时间复杂度类别与示例 2 2 空间复杂度 2 2 1 如何计算空间复杂度 2 2 2 常见的空间复杂
  • 以太坊控制台基本命令行操作

    创建账户 personal newAccount 123456 输入的参数是该账户对应的密码 账户地址保存在主目录下的keystore目录中 查询系统中的账户 personal listAccounts eth accounts 这个两个命
  • 数据库连接池和数据库工具类DBUtils

    连接池 连接池 其实就是一个容器 在这个容器当中存放着多个连接对象 当系统开始运行时 可以让系统提前创建多个连接对象 放到容器中 连接池 当客户端需要连接对象时 可以从连接池中申请一个连接 去访问数据库 当该连接使用完毕时 不再释放归还给系
  • java学习脚印:java工具早使用——Maven与Junit

    java学习脚印 java工具早使用 Maven与Junit 敏捷版博客 写在前面 正所谓 工欲善其事 必先利其器 当项目越来越大的时候 项目管理和测试开始变得困难 借助成熟的工具是关键 个人赞同 一开始创建项目或者编写代码时 就提倡内置项
  • java获取文件编码方式

    1 引入依赖
  • Springboot1.5.9集成Redis(单实例与分片集群)

    springboot集成redis只需要看懂RedisAutoConfiguration类即可 惯例先上pom start
  • FastDFS,Redis,Solr,ActiveMQ核心技术整合六

    02 商品分类选择 分析 前端js 03 商品分类选择 分析 数据库 JJTree渲染过程解析 parent id为0就是父节点 is parent为1说明下面有子节点 state1正常2删除 tree组件有ztree 异步控件树每个节点都
  • PyG-GAT-Cora(在Cora数据集上应用GAT做节点分类)

    文章目录 model py main py 参数设置 运行图 model py import torch nn as nn from torch geometric nn import GATConv import torch nn fun
  • 《基于 Vue 组件库 的 Webpack5 配置》5.js代码混淆

    使用 插件 webpack obfuscator 需要安装 npm install save dev javascript obfuscator webpack obfuscator package json 的配置如下 const Web
  • TextView设置字重

  • 类中找不到main方法请将main方法定义为public static void main. 否则 JavaFX 应用程序类必须扩展javafx.application.Application

    使用elcipise编写java程序时遇到这样的错误 错误在类中找不到main方法 请将main方法定义为 public static void main String args 否则 JavaFX 应用程序类必须扩展javafx appl
  • 浮点运算量FLOPs与算力单位FLOPS

    概念 FLOPS 注意全大写 是floating point operations per second的缩写 意指每秒浮点运算次数 理解为计算速度 是一个衡量硬件性能的指标 FLOPs 注意s小写 是floating point oper
  • react组件封装input框的防抖处理

    防抖 防抖就是指触发事件后在 n 秒内函数只能执行一次 如果在 n 秒内又触发了事件 则会重新计算函数执行时间 项目中有些input框需要做防抖处理 防止每次输入都要发起请求或者做判断 也就是减少触发频率 以便提高性能或者说避免资源浪费 防
  • 使用Python,OpenCV截取图片ROI

    使用Python OpenCV截取图片ROI 1 效果图 2 步骤 2 1 环境配置 2 2 原理 3 源码 参考 这篇博客将介绍如何使用Python OpenCV截取图片ROI Regions Of Interests 即我们感兴趣的部分
  • 做機器人一定很貴嗎?用塑膠也能做出捏起小鋼珠的機器手臂

    本文转载至 http buzzorange com techorange 2014 12 16 robot 人體的手部運動到底有多精密呢 看看機器人的研發過程就知道了 大部份的工程師都會坦承 模擬人類的手部動作 是研發機器人過程中最大的關卡
  • 内网怎么使用https

    内网环境下面需要用到https 通过浏览器调起相机的功能 一般情况下我们使用openssl证书生成即可 有个问题是生成的证书 通过nginx配置以后 在客户端谷歌浏览器chrome访问的时候会有个不安全的提示 这里使用mkcert进行处理
  • typedef的用法小总结

    首先是typedef历史遗留问题 经常看到很多人写结构体就写 typedef struct A int a int b A A b 我就一直很纳闷 为什么不直接写 A b呢 昨天查资料才知道 原来这个是因为c语言遗留下来的 在C语言中 结构
  • Notepad++配合Finger Text提高Verilog编码效率

    文章目录 简介 安装方法 使用方法 配置文件的获取 简介 做FPGA开发的一般都不会选择IDE环境自带的编辑器 一是因为界面不够美观 二是自动补全功能不够完善 而我经常使用的是Notepad 支持Verilog语法高亮和最基本的关键字补全
  • 单细胞测序基础知识

    构建文库 上机测序 根据不同的荧光检测不同的碱基 质量控制 质控QC 去除低质量的序列 表达定量 统计reads数 进而得到表达矩阵 标准化 让所有样本处在同一起跑线上 主成分分析PCA 图中每个点都代表一个样本 不同颜色表示不同类别 在绿