总结实验室对转录组及lncRNA数据分析的思路

2023-05-16

继师兄详细地讲述这个思路之后，我进行一个归纳总结（师兄说，首先要建立一个思想上的流程，再来纠结软件、命令这些细节！！！！！！）

首先你得了解 raw_data / 参考基因组 .fa / 注释文件 .gtf / 索引文件 indexes （通过hisat2-build
,根据基因组文件新建索引文件）

raw_data 原始数据

参考基因组 .fa 1——— ————— —————— ——————— ———————— ————— —————

2————— —————— ——————— —————— ————————

3———— ————— ———— —————— ——————— ————— ——— —

注释文件 .gtf 1chr

基因转录本1/2/3…… 内含子……

索引文件


从公司拿到的raw_data开始：

一、 **质控数据** （fastqc）——根据质控数据的好坏，进行筛选，数据不行的用trim去掉（具体什么软件也没听清楚）

二、 **再次质控** ，最后的数据叫clean_data，此时的数据里都是短 reads

三、hisat2 把这些reads **比对到基因组上** （这个过程要包括输出文件的格式转换和排序）

四、进行 **序列的初组装** （把上面比对上的零散的reads 组装起来）

五、把所有的 **转录本合并**

————————————— ———————— —————————————— ————— 这就是合并的转录本

—— —— ———— —— —— —— —— —— —————— —— 这就是组装的，散的但是有序

—— —— —— ——— ——— ———— ———— —— —— —— ——

相当于把散的转录本 取并集

现在就可以对这些 转录本进行定量 ，FPKM差异 / htseq-
count，（一个是计算reads落在merge上的概率；一个是计数——但这都是把表达量通过reads来量化）

如果做转录组分析，就拿着这个定量的结果进行分析，lncRNA就继续，怎么得到lincRNA？？

lincRNA 基因间——长链——非编码

一、基因间

把merge的结果和参考基因组（上面的基因，我们已知）比较

参考基因组 ———— ———— —————— ——————————————

merge **— ——— —— —— ———— ———————— **

如上，黄色部分为基因间的，截取下来

二、长链

long >= 200 exon >= 2（外显子为什么要大于等于2，这个算法不清楚）

三、非编码 （也就是能转录，但是不能翻译成蛋白质——那就是把序列预测蛋白，如果蛋白库里有，那就不是我们的目标）

位置 >>>> 序列 >>>> 蛋白

这里有很多办法，或者cpc……

一段序列有6中氨基酸序列的可能性


得到lincRNA后，做什么？进行差异分析，富集通路，也就是找lincRNA和功能的关系

**一、 功能预测**

cis—— 往往都是从上下游去找基因，然后找这些基因的共性

trans——找lincRNA和已知gene之间的相关性，横向纵向都很多，全部都要两两对比，| 相关 | >0.7/0.8 ， p < 0.05/0.01

然后从相关性系数，去找规律

**二、 差异分析** （上调，下调）

**三、 QTL** （把lincRNA拿到QTL上去对应性状）

但是整个过程都只是一个概率，去预测lincRNA，那为什么有的实验室lincRNA能发高分，能做一套完整的流程，我们只能停留在找到lincRNA,做一个定量，这个问题比较重要！！！！

在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

lncRNA

总结实验室对转录组及

数据分析的思路

总结实验室对转录组及lncRNA数据分析的思路的相关文章

filter和sessionListener实现session超时退出功能，过滤掉轮询请求

filter和sessionListener实现session超时退出功能 xff0c 过滤掉轮询请求 1 requestFilter span class token keyword public span span class toke
MVC web项目中引入jquery插件

MVC web项目中引入jquery插件 1 下载jquery https jquery com 看到这样的文档 xff0c 直接CTRL 43 S保存到自己的文件夹 2 将文件夹中的js文件直接拖拽导入到项目中的web文件下 xff0c
27（牛客Top100）-62. 不同路径

一个机器人位于一个 m x n 网格的左上角 xff08 起始点在下图中标记为 Start xff09 机器人每次只能向下或者向右移动一步机器人试图达到网格的右下角 xff08 在下图中标记为 Finish xff09 问总共有多少条不同
28（牛客Top100）-64. 最小路径和

给定一个包含非负整数的 m x n 网格 grid xff0c 请找出一条从左上角到右下角的路径 xff0c 使得路径上的数字总和为最小说明 xff1a 每次只能向下或者向右移动一步思路 xff1a 动态规划 1 状态定义初始化二维数
30（牛客Top100）-72. 编辑距离

给你两个单词 word1 和 word2 xff0c 请你计算出将 word1 转换成 word2 所使用的最少操作数你可以对一个单词进行如下三种操作 xff1a 插入一个字符删除一个字符替换一个字符思路 xff1a 动态规划 1
29（牛客Top100）-70.爬楼梯

假设你正在爬楼梯需要 n 阶你才能到达楼顶每次你可以爬 1 或 2 个台阶你有多少种不同的方法可以爬到楼顶呢 xff1f 注意 xff1a 给定 n 是一个正整数思路 xff1a 方法1 xff1a 动态规划 span class
31（牛客Top100）-75.颜色分类

给定一个包含红色白色和蓝色 xff0c 一共 n 个元素的数组 xff0c 原地对它们进行排序 xff0c 使得相同颜色的元素相邻 xff0c 并按照红色白色蓝色顺序排列此题中 xff0c 我们使用整数 0 1 和 2 分别表示红色
spring boot面试总结

spring boot xff08 1 xff09 新建springboot项目 xff08 2 xff09 springboot整合mybatis实现增删改查 1 概述 1 1 springboot介绍 Spring Boot 是 Spr
[Android] 以singleInstance模式加载的Activity怎么接收以Bundle方式传递过来的参数 By onNewIntent() but not onResum

问题来自这儿 xff0c Bundle在接收时未更新 xff0c http blog csdn net dadoneo article details 8164058 虽然可以暂时解决问题 xff0c 但并未说到根本原因 xff0c 下面就
33（牛客Top100）-78.子集

给你一个整数数组 nums xff0c 数组中的元素互不相同返回该数组所有可能的子集 xff08 幂集 xff09 解集不能包含重复的子集你可以按任意顺序返回解集思路方法1 xff1a 二进制排序 xff08 字典排序 x
34（牛客Top100）-79.单词搜索

给定一个 m x n 二维字符网格 board 和一个字符串单词 word 如果 word 存在于网格中 xff0c 返回 true xff1b 否则 xff0c 返回 false 单词必须按照字母顺序 xff0c 通过相邻的单元格内的字母
35（牛客Top100）-84.柱状图中最大的矩形

给定 n 个非负整数 xff0c 用来表示柱状图中各个柱子的高度每个柱子彼此相邻 xff0c 且宽度为 1 求在该柱状图中 xff0c 能够勾勒出来的矩形的最大面积思路 xff1a 方法1 xff1a 栈 43 邵兵 span clas
36（牛客Top100）-85.最大矩阵

给定一个仅包含 0 和 1 大小为 rows x cols 的二维二进制矩阵 xff0c 找出只包含 1 的最大矩形 xff0c 并返回其面积思路 xff1a 先抄下来 xff0c 我也不懂方法1 xff1a 单调栈 span clas
新建springboot项目

1 新建项目 xff0c 选择Spring Initializr 2 直接finish xff0c 然后就等待下载各种包 xff0c 大约10分钟左右 3 包变绿后 xff0c pom xml中导入web依赖 span class toke
springboot整合mybatis实现增删改查

1 新建springboot项目 xff0c 连接数据库 2 导入依赖 span class token generics span class token punctuation lt span dependencies span cla
37（牛客Top100）-94.二叉树的中序遍历

给定一个二叉树的根节点 root xff0c 返回它的中序遍历思路 xff1a 方法1 xff1a 递归按照访问左子树根节点右子树的方式遍历这棵树 span class token keyword public span spa
38（牛客Top100）-96.不同的二叉搜索树

给你一个整数 n xff0c 求恰由 n 个节点组成且节点值从 1 到 n 互不相同的二叉搜索树有多少种 xff1f 返回满足题意的二叉搜索树的种数思路 xff1a 1 动态规划动态方程 xff1a span class token
40（牛客Top100）-101.对称二叉树

给定一个二叉树 xff0c 检查它是否是镜像对称的思路 xff1a 方法1 xff1a 递归 span class token keyword public span span class token keyword boolean sp
39（牛客Top100）-98.验证二叉搜索树

给你一个二叉树的根节点 root xff0c 判断其是否是一个有效的二叉搜索树有效二叉搜索树定义如下 xff1a 节点的左子树只包含小于当前节点的数节点的右子树只包含大于当前节点的数所有左子树和右子树自身必须也是二叉搜索树

随机推荐

Excel合并计算完成多表格数据汇总求和

Excel合并计算完成多表格数据汇总求和多表格数据汇总可以使用透视表 xff0c 使用函数 xff0c 今天读书屋OFFICE网陈飞老师分享一个通过合并计算完成多表格数据汇总方法 xff0c 合并计算分为两种情况 xff0c 一种情况是
Google Datastore 学习记录

由于在google app engine 使用google cloud sql 是要收费的 xff0c 于是学习一下google提供的免费的非关系型数据库datastore 它的特点有 xff1a No planned downtime x
41（牛客Top100）-104.二叉树的最大深度

给定一个二叉树 xff0c 找出其最大深度二叉树的深度为根节点到最远叶子节点的最长路径上的节点数说明叶子节点是指没有子节点的节点思路 xff1a 方法1 xff1a 深度优先搜索 span class token keyword p
42（牛客Top100）-102.二叉树的层序遍历

给你一个二叉树 xff0c 请你返回其按层序遍历得到的节点值 xff08 即逐层地 xff0c 从左到右访问所有节点 xff09 思路 xff1a 用队列按层次遍历方法1 xff1a 广度优先搜索 span class token k
MySQL总结

1 数据库基础知识 1 1 什么是MySQL MySQL是一个关系型数据库管理系统 xff0c MySQL是最好的 RDBMS Relational Database Management System xff0c 关系数据库管理系统应用
45（牛客Top100）-121.买卖股票的最优时间

给定一个数组 prices xff0c 它的第 i 个元素 prices i 表示一支给定股票第 i 天的价格你只能选择某一天买入这只股票 xff0c 并选择在未来的某一个不同的日子卖出该股票设计一个算法来计算你所能获取的最大利
47（牛客Top100）-128.最长连续子序列

给定一个未排序的整数数组 nums xff0c 找出数字连续的最长序列 xff08 不要求序列元素在原数组中连续 xff09 的长度请你设计并实现时间复杂度为 O n 的算法解决此问题思路 xff1a 方法1 xff1a 利用set集合
48（牛客Top100）-136.只出现一次的数字

给定一个非空整数数组 xff0c 除了某个元素只出现一次以外 xff0c 其余每个元素均出现两次找出那个只出现了一次的元素说明 xff1a 你的算法应该具有线性时间复杂度你可以不使用额外空间来实现吗 xff1f 思路 xff1a 方法
stc-isp 51单片机烧录软件的安装

stc isp的获取百度网盘链接 xff1a https pan baidu com s 1vDTN2o8ffvczzNQGfyjHng 提取码 xff1a gdzf stc isp安装此软件是绿色软件 xff0c 双击直接运行即可开
实习日记。。。

第一周第一天7 11 周一入职第一天 xff0c 一直在数据库建表 xff0c 写了二十来个 xff0c 还有领了工卡和饭卡 xff0c 带我的老大哥请我恰了一顿 xff0c 晚上下班的时候 xff0c 因为舍不得我的电脑所以多待了一个
TCP/IP协议栈Lwip的设计与实现：之三

接上文 xff1a TCP IP协议栈Lwip的设计与实现 xff1a 之二龙赤子的博客 CSDN博客目录 10 xff0e TCP处理 10 1概述 10 2数据结构 10 3序列号计算 10 4数据入队和传输 10 5接收段数据 1
c++——Unicode编码和多字节编码的区别

1 VS项目属性不同字符集的区别单字节字符集 xff1a 顾名思义 xff0c 单字节字符集就是用一个字节表示一个字符 xff0c 简称SBCS ASCII就是单字节字符集在编码的过程中char类型就是单字节编码 Unicode字符集
蓝桥杯例题切割矩形

include lt bits stdc 43 43 h gt using namespace std int ans 61 0 int f int a int b ans 43 43 if a 61 61 1 amp amp b 61 6
c++——Unicode、UTF-8、UTF-16

计算机起源于美国 xff0c 上个世纪 xff0c 他们对英语字符与二进制位之间的关系做了统一规定 xff0c 并制定了一套字符编码规则 xff0c 这套编码规则被称为ASCII编码 ASCII 编码一共定义了128个字符的编码规则 xff
spark MLlib之分类和回归

MLlib支持多种方法用来处理二分分类 xff0c 多类分类以及回归分析 xff0c 下表列出了问题及对应的处理方法 xff1a 问题类型支持的方法二分分类现行SVM xff0c 逻辑回归 xff0c 决策树 xff0c 贝叶斯多类
生产者消费者模型详解以及实现

生产者消费者模式我们先来看看什么是生产者消费者模式 xff0c 生产者消费者模式是程序设计中非常常见的一种设计模式 xff0c 被广泛运用在解耦消息队列等场景在现实世界中 xff0c 我们把生产商品的一方称为生产者 xff0c 把消费
高频面试点：静态链接库与动态链接库

库是写好的现有的 xff0c 成熟的 xff0c 可以复用的代码现实中每个程序都要依赖很多基础的底层库 xff0c 不可能每个人的代码都从零开始 xff0c 因此库的存在意义非同寻常本质上来说库是一种可执行代码的二进制形式 xff0c
cordova打包app热更新问题

定义 xff1a 基于 cordova 框架能将web应用 js html css 图片等打包成 App 当 App 在终端上安装后 xff0c 不需要重新下载app xff0c 实现内壳更新原理 xff1a 1 在项目根目录的conf
一文解决 Python读取文件的全部知识

文件是无处不在的 xff0c 无论我们使用哪种编程语言 xff0c 处理文件对于每个程序员都是必不可少的文件处理是一种用于创建文件写入数据和从中读取数据的过程 xff0c Python 拥有丰富的用于处理不同文件类型的包 xff0c 从
总结实验室对转录组及lncRNA数据分析的思路

继师兄详细地讲述这个思路之后 xff0c 我进行一个归纳总结 xff08 师兄说 xff0c 首先要建立一个思想上的流程 xff0c 再来纠结软件命令这些细节 xff01 xff01 xff01 xff01 xff01 xff01 xff

总结实验室对转录组及lncRNA数据分析的思路

总结实验室对转录组及lncRNA数据分析的思路 的相关文章

随机推荐

热门标签

总结实验室对转录组及lncRNA数据分析的思路的相关文章