GSEA

2023-11-08

软件下载网址:GSEA (gsea-msigdb.org)

GSEA不需要设置阈值过滤基因,有助于我们从整体通路分析差异。

一.数据准备

1.数据集(tpm_bulk.gct):你需要分析的表达矩阵,建议bulk数据用tpm标准化后的

第一行:#1.2默认的,不用改

第二行:矩阵总共的基因数量和样本数量

第三行及下:你的表达矩阵,Description不能为空,可以是na

可以在excel里处理文件,保存为制表符分隔文件(.txt),直接重命名改后缀为gct即可。

2.样本信息表(DATA_info.cls)

第一行:样品总数、分组数、不用改的数字1

第二行:样品分组名称

第三行:样品分组信息,与.gct文件对应

3.参考基因集(geneset.gmt)

第一列:通路名称

第二列:通路编号

第三列及之后:该通路包含的所有基因,基因名称需要与.gct文件中的基因名称一致

常用的有KEGG和GO基因集,获取基因集的方法:

1)MSigDB官网以及GSEA软件自带的基因集,大部分是有的,但是比KEGG官网上少了很多,官网也有一直在更新,MSigDB官网和GSEA软件没有跟上

2)自己去官网下载制作,生信技能树之前有提到过

3)最近看到python爬取KEGG数据库的,使用更方便,研究中……

二.软件使用

1.上传数据(load data)

 直接上传前面准备的三个文件即可,成功了会提示No Error。

 2.参数设置

Expression dataset:选择上传的表达矩阵.gct

Gene sets database:选择上传或自带的基因集.gmt

Number of permutations:置换检验的次数,一般为1000

Phenotype labels:需要比较的两组,.cls文件的分组,实验组比对照组

Collapse/Remap to gene symbols:基因symbol转换,文件的基因都是symbol就选No

Permutation type:每组样本数量大于7选phenotype,否则选gene_set

 Analysis name:输出的文件名

Plot graphs for the top sets of each phenotype:最终画图的数量

3.运行:直接Run

 4.查看结果

运行完左侧这里会出现文件名和succes,双击可以打开网页查看结果,一般通过|NES|>1&p-value<5%&FDR q-val<25%筛选结果,如果数量太多可以更严格一些筛选,或者考虑是不是输入的文件有问题。

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

GSEA 的相关文章

  • DCDC轻载与重载的区别

    许多人认为轻载就是负载小 重载就是负载大 其实不然 轻重载的判断最直接的是看输出电流的变化 如果相较于之前的额定电流 通过变化负载 使其电流变小 则说明该电路进入了轻载 反之 则是重载
  • macOS_Monterey_12.6_21G115可引导可虚拟机安装的纯净版苹果OS系统ISO镜像安装包免费下载

    现在网络上黑果系统出现了许多多合一的多功能版 不是说这些版本不好 只是小编个人觉得 操作系统就是用来使用的 黑果本来就是服务于一些非苹果机的苹果OS爱好者的 简洁稳定应该是首选 固小编毅然放弃那些多功能的豪华版镜像版 独宠我的纯净可引导安装
  • 黑客入门学习方法和盗号思路 别把这个想得很神秘

    大神请绕过 还有盗号的一些方法和思路 骗子太多 别上当 此文只是希望更多的人了解 更能很好的保护好自身虚拟财产 黑客 看着很神秘 其实都是普通人 工作不同而已 当然 有的很厉害的 他们智商都很高 这里不做讨论 就说说普通人如何学习这一块 入
  • 稳健性检验套路汇总!(持续更新......)

    稳健性检验通常有三种 一 改变变量的代理 更换自变量 更换因变量的构造方法 二 改变估计方法 如考虑内生性等 工具变量法 2sls估计法 GMM估计法 DID估计法 三 改变模型设定 增减变量 第四种就是改变样本 从全国总体到全国面板 到世
  • 信息系统分析相关知识梳理

    一 企业信息化战略与实施 一 企业信息化 1 以数据处理为核心 围绕职能部门 有企业系统规划法 关键成功因素法 战略集合转化法 2 以企业内部管理信息系统为核心 围绕企业整体 有战略数据规划法 信息工程法 战略栅格法 3 以集成为核心 面向
  • “程序员转型管理:从擅长代码到掌控团队的踩坑总结”

    作为程序员 很多人会在职业生涯中考虑转型管理岗位 然而 这个转换并不容易 除了需要掌握管理方面的知识和技能外 还需要处理人际关系并带领团队一起前进 在这个过程中 很多人可能会踩到一些坑 以下是我总结的一些经验教训 一 控制欲 由于程序员需要
  • ctfshow web入门——web8

    提示和上一题一样 但是访问 git没有flag出来 所以使用另一个版本控制工具svn 访问获得flag
  • 攻防世界-Morse

    1 下载文件打开得到如下01代码 很明显可以看出是摩斯编码 2 使用摩斯编码解码 得到如下结果 3 根据题目提示我们可以得到flag为cyberpeace morsecodeissointeresting
  • 数字化转型成熟度模型介绍

    中关村信息技术和实体经济融合发展联盟提出了一种数字化转型成熟度模型系列标准 目前已经被众多央企采用 作为数字化转型战略框架和评价的依据 用友作为全球领先的数智化服务商 也参与了这一系列标准的制定 今天我们就来介绍一下这套成熟度模型 并讨论对
  • 软考网络工程师-最新最全小白攻略

    一 前言 最近Beau 博主本人 也是考取了2023年上半年的软考网络工程师 这里也准备给小白们做一些避坑流程 这里附上通过图 二 考前准备 1 报考条件 无 无年龄 资质 学历限制 无需通过软考初级才能报考 是中国守法公民即可报名 2 考
  • 如何在 NodeJs 中上传、处理和存储文件:分步手册

    存储文件有三种基本方法 1 直接将其存储在数据库中 2 将其存储在文件系统中并将路径保存到数据库 3 将其存储在某些云存储中 例如 Amazon S3 Google Cloud Storage 或 Microsoft Azure Blob
  • 高效的学习方法

    背景 自己在复习自己专业课33页知识点时一筹莫展 死记硬背又记不住 背了上一个再背下一个上一个就忘记了 在复习的时候特别痛苦 而且定义性质的还是不能有错别字的 所以感觉自己背的特别痛苦 而且背完就忘 就像在做无用功 自己也想过用思维导图三遍
  • 费曼技巧学习笔记

    博主狂言 技巧正文 技巧的详细步骤 技巧步骤一 技巧步骤二 技巧步骤三 技巧的提纲总结 费曼技巧可以解决的问题 费曼技巧的另一种描述四步学习法 步骤一 步骤二 步骤三 步骤四 博主读后感 博主狂言 初识费曼技巧 甚是熟悉 博主自认有那么一点
  • 推荐夸克和多御,非常的实用!

    一 多御浏览器 多御浏览器是一款集安全 速度 工具于一身的浏览器 它的界面简洁大方 干净利落 打开速度和加载速度都很快 并且注重浏览体验 浏览器常用的功能一应俱全 添加书签 夜间模式 视频下载 分享页面 密码锁屏等 保护你的隐私 满足你的需
  • 文献综述写作模板1.0

    参考视频 基础模板框架 https www bilibili com video BV1E54y1U7SM spm id from 333 337 search card all click vd source e5e46a7b9d3909
  • Matlab 函数进阶:使用匿名函数和内嵌函数处理多变量传递问题(Matlab 7.0以上)

    from http asc 2dark org node 70 Matlab 函数进阶 使用匿名函数 Anonymous Function 和内嵌函数 Nested Function 处理多变量传递问题 Matlab 7 0以上 问题 有一
  • 在培训班里学IT技术是否有用?和大家分享相关IT培训班里五大常见宣传手法、相关优势与实际效果

    目录 Introduction 引言 IT培训班常见宣传手法 培训班的优势 如何评判IT培训班的效果与质量 除IT培训班之外的学习渠道 总结 其它资料下载 Introduction 引言 随着信息技术的飞速发展 学习IT技术成为许多人追求职
  • 第十四届蓝桥杯模拟赛(第一期)—保姆级解释(C语言版)

    1 二进制位数 问题描述 十进制整数 2 在十进制中是 1 位数 在二进制中对应 10 是 2 位数 十进制整数 22 在十进制中是 2 位数 在二进制中对应 10110 是 5 位数 请问十进制整数 2022 在二进制中是几位数 incl
  • 程序员必须掌握哪些算法?

    一个程序员一生中可能会邂逅各种各样的算法 但总有那么几种 是作为一个程序员一定会遇见且大概率需要掌握的算法 今天就来聊聊这些十分重要的 必抓 算法吧 文章目录 一 程序员必须掌握哪些算法 二 常见算法介绍 三 程序员要看哪些算法书籍 四 算
  • Nature | 中国陆地的碳汇量有多少?

    文献信息 题目 The size of the land carbon sink in China 来源 Nature 时间 2022

随机推荐

  • Word文件删除后怎么恢复?好用的恢复方法分享

    Word文件删除后怎么恢复 在工作和学习的过程中 我们难免会遇到丢失数据的情况 比如有时候不小心删除了Word文件 或者Word文件在操作过程中意外卡顿导致丢失 有什么好方法恢复呢 下面就一起来了解下 遇到Word文件数据丢失不要慌张 首先
  • Java项目的开发流程

    一个java开发项目过程 1 项目启动 1 项目组成立 公司成员 客户成员 2 制定项目预期目标 3 制定项目计划周期 4 建立好项目组成员沟通机制 2 需求调研 1 创建调研计划 协调调研时间 2 收集客户资料 获取客户需求 所有的资料都
  • Redis缓存雪崩、穿透、击穿原因分析和解决方案,附Redis管道使用技巧

    先给大家附上其他几篇文章 感兴趣的自行开车导航 Redis过期策略和持久化机制全面揭秘 教你如何合理配置 深入浅出Redis 一 从版本特性到数据类型到线程模型 带你了解Redis的核心特性和应用场景 一次redis OOM问题分析解决 r
  • 阿里云ECS漏洞修复简单办法

    阿里云的安全检测功能会每天检测主机上的漏洞 然后短信推送 让你试用漏洞修复功能 或购买修复功能 其实不需要购买 在主机上执行 apt upgrade 或者 yum upgrade 就自动修复了 其实就是更新软件包 更新内核 然后重启就可以了
  • LeetCode-738

    738 单调递增的数字 给定一个非负整数 N 找出小于或等于 N 的最大的整数 同时这个整数需要满足其各个位数上的数字是单调递增 当且仅当每个相邻位数上的数字 x 和 y 满足 x lt y 时 我们称这个整数是单调递增的 Example
  • 油盐微服务——负载均衡Ribbon

    文章目录 客户端负载均衡 RestTemplate详解 Spring Cloud Ribbon 是一个基于http和tcp的客户端 负载均衡工具 它 不需要像服务注册中心那样 独立部署 它几乎存在于每一个Spring Cloud构建的微服务
  • ubuntu16.04 从源码安装opencv4.0 支持anaconda3.5

    step1 安装依赖库 sudo apt get install build essential cmake pkg config sudo apt get install libjpeg8 dev libtiff5 dev libjasp
  • 【解析与反思】leetcode 1219. 黄金矿工 DFS 解法(C++)

    目录 前言 一 原题 二 基本思想 三 代码实现 四 代码优化 五 Dijktra 算法思考 前言 本文采用 DFS 算法求解问题 针对提交过程中遇到了超时的问题做出了分析和调试 供大家参考 一 原题 你要开发一座金矿 地质勘测学家已经探明
  • js_moment

    js 一 moment js Moment js是一个轻量级的JavaScript时间库 它方便了日常开发中对时间的操作 提高了开发效率 日常开发中 通常会对时间进行下面这几个操作 比如获取时间 设置时间 格式化时间 比较时间等等 下面就是
  • pandas中文本数据的拆分和提取

    本文主要分享文本数据的拆分 提取合并 为下一步可视化分析做好准备 数据来源于boss与拉勾网数据分析岗位的招聘信息 拉勾网的爬取方法见我的 Python selenium beautifulsoup 登录爬取拉勾网 登录爬取拉勾网2 0 P
  • discuz!代码内置颜色大全(收藏)

    加闪烁字 light 文字 light 加文字特效 shadow 255 red 2 文字 shadow 在标签的中间插入文字可以实现文字阴影特效 shadow内属性依次为宽度 颜色和边界大小 贴图
  • postgresql-索引与优化

    postgresql 索引与优化 索引简介 索引类型 B 树索引 哈希索引 GiST 索引 SP GiST 索引 GIN 索引 BRIN 索引 创建索引 唯一索引 多列索引 函数索引 部分索引 覆盖索引 查看索引 维护索引 删除索引 索引简
  • linux宝塔站点无法通过本机IP访问,宝塔面板禁止通过ip访问站点的设置方法

    Loading 1 宝塔面板 首先新建一个网站 比如 xxx com 设置默认站点为 xxx com 所有未在面板绑定的域名都会访问到这个默认站点 修改xxx com 站点配置文件在server name xxxxx语句下加入 gt ret
  • MFC之标签控件26

    1 标签控件 1 先创建基于对话框的项目 2 添加TabControl控件到对话框 3 由于这个标签控件是唯一需要添加额外代码的 所以我们需要添加额外的代码进去项目当中 TabSheet h if defined AFX TABSHEET
  • windows下配置gtest及实例

    1 安装gtest 2 配置工程 3 进行单元测试 1 安装gtest 将gtest压缩文件下载放到指定位置 进行解压缩 可看到如下结果 安装源码 https github com smarr googletest 2 配置工程 将gtes
  • resa复现

    源代码 https github com ZJULearning resa 1 数据集准备 参考Ultra Fast Lane Detection 复现 2 环境搭建 conda create n resa python 3 8 y con
  • Appium环境搭建之Android SDK及模拟器的下载配置

    一 Android SDK下载及配置 1 访问https www androiddevtools cn 下载Android SDK 提供有exe和zip两种格式下载 2 下载zip压缩包 直接解压至想要安装的路径 3 然后就双击 SDK M
  • UE-c++ TSubclassOf

    TSubclassOf 是提供UClass类型安全性的模板类 例如您在创建一个投射物类 允许设计者指定伤害类型 您可只创建一个UClass类型的UPROPERTY 让设计者指定派生自UDamageType的类 或者您可使用TSubclass
  • 1.1.4 Qt信号槽之再谈Qt4与Qt5中信号槽使用的差异

    Qt信号槽之再谈Qt4与Qt5中信号槽使用的差异 Differences between String Based and Functor Based Connections 通过上面的示例和分析 我们已经明显感受到Qt4和Qt5中conn
  • GSEA

    软件下载网址 GSEA gsea msigdb org GSEA不需要设置阈值过滤基因 有助于我们从整体通路分析差异 一 数据准备 1 数据集 tpm bulk gct 你需要分析的表达矩阵 建议bulk数据用tpm标准化后的 第一行 1