RNA 31. SCI文章临床蛋白质组肿瘤在线数据挖掘神器(CPTAC)

2023-11-19

d37f7112d65a178589d234656de2dcdf.gif    

桓峰基因公众号推出转录组分析教程,有需要生信的老师可以联系我们!转录分析教程整理如下:

RNA 1. 基因表达那些事--基于 GEO

RNA 2. SCI文章中基于GEO的差异表达基因之 limma

RNA 3. SCI 文章中基于T CGA 差异表达基因之 DESeq2

RNA 4. SCI 文章中基于TCGA 差异表达之 edgeR

RNA 5. SCI 文章中差异基因表达之 MA 图

RNA 6. 差异基因表达之-- 火山图 (volcano)

RNA 7. SCI 文章中的基因表达——主成分分析 (PCA)

RNA 8. SCI文章中差异基因表达--热图 (heatmap)

RNA 9. SCI 文章中基因表达之 GO 注释

RNA 10. SCI 文章中基因表达富集之--KEGG

RNA 11. SCI 文章中基因表达富集之 GSEA

RNA 12. SCI 文章中肿瘤免疫浸润计算方法之 CIBERSORT

RNA 13. SCI 文章中差异表达基因之 WGCNA

RNA 14. SCI 文章中差异表达基因之 蛋白互作网络 (PPI)

RNA 15. SCI 文章中的融合基因之 FusionGDB2

RNA 16. SCI 文章中的融合基因之可视化

RNA 17. SCI 文章中的筛选 Hub 基因 (Hub genes)

RNA 18. SCI 文章中基因集变异分析 GSVA

RNA 19. SCI 文章中无监督聚类法 (ConsensusClusterPlus)

RNA 20. SCI 文章中单样本免疫浸润分析 (ssGSEA)

RNA 21. SCI 文章中单基因富集分析

RNA 22. SCI 文章中基于表达估计恶性肿瘤组织的基质细胞和免疫细胞(ESTIMATE)

RNA 23. SCI文章中表达基因模型的风险因子关联图(ggrisk)

RNA 24. SCI文章中基于TCGA的免疫浸润细胞分析 (TIMER)

RNA 25. SCI文章中估计组织浸润免疫细胞和基质细胞群的群体丰度(MCP-counter)

RNA 26. SCI文章中基于转录组数据的基因调控网络推断 (GENIE3)

RNA 27 SCI文章中转录因子结合motif富集到调控网络 (RcisTarget)

FigDraw 28. SCI文章中绘制雷达图/蛛网图 (RadarChart)

RNA 29. SCI文章中基于TCGA的免疫浸润细胞分析 (TIMER2.0)

国家癌症研究所的临床蛋白质组肿瘤分析联盟(CPTAC)是一项全国性的努力,旨在通过大规模蛋白质组学和基因组分析或蛋白质基因组学的应用来加速对癌症分子基础的理解。

3518938adccb0147518115ab77f122b7.png

CPTAC于2011年启动,开创了结直肠癌、乳腺癌和卵巢癌的综合蛋白质基因组分析,揭示了对这些癌症类型的新见解,如蛋白质组学中心亚型的鉴定,通过拷贝数改变和蛋白质丰度的相关分析确定驱动突变的优先级,以及通过翻译后修饰了解癌症相关通路。

CPTAC目前正在利用其在癌症蛋白质基因组学方面的投资,通过描述其他癌症类型,通过开源社区资源扩大其应用,并通过将蛋白质基因组学应用于临床试验中的毒性和耐药性问题来加速精准肿瘤学。这是通过CPTAC下属的蛋白质组表征中心、蛋白质基因组转化研究中心和蛋白质基因组数据分析中心在全国各地的协调努力实现的。CPTAC在蛋白质基因组学方面的进展使2016年的两个项目得以创建,旨在加深我们对这一新兴领域的理解。应用蛋白质基因组学组织学习与结果(APOLLO)网络旨在通过与国防部和退伍军人管理局的医疗保健系统合作,研究如何使患者肿瘤的蛋白质基因组分析成为常规癌症护理的一部分,从而有效地连接肿瘤研究和护理。同样,国际癌症蛋白质基因组联盟(ICPC)促进了10多个国家的合作,以研究其独特人群中常见诊断的癌症,目标是提高精准肿瘤学,并与世界各地的科学家和医生共享收集的数据。

数据(基因组学、蛋白质组学、成像)、分析和试剂作为社区资源提供给公众,以加速癌症研究和推进患者护理。

https://proteomics.cancer.gov/programs/cptac

进入主页之后,我们可以看到右侧又三个入口:

35c95ac81acfe3129f14ee9f5edb05c7.png

进入 Data portal:

a909c4eec5685c20ef2685afbab39632.jpeg

OCCPR的核心任务之一是与生物医学研究界共享和重用蛋白质基因组数据和图像数据,因为这对于加速科学发现及其临床转化为患者护理至关重要。

蛋白质组学数据共享(PDC)是NCI最大的蛋白质基因组综合肿瘤数据集公共存储库,本质上是一个蛋白质基因组癌症图谱。蛋白质组数据和相关数据文件按肿瘤类型、研究和亚蛋白质组组织成数据集。除了基于原始质谱的数据文件外,还进行了计算处理,以将光谱映射到肽序列并识别蛋白质。CPTAC研究中收集的所有光谱都作为CPTAC公共数据分析管道的一部分进行了一致性和可重复性分析,并为每个研究生成了交互式QC报告。所有数据都免费向公众开放。CPTAC和ICPC蛋白质组学数据可以在PDC上找到。

基因组数据共享(GDC)为癌症研究社区提供了统一的存储库和癌症知识库,支持在癌症基因组研究中共享数据,以支持精准医疗。CPTAC的基因组数据可以在GDC上找到。请向dbGaP申请访问受保护的CPTAC基因组数据。

癌症影像档案(链接为外部)(TCIA)是一项识别和托管大型癌症医学影像档案的服务,供公众下载。TCIA数据被组织为“集合”。尝试使用表上方的过滤框,使用关键字“CPTAC”快速查找CPTAC集合。当在出版物中使用CPTAC生成的蛋白质组学、基因组学或成像数据时,请使用以下确认。“本出版物中使用的数据由临床蛋白质组学肿瘤分析联盟(CPTAC)生成。”当使用由ICPC所属机构生成的数据时,请确认相应的机构。

进入 PDC:

d0a4efcfb2e308f79fc25a2b72242a59.png

提到TCGA,我们都知道对应的基因组数据访问入口是GDC Data Portal。而Proteomic Data Commons (PDC)则是NCI最大的基于质谱的肿瘤蛋白质组学数据库。除了原始的质谱基础数据,数据库也通过计算分析,将质谱映射到多肽序列并鉴定蛋白。CPTAC 原本的数据访问入口在2022年2月已关停,目前已转移到PDC。PDC是一个对蛋白质组学数据进行高质量质控,整合并统一标准,提供高效查询,可视化,分析和下载的平台,有效提升了多组学分析的便利性。CPTAC和ICP,以及其他项目的蛋白组学数据都可以在PDC上查看,分析和下载。

PDC可供下载的文件类型如下,其中大部分是原始文件,主要的结果文件是 summary.tsv,包含了蛋白的定量结果。

以结直肠癌为例介绍数据详情。点击进入后,类似TCGA GDC页面,左侧是多种筛选类型。右侧分别是样本介绍和数据文件描述。数据文件包括Studies,Biospecimens,Clinical,Files,Genes五个部分组织。或直接通过主菜单EXPLORE进入,页面内容相同,可查看全部样本或通过左侧筛选。

  • Studies是对研究项目的介绍,包括疾病类型,样本数目,分析内容等。

  • Biospecimens主要是样本详情,比如说明是肿瘤样本还是邻近正常组织。

  • Clinical主要包含临床相关信息,比如诊断结果,形态特征,肿瘤分期,复发时间等。如果PDC中的study有对应的基因组或图像诊断数据,在Clinical页面的 Genomic and Imaging Data Resource列会有相应链接,可直接点击下载或先下载Clinical文件,其中会包含外部链接的id和url。

  • Files主要包括研究对应的可供下载的文件。

  • Genes主要包括研究中鉴定到的蛋白,翻译后修饰位点,及其肽段序列详情。

数据页面除Genes页面查看对应丰度信息,其他数据多需要下载进行下游分析。

数据分析PDC分析工具ANALYSIS

b2c8338e41eff8ab4c1cac7692781357.png

(1)Explore Quantitation Data

PDC通过标准分析流程产生结果后可用于鉴别蛋白质和翻译后修饰(PTMs)丰度的pattern,并通过热图展示。Explore Quantitation Data 可对每个study的蛋白定量结果进行分析和展示。其中行为基因(蛋白),列为样本,并可嵌入临床信息。可选择一个或多个study分析。该类分析的主要目的是根据蛋白丰度进行样本聚类分析,通过Tools菜单可实现。

8c03e0b47ed8b57c8a8bbee3affd530a.png

(2)Peptide Genome mapping

主要是各种类型数据在基因组上的可视化展示。

489c27d330ae95e0216464919543a818.png

(3)Pepquery

这是一个以肽段序列为中心的搜索,与Blast类似,Pepquery使用户能够在MS数据库中查询感兴趣的新的肽段或DNA序列。基因组改变导致产生新的蛋白序列,经过蛋白组学验证,这些新的序列可能会是潜在的疾病标志物或治疗靶标。Pepquery不需要定制化的构建数据库,区别于spectrum-centric的方法,使用peptide-centric,允许快速和方便的验证基因组改变导致的蛋白质组改变。

15045e7f6dc348c06f7ef88974d184b4.png

db199febe0962304a5f032151b5b97d1.png

(4)cProSite

可指定肿瘤类型和数据集,针对单个基因,分析其在肿瘤和癌旁组织的丰度差异,磷酸化位点差异等。可用于验证目标基因是否在指定类型肿瘤中存在高表达,磷酸化等。

36eafd0819956eb7a92e5b05dd74cb4a.png

d8205d561f5d81760d00a5fddc8c2dfe.jpeg

按照基因分析

除了在cProSite中查询单个基因,也可直接在首页搜索框输入目标基因,点击查看,或进入EXPLORE左侧Genes 筛选框输入一组基因或选择某个信号通路的基因,查询后进入右侧Genes页面查看。展示的信息包括:检测到的PTM,在不同study中的表达丰度。

858769915c4fc4a82724ae96e99ba7e4.png

6dfd22dddf87f86411e0257dac51a7a6.png

按照肿瘤类型分析

蛋白质组定量的结果形式与RNA定量结果类似,可进行的分析也类似。且相比于mRNA需要再经过翻译才能生成蛋白质,直接对蛋白定量的准确度更高。常规针对肿瘤样本和癌旁样本,进行差异表达,GO/KEGG注释,蛋白互作网络分析等。结合Clinical 标签数据,可进行生存分析,挖掘与临床病理或结果真正相关的标志物或靶点,通过机器学习方法可进行疾病分型,诊断预测等。

使用起来还是非常方便,避免了自己写代码,又找数据又作图,有需要的老师可以参考使用!

桓峰基因,铸造成功的您!

未来桓峰基因公众号将不间断的推出转录组系列生信分析教程,

敬请期待!!

有想进生信交流群的老师可以扫最后一个二维码加微信,备注“单位+姓名+目的”,有些想发广告的就免打扰吧,还得费力气把你踢出去!

4a425653faf7f48086ab4ac8183ecbea.png

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

RNA 31. SCI文章临床蛋白质组肿瘤在线数据挖掘神器(CPTAC) 的相关文章

  • [机缘参悟-86]:清心寡欲,世外修行 ?负剑下山,闯荡江湖?

    天地者 万物之逆旅也 光阴者 百代之过客也 而浮生若梦 为欢几何
  • Android Fragment 真正的完全解析(下)

    本篇将介绍上篇博客提到的 如何管理Fragment回退栈 Fragment如何与Activity交互 Fragment与Activity交互的最佳实践 没有视图的Fragment的用处 使用Fragment创建对话框 如何与ActionBa
  • 5月10日 ksjsb抓包教程,小黄鸟无需ROOT抓包

    1 先下载抓包工具 小黄鸟 自己搜索 注意 这里下载完小黄鸟app后 安装打开时 该下载的安全证书下载 手机root权限该给的都给 2 打开小黄鸟工具 添加目标应用 快手极速版 3 启动小黄鸟 然后退出让它后台运行 打开快手极速版到菜单栏找
  • Windows下PP-Tracking多目标跟踪数据训练

    PP Tracking之手把手玩转多目标跟踪 飞桨AI Studio 人工智能学习与实训社区PP Tracking之手把手玩转多目标跟踪 飞桨AI Studio 人工智能学习与实训社区https aistudio baidu com ais
  • IDEA2023.1.3自带插件禁用,减少内存占用

    前言 前两个星期安装了idea2023 1 3 之前用的一直是idea2020 3版本 我发现新版界面确实更好看一些 而且启动速度也非常快 打开多个项目也一样很快 都是秒开 但是吧 它的内存占用比idea2020 3版高了很多 刚打开的时候
  • TensorRT Samples: GoogleNet

    关于TensorRT的介绍可以参考 http blog csdn net fengbingchun article details 78469551 以下是参考TensorRT 2 1 2中的sampleGoogleNet cpp文件改写的
  • 【前端面经】instanceof相关知识

    原理 instanceof是javascript语言中的一个运算符 用于检测一个对象是否是一个类或者构造函数的实例 它的语法是boject instanceof constructor 其中object是要检测的对象 constructor
  • JS常见加密 AES、DES、RSA、MD5、SHAI、HMAC、Base64(编码) - Python/JS实现

    JS常见加密 AES DES RSA MD5 SHAI HMAC Base64 Python JS实现 文章目录 JS常见加密 AES DES RSA MD5 SHAI HMAC Base64 Python JS实现 前言 一 编码 加密
  • 数据结构(C语言)——双链表

    有了单链表的编写经验 双链表变得格外容易 点击看前一篇 单链表 下面是代码 include
  • 三类XML文件的解析方法

    XML文件的解析 mybatis的学习当中 配置的加载传统的是通过解析用户配置的文件 获取到数据库连接与对象实体映射关系的 书中有描述到DOM SAX StAX 几种方案 一方面是夯实基础 一方面是了解三种方法的优缺点 今天就学习一下XML
  • 创建类似软键盘的无焦点对话框程序

    如果想创建一个类似windows里的屏幕键盘式的程序 由于需要将模拟键盘的输入发送到原来处于活动状态的程序 因此 我们的程序应该不改变原来的焦点 在vc6和vc 中可以通过以下方式实现 1 VC6 0中 在对话框的OnInitDialog
  • MQ如何保证消息的顺序一致性问题?

    产生原因 MQ服务器集群化或MQ采用分区模型架构来存放消息 每个分区对于一个消费者消费消息 解决消息一致性问题 核心思想 消息一定要投递到同一个MQ 且是同一个分区模型且被用一个消费者消费 可以根据消息key对分区模型总数取余来实现 1 大
  • 【云原生•监控】基于Prometheus的云原生集群监控(理论+实践)-03

    云原生 监控 基于Prometheus的云原生集群监控 理论 实践 03 k8s服务组件指标 kubernetes云原生集群作为大规模多节点容器调度平台 在交付和部署上的巨大优势逐渐让其称为一种技术趋势 如基于工作负载快速进行扩 缩容 故障
  • c++通讯录管理系统

    系统需求 代码 include
  • 7-37 5门课的平均分 7-38 等边三角形面积

    目录 7 37 5门课的平均分 输入格式 输出格式 样例 gt 输入样例 输出样例 思路 代码 7 38 等边三角形面积 输入格式 输出格式 输入样例 输出样例 思路 代码 7 37 5门课的平均分 输入5门课程成绩 整数 求平均分 结果保
  • 安装nextcloud文档

    root nextcloud php v PHP 7 2 24 cli built Oct 22 2019 08 28 36 NTS Copyright c 1997 2018 The PHP Group Zend Engine v3 2
  • 如何根据链表节点数据大小对链表节点进行排序

    对链表排序有两种方法 1 比较了两个节点的大小后 对指针进行改变 从而交换节点的顺序 2 比较了两个节点的大小后 只交换数据域 而不改变指针 从而交换节点的顺序 第二种办法比较简单 本文主要对第二种方法进行讲解 链表节点排序算法 采用 冒泡
  • 电脑迷你世界,迷你世界电脑版

    游戏介绍 配置要求 操作系统 Windows XP Windows Vista Windows 7 Windows 8 运行环境 无特殊需求 CPU Intel Core2 Duo E4600 2 40Hz AMD Athlon 64 X2
  • 关于element-ui中表单重置不生效的原因,及解决方法

    resetFields这个方法是将表单重置为初始值 也就是说 是将表单中的数据重置为dom节点渲染时的值 而不是重置为空对象 也就是说 当你的表单数据 是在dom节点渲染前被赋值的 那么他的初始值就不为空了 还有就是vue中对象是不能直接赋
  • excalidraw 添加手绘中文字体

    Excalidraw是一个矢量绘图工具 支持在绘图中添加文字 Excalidraw目前支持一些常见的中文字体 例如微软雅黑 宋体等 如果你想添加其他的手绘中文字体 可以按照以下步骤进行操作 打开Excalidraw 选择文字工具 在工具栏中

随机推荐

  • 使用python中的SVM进行数据回归预测

    在Python中使用支持向量机 SVM 进行数据回归预测 你可以遵循以下步骤 导入必要的库 from sklearn svm import SVR from sklearn model selection import train test
  • 【数据分析】业务指标的几个相关思考

    业务指标的几个相关思考 1 如何理解数据 拿到数据后 第一步 弄清楚数据里每一列的含义 第二步 对数据进行分类 有助于后期的分析 通常将数据分为 用户数据 行为数据 产品数据 三类 用户数据 指的是用户的基本情况 包括姓名 性别 邮箱 年龄
  • linux下查看redis是否正常运行 和设置密码

    一 查找redis conf文件 我们服务器已经安装了redis 现在通过命令查看下redis的进程 root lnp ps aux grep redis root 7374 0 0 0 0 145312 7524 Ssl 16 37 0
  • Error:(28, 8) java: 类Demo01Array是公共的, 应在名为 Demo01Array.java 的文件中声明

    public 修饰的class类必须与 Java文件名一致 若声明的class非public则文件名无需与类名相同 必须一致
  • Android原生系统真的那么好用吗?安卓原生系统吊打其他系统,因为有Google-Play

    Android原生系统真的那么好用吗 这种问题当然是否定的 原生 Android 指的是直接基于 AOSP 构建的而非手机厂商出厂固件修改的第三方 ROM 但包括 Nexus Pixel 或其它被 Google 直接支持的手机的可能是闭源的
  • 你们所不了解的程序员思维黑洞

    如果你也是程序员 看看你中了几条 1 数数会从 0 开始数起 比如 程序员吵架的时候会说 我数三下 你再不闭嘴 我就不客气了 零 一 二 或者 在列清单的时候 编号会从 0 开始写 为什么会这样 因为 0 是数组的第一个元素 在经过无数次的
  • 1分钟部署自己的AutoGPT

    4 月初 AutoGPT 引发热潮 短短一个多月 它已经在全球最大的开源软件社区 Github 上累积了131 000颗星 其热度依然持续上升 我体验后发现 虽然基于 3 5 模型的 AutoGPT 还无法最终生成完整的报告 但是它确实可以
  • MySQL高级学习笔记(一)

    文章目录 MySQL高级学习笔记 一 1 索引 1 1索引概述 1 2索引优势劣势 1 3索引结构 1 3 1BTREE 结构 1 3 2B TREE 结构 1 3 3MySQL中的B Tree 1 4索引分类 1 5索引语法 1 5 1
  • agplv3_我是否需要根据AGPLv3许可证提供对源代码的访问?

    agplv3 GNU Affero通用公共许可证版本3 AGPLv3 是与GPLv3几乎相同的copyleft许可证 两种许可证具有相同的版权保留范围 但在一个重要方面存在实质性差异 AGPLv3的第13节规定了GPLv2或GPLv3中不存
  • 断点续传----位图

    首先了解什么是位图和他的工作原理 定义 位图就是bitmap的缩写 所谓bitmap 就是用每一位来存放某种状态 适用于大规模数据 该数据都是不重复的简单数据 通常是用来判断某个数据存不存在的 工作原理 查找一个数是否存在 其实答案就是存在
  • Cmake的使用

    简介 CMake是一个跨平台的安装 编译 工具 可以用简单的语句来描述所有平台的安装 编译过程 他能够输出各种各样的makefile或者project文件 能测试编译器所支持的C 特性 类似UNIX下的automake 只是 CMake 的
  • matlab 右侧,matlab错误提示无法执行赋值,因为左侧和右侧的元素数目不同

    compute pdf of fpe corr to Levy noise with absorbing BC in a bounded symmetric domain r r central differencing for 2nd o
  • UE4 UE4 C++ Gameplay Abilities 的AttributeSet和GameplayEffect

    UE4 UE4 C Gameplay Abilities 的AttributeSet和GameplayEffect GAS参考文档 仅是个人理解 参考 AttributeSet是设置玩家属性的比如生命值 最大生命值 GameplayEffe
  • GPU压力测试和故障定位

    压力测试 获取gpu burn https codeload github com wilicc gpu burn zip master 解压缩 unzip gpu burn master zip 进入目录编译 cd gpu burn ma
  • 关于python爬虫的准备工作

    目录 1 什么是网络爬虫 2 准备工作 1 什么是网络爬虫 百度百科所给注释如下 网络爬虫 又称为网页蜘蛛 网络机器人 在FOAF社区中间 更经常的称为网页追逐者 是一种按照一定的规则 自动地抓取万维网信息的程序或者脚本 另外一些不常使用的
  • vm使用PE安装系统(2)

    接上次教程 vm使用PE安装系统 1 提要 此虚拟机安装方法适用于所有系统格式如ISO ESD GHO WIM等系统格式 第一步 打开DG硬盘分区 选择左侧栏进行的 HD0 右键选择快速分区 一般情况下选择自定义选择两个分区 然后右边内容栏
  • 芯片开发语言的简单区别介绍。Verilog、VHDL、System Verilog、SystemC、Matlab、C/C++等

    芯片开发语言的简单区别介绍 芯片设计前端的流程很长 和芯片前端相关的语言也很多 比如Verilog VHDL System Verilog SystemC Matlab C C 等等 但没有一个语言能够做到适合于整个前端流程 每种语言都有适
  • 【Kubernetes运维篇】零故障升级Pod健康探测详解

    文章目录 一 Pod健康探测介绍 1 三种容器探测方法 2 常用三种探测探针 3 探针相关属性说明 二 探测案例 1 Pod启动探测案例 startupProbe 2 Pod存活探测案例 livenessProbe 3 Pod就绪探测案例
  • QT QComboBox使用详解

    本文详细的介绍了QComboBox控件的各种操作 例如 下拉框添加内容 默认显示 获取下拉框总行数 获取选中索引 获取当前内容 清除列表 重绘下拉框等操作 本文作者原创 转载请附上文章出处与本文链接 QComboBox控件全面详解目录 1
  • RNA 31. SCI文章临床蛋白质组肿瘤在线数据挖掘神器(CPTAC)

    桓峰基因公众号推出转录组分析教程 有需要生信的老师可以联系我们 转录分析教程整理如下 RNA 1 基因表达那些事 基于 GEO RNA 2 SCI文章中基于GEO的差异表达基因之 limma RNA 3 SCI 文章中基于T CGA 差异表