GEO分析

2023-11-12

title: “R Notebook”
output: html_notebook

1 下载加载包

cran_packages <- c('tidyr',
                   'tibble',
                   'dplyr',
                   'stringr',
                   'ggplot2',
                   'ggpubr',
                   'factoextra',
                   'FactoMineR',
                   'WGCNA') 
Biocductor_packages <- c('GEOquery',
                         'hgu133plus2.db',
                         "KEGG.db",
                         "limma",
                         "impute",
                         "GSEABase",
                         "GSVA",
                         "clusterProfiler",
                         "genefu",
                         "org.Hs.eg.db",
                         "preprocessCore",
                         "hugene10sttranscriptcluster.db")

for (pkg in c(Biocductor_packages,cran_packages)){
  require(pkg,character.only=T) 
}

2 下载数据

rm(list = ls())
library(GEOquery)
eSet <- getGEO("GSE42872", 
               destdir = '.',
               getGPL = F)

# 从eSet中提取表达矩阵exp
exp <- exprs(eSet[[1]])

head(exp)

3 ID转换

3.1 方案一：可以找到对应平台

##探针ID（probe_id）转换成symbol ID（方案一：可以找到对应平台）

eSet[[1]]@annotation # 查看GPL号
library(hugene10sttranscriptcluster.db) # 加载特定的R包，下载哪个包，需要根据GPL来定
ls("package:hugene10sttranscriptcluster.db") # 注意加上后缀.db
ids=toTable(hugene10sttranscriptclusterSYMBOL) #想要得到probe_id和symbol的对应关系要用hugene10sttranscriptclusterSYMBOL数据集，用toTable函数提取数据集里面的信息
head(ids) #查看1-6行
# unique函数是用来：Extract Unique Elements 去除重复的symbol只提取不同的元素；length函数统计去重之后还有多少个基因。
length(unique(ids$symbol))
#table() 函数可以生成频数统计表，这里就是统计每个基因symbol出现的次数然后将其表格化；
#sort()函数将symbol出现的频率从小到大进行排序；tail()取最后6个即出现频率最大的6个。
tail(sort(table(ids$symbol)))
# table一下我们可以看到，多少个基因设计了几个探针；
table(sort(table(ids$symbol)))
# ids$probe_id是具有对应基因的所有探针，所以返回的TRUE就是文章数据中有对应基因的探针数。
table(rownames(exp) %in% ids$probe_id)
dim(exp)
# 对探针进行过滤，把没有对应基因名的探针过滤掉
exp = exp[rownames(exp) %in% ids$probe_id,]
dim(exp)

# match函数把ids里的探针顺序改一下，使ids里探针顺序和我们表达矩阵的顺序完全一样。
ids=ids[match(rownames(exp),ids$probe_id),]
head(ids)
head(exp)
# by()函数在这里发挥的功能就是将表达矩阵exp中的探针分组，同一个symbol所对应的多个探针分到一组，并对每组探针进行统计得到symbol所对应的唯一探针。所以tmp里放着by()函数的统计结果即每个symbol所对应的唯一探针IDprobe_id，用probes = as.character(tmp）将结果变身为纯字符型向量
## 具体：第二个参数ids$symbol定义了分组，将第一参数—exp表达矩阵分成了若干个小矩阵，每个小矩阵里存放着同一个symbol所对应的所有探针。第三个参数是我们自己定义的函数：计算每个小矩阵中每行探针表达量的平均值（也就是每个探针在6个样本中表达量的均值rowMeans(x)），再取平均值最大的那个探针作为该symbol所对应的唯一探针which.max(rowMeans(x))。
## by()函数就可以返回每个分组里的统计结果，即每个symbol所对应的唯一探针IDprobe_id。这时，探针ID和基因symbol就一一对应了，将表达矩阵探针ID即exp表达矩阵的行名（rownames(exp)）换为基因symbol
tmp = by(exp,
         ids$symbol,
         function(x) rownames(x)[which.max(rowMeans(x))])

probes = as.character(tmp)
head(tmp)
head(probes)

dim(exp)
exp = exp[rownames(exp) %in% probes,]
dim(exp)
rownames(exp)=ids[match(rownames(exp),ids$probe_id),2]
head(exp)

pd <- pData(eSet[[1]]) # pData函数得到每个样本的描述信息
head(pd)

save(pd,exp,file = "step1output.Rdata")
save(exp,file = "DEGinput.Rdata")

rm(list = ls())  ## 魔幻操作，一键清空~
options(stringsAsFactors = F)
load(file = "step1output.Rdata")

3.2 方案二：找不到GPL平台对应的R注释包

# 如果找不到GPL平台对应的R注释包（方案二）
## 下载平台信息(GPL)，从平台信息中选择我们想要的列：探针名、基因名....
gpl <- getGEO('GPL6480', destdir = ".")
colnames(Table(gpl))
head(Table(gpl)[,c(1,6,7)]) #看gpl对象中哪一列是我们想要的取出来，发现1/6/7列是我们想要的
write.csv(Table(gpl)[,c(1,6,7)],"GPL6480.csv") #把我们想要的部分即探针名对应的基因名....存起来

3.3 获取分组信息—group_list，哪些组是control；哪些组是tumor

# 方法一：使用stringr函数
library(stringr)
group_list = ifelse(str_detect(pd$title,"Control")==TRUE,"contorl","treat")
group_list
# stringr包用于字符串的处理，str_detect是该包里的函数，用来确定一个字符向量能否匹配一种模式。它返回一个与输入向量具有同样长度的逻辑向量：

# 方法二：自己造一个
group_list=c(rep("control",times=3),rep("treat",times=3))

4 boxplot

4.1 检查表达矩阵，画典型基因表达量的boxplot

exp['GAPDH',] 
exp['ACTB',]
boxplot(exp)
boxplot(exp['GAPDH',])
boxplot(exp['ACTB',])

4.2 #各个样本表达量的boxplot，准备画图所需数据exp_L

library(reshape2)
head(exp)
exp_L = melt(exp)
head(exp_L)
colnames(exp_L)=c('symbol','sample','value')
head(exp_L)

4.3 获得分组信息

library(stringr)

group_list = ifelse(str_detect(pd$title,"Control")==TRUE,"contorl","treat")

group_list

exp_L$group = rep(group_list,each=nrow(exp))
head(exp_L)
table(exp_L[,2])
dim(exp_L)

5 ggplot2绘图，聚类，PCA

library(ggplot2)
p = ggplot(exp_L,
         aes(x=sample,y=value,fill=group))+geom_boxplot()
print(p)

# 对表达矩阵进行聚类绘图，并添加样本的临床表型数据信息(更改样本名)

## hclust
# 更改表达矩阵列名
head(exp)
colnames(exp) = paste(group_list,1:6,sep='')
head(exp)
# 定义nodePar
nodePar <- list(lab.cex = 0.6, pch = c(NA, 19), 
                cex = 0.7, col = "blue")
# 聚类
hc=hclust(dist(t(exp)))
par(mar=c(5,5,5,10)) 
# 绘图
plot(as.dendrogram(hc), nodePar = nodePar,  horiz = TRUE)

## PCA

library(ggfortify)
# 互换行和列，dim一下
head(exp)
df=as.data.frame(t(exp))
# 不要view df，列太多，软件会崩掉；
dim(df)
dim(exp)

exp[1:6,1:6]
df[1:6,1:6]

df$group=group_list 
autoplot(prcomp( df[,1:(ncol(df)-1)] ), data=df,colour = 'group')

save(exp,group_list,file = "step2output.Rdata")

6 用limma对芯片数据进行差异分析

#差异分析——limma
rm(list = ls())  ## 魔幻操作，一键清空~
options(stringsAsFactors = F)
load(file = "step2output.Rdata")
dim(exp)

library(limma)
# 做分组矩阵 
design <- model.matrix(~0+factor(group_list))
colnames(design)=levels(factor(group_list))
rownames(design)=colnames(exp)
design  #分组矩阵

# 做比较矩阵

# contrast.matrix<-makeContrasts(paste0(unique(group_list),collapse = "-"),levels = design)
# contrast.matrix ##这个矩阵声明，我们要把treat组和contorl组进行差异分析比较
# -1和1的意思是contorl是用来被比的，treat是来比的
contrast.matrix<-makeContrasts(paste0(c("treat","contorl"),collapse = "-"),levels = design)
contrast.matrix
#到此，做差异分析所需要的三个矩阵就做好了：表达矩阵、分组矩阵、差异比较矩阵
#我们已经制作好了必要的输入数据，下面开始讲如何使用limma这个包来进行差异分析了！

##step1
fit <- lmFit(exp,design)
##step2
fit2 <- contrasts.fit(fit, contrast.matrix) ##这一步很重要，大家可以自行看看效果
fit2 <- eBayes(fit2)  ## default no trend !!!
##eBayes() with trend=TRUE
##step3
tempOutput = topTable(fit2, coef=1, n=Inf)
nrDEG = na.omit(tempOutput) 
#write.csv(nrDEG2,"limma_notrend.results.csv",quote = F)
head(nrDEG)

save(exp,group_list,nrDEG,file = "DEGoutput.Rdata")

7 热图

# 热图的类似代码如下
library(pheatmap)
annotation_col=data.frame(group=Group)
rownames(annotation_col)=colnames(n) 
pheatmap(n,
         show_colnames =F,
         show_rownames = F,
         annotation_col=annotation_col
)

8 火山图

rm(list = ls())  ## 魔幻操作，一键清空~
options(stringsAsFactors = F)
load(file = "DEGoutput.Rdata")
colnames(nrDEG)
plot(nrDEG$logFC,-log10(nrDEG$P.Value))

DEG=nrDEG
logFC_cutoff <- with(DEG,mean(abs( logFC)) + 2*sd(abs( logFC)) )
DEG$change = as.factor(ifelse(DEG$P.Value < 0.05 & abs(DEG$logFC) > logFC_cutoff,
                              ifelse(DEG$logFC > logFC_cutoff ,'UP','DOWN'),'NOT')
)
this_tile <- paste0('Cutoff for logFC is ',round(logFC_cutoff,3),
                    '\nThe number of up gene is ',nrow(DEG[DEG$change =='UP',]) ,
                    '\nThe number of down gene is ',nrow(DEG[DEG$change =='DOWN',])
)
this_tile
head(DEG)
g = ggplot(data=DEG, aes(x=logFC, y=-log10(P.Value), color=change)) +
  geom_point(alpha=0.4, size=1.75) +
  theme_set(theme_set(theme_bw(base_size=20)))+
  xlab("log2 fold change") + ylab("-log10 p-value") +
  ggtitle( this_tile  ) + theme(plot.title = element_text(size=15,hjust = 0.5))+
  scale_colour_manual(values = c('blue','black','red'))  ## corresponding to the levels(res$change)
print(g)

9 富集分析

9.1 准备工作：首先对差异表达矩阵nrDEG，进行加工

1.把行名变成SYMBOL列

rm(list = ls())  ## 魔幻操作，一键清空~
options(stringsAsFactors = F)
load(file = "DEGoutput.Rdata")
library(dplyr)
deg = nrDEG
deg <- mutate(deg,symbol = rownames(deg))
head(deg)

2.加change列：上调或下调，火山图要用

logFC_t = 1 #不同的阈值，筛选到的差异基因数量就不一样，后面的超几何分布检验结果就大相径庭。
change=ifelse(deg$P.Value>0.01,'stable', 
              ifelse( deg$logFC >logFC_t,'up', 
                      ifelse( deg$logFC < -logFC_t,'down','stable') )
)
deg <- mutate(deg,change)
head(deg)
table(deg$change)

3.加ENTREZID列，后面富集分析要用

library(ggplot2)
library(clusterProfiler)
library(org.Hs.eg.db)
s2e <- bitr(unique(deg$symbol), fromType = "SYMBOL",  #ID转换核心函数bitr
            toType = c( "ENTREZID"),
            OrgDb = org.Hs.eg.db)
head(s2e)
head(deg)
deg <- inner_join(deg,s2e,by=c("symbol"="SYMBOL"))

head(deg)

save(exp,group_list,deg,file = "enrich_input.Rdata")

9.2 富集分析

rm(list = ls()) 
options(stringsAsFactors = F)
load(file = 'enrich_input.Rdata')

## 1.KEGG pathway analysis
#上调、下调、差异、所有基因

9.2.1 clusterProfiler作kegg富集分析：

library(clusterProfiler)
  gene_up= deg[deg$change == 'up','ENTREZID'] 
  gene_down=deg[deg$change == 'down','ENTREZID'] 
  gene_diff=c(gene_up,gene_down)
  gene_all = deg[,'ENTREZID']
  kk.up <- enrichKEGG(gene         = gene_up,
                      organism     = 'hsa',
                      universe     = gene_all,
                      pvalueCutoff = 0.9,
                      qvalueCutoff =0.9)
  head(kk.up)[,1:6]
  dim(kk.up)
  kk.down <- enrichKEGG(gene         =  gene_down,
                        organism     = 'hsa',
                        universe     = gene_all,
                        pvalueCutoff = 0.9,
                        qvalueCutoff =0.9)
  head(kk.down)[,1:6]
  dim(kk.down)
  kk.diff <- enrichKEGG(gene         = gene_diff,
                        organism     = 'hsa',
                        pvalueCutoff = 0.05)
  head(kk.diff)[,1:6]
  
  class(kk.diff)
  #提取出数据框
  kegg_diff_dt <- kk.diff@result
  
  #根据pvalue来选,用于可视化
  down_kegg <- kk.down@result %>%
    filter(pvalue<0.05) %>%
    mutate(group=-1)
  
  up_kegg <- kk.up@result %>%
    filter(pvalue<0.05) %>%
    mutate(group=1)
  
  #可视化
  kegg_plot <- function(up_kegg,down_kegg){
    dat=rbind(up_kegg,down_kegg)
    colnames(dat)
    dat$pvalue = -log10(dat$pvalue)
    dat$pvalue=dat$pvalue*dat$group 
    
    dat=dat[order(dat$pvalue,decreasing = F),]
    
    g_kegg<- ggplot(dat, aes(x=reorder(Description,order(pvalue, decreasing = F)), y=pvalue, fill=group)) + 
      geom_bar(stat="identity") + 
      scale_fill_gradient(low="blue",high="red",guide = FALSE) + 
      scale_x_discrete(name ="Pathway names") +
      scale_y_continuous(name ="log10P-value") +
      coord_flip() + theme_bw()+theme(plot.title = element_text(hjust = 0.5))+
      ggtitle("Pathway Enrichment") 
  }
  
  g_kegg <- kegg_plot(up_kegg,down_kegg)
  g_kegg
  
  ggsave(g_kegg,filename = 'kegg_up_down.png')

9.2.2 gsea作kegg富集分析

 data(geneList, package="DOSE")
  head(geneList)
  length(geneList)
  names(geneList)
  boxplot(geneList)
  boxplot(deg$logFC)
  
  geneList=deg$logFC
  names(geneList)=deg$ENTREZID
  geneList=sort(geneList,decreasing = T)
  
  kk_gse <- gseKEGG(geneList     = geneList,
                    organism     = 'hsa',
                    nPerm        = 1000,
                    minGSSize    = 120,
                    pvalueCutoff = 0.9,
                    verbose      = FALSE)
  head(kk_gse)[,1:6]
  gseaplot(kk_gse, geneSetID = rownames(kk_gse[1,]))
  
  down_kegg<-kk_gse[kk_gse$pvalue<0.05 & kk_gse$enrichmentScore < 0,];down_kegg$group=-1
  up_kegg<-kk_gse[kk_gse$pvalue<0.05 & kk_gse$enrichmentScore > 0,];up_kegg$group=1
  
  gse_kegg=kegg_plot(up_kegg,down_kegg)
  print(gse_kegg)
  ggsave(gse_kegg,filename ='kegg_up_down_gsea.png')

9.3 GO database analysis

9.3.1 富集分析

library(clusterProfiler)
#输入数据
gene_up= deg[deg$change == 'up','ENTREZID'] 
gene_down=deg[deg$change == 'down','ENTREZID'] 
gene_diff=c(gene_up,gene_down)
head(deg)

9.3.2 GO分析三大块

#细胞组分
ego_CC <- enrichGO(gene = gene_diff,
                       OrgDb= org.Hs.eg.db,
                       ont = "CC",
                       pAdjustMethod = "BH",
                       minGSSize = 1,
                       pvalueCutoff = 0.01,
                       qvalueCutoff = 0.01,
                       readable = TRUE)
#生物过程
ego_BP <- enrichGO(gene = gene_diff,
                       OrgDb= org.Hs.eg.db,
                       ont = "BP",
                       pAdjustMethod = "BH",
                       minGSSize = 1,
                       pvalueCutoff = 0.01,
                       qvalueCutoff = 0.01,
                       readable = TRUE)
#分子功能：
ego_MF <- enrichGO(gene = gene_diff,
                       OrgDb= org.Hs.eg.db,
                       ont = "MF",
                       pAdjustMethod = "BH",
                       minGSSize = 1,
                       pvalueCutoff = 0.01,
                       qvalueCutoff = 0.01,
                       readable = TRUE)
save(ego_CC,ego_BP,ego_MF,file = "ego_GPL6244.Rdata")
rm(list = ls()) 
load(file = "ego_GPL6244.Rdata")
  
#第一种，条带图，按p从小到大排的
  barplot(ego_CC, showCategory=20,title="EnrichmentGO_CC")
  barplot(ego_BP, showCategory=20,title="EnrichmentGO_CC")
  #如果运行了没出图，就dev.new()
  #第二种，点图，按富集数从大到小的
  dotplot(ego_CC,title="EnrichmentGO_BP_dot")
  
  #保存
  pdf(file = "dotplot_GPL6244.pdf")
  dotplot(ego_CC,title="EnrichmentGO_BP_dot")
  dev.off()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R语言GEO

R语言

GEO分析的相关文章

R大数定律(Python切比雪夫不等式验证大数定律)模拟圆周率

大数定律在概率论中大数定律 LLN 是描述大量执行相同实验的结果的定理根据规律大量试验所得结果的平均值应接近预期值并随着试验次数的增加而趋于接近预期值 LLN 很重要因为它保证了一些随机事件的平均值的长期稳定结果例如虽然赌场
Stata输出统计结果到Excel或word

目录一安装外部包二相关命令三实例 1 描述性统计结果输出 2 相关性结果输入 3 回归结果输出 1 单模型结果 2 多模型结果参考一安装外部包在Stata内安装外部包 estout和logout ssc install
看书标记【R语言数据分析与挖掘实战】4

第四章数据预处理 4 1 数据清洗缺失值处理使用is na 判断缺失值是否存在 complete cases 可以识别样本数据是否完整从而判断缺失情况删除法 na omit 函数移除所有含有缺失数据的行 data p 删除p列替换
R语言系列教程-----一起来学shiny吧（1）

什么是shiny Shiny是一个R包可让您轻松地直接从 R 构建交互式 Web 应用程序应用程序本系列是个长教程带你由浅入深学习shiny 我们先使用系统自带的一个例子来介绍一下shiny 我们先导入shiny包 library
PCE投稿要求

进入PCE的投稿网址 http mc manuscriptcentral com pce 查了一下大家都建议创建ORCID号于是按照指示创建了蓝色笔圈起来的是一些投稿指导于是打开Instructions Forms Instruct
r语言写九九乘法表并保存为txt文件

r语言写九九乘法表并保存为txt文件代码 for i in 1 9 for j in 1 i cat j x i i j t file 九九乘法表 txt append TRUE cat n file 九九乘法表 txt append T
802.11K/V/R协议介绍

802 11K V R协议介绍 1 传统无线漫游介绍 1 1 什么是无线漫游一台无线终端备 STA 通过连接Wi Fi获取上网体验 Wi Fi名称又称为SSID 是由无线接入网 AP 提供的因为一台AP设备的覆盖范围有限所以无线网络
R语言基础——缺失数据

R语言基础缺失数据缺失数据的分类统计学家通常将缺失数据分为三类它们都用概率术语进行描述但思想都非常直观我们将用sleep研究中对做梦时长的测量有12个动物有缺失值来依次阐述三种类型 1 完全随机缺失若某变量的缺失数据与其他
转载：R语言绘图—图形标题、坐标轴设置

R语言绘图是通过函数命令及相应参数设置实现的如plot x y plot为绘图函数命令 x y则是绘图参数指定了绘图的数据向量但这种最基本的绘图设置很难满足个性化绘图的要求我们需要根据需要对图形元素进行设置图形元素是各类图形的基本
R语言学习笔记：分析学生的考试成绩

孩子上初中时拿到过全年级一次考试所有科目的考试成绩表正好可以用于R语言的统计分析学习为了不泄漏孩子的姓名就用学号代替了感兴趣可以下载测试数据进行练习 num class chn math eng phy chem politics
r如何让新增加的列出现在第一列 r如何调整新增加的列的位置

https www cnblogs com liujiaxin2018 p 16211983 html 1 任意位置插入列复制代码 gt a lt letters 1 5 gt b lt LETTERS 1 5 gt c lt sampl
统计学三大分布(卡方、t、F)即相应概率密度图的R语言实现

三大统计分布 1 2 chi 2 2分布设随机变量 X 1
R语言 write.xlsx() 写入同一excel，及同一sheet注意

write xlsx x file sheetName Sheet1 col names TRUE row names TRUE append FALSE showNA TRUE 1 想要将data1写da xlsx的sheet1 data
Coding and Paper Letter（六十一）

2019独角兽企业重金招聘Python工程师标准 gt gt gt 资源整理 1 Coding 1 航拍影像的土地覆盖分类 CAS机器学习人工智能2019 ZHAW 中ML DL分配的仓库 ml dl assignment 2019 2 跨
14. Bayesian Networks With Examples in R的学习笔记（贝叶斯网络 bic打分相关）

bnlearn官网推荐书目 Bayesian Networks With Examples in R 下载了英文版pdf学习了一下书还是比较浅显易懂的没有读多少暂时把自己看的部分整理翻译到这里留存欢迎大家交流 pdf下载地址 ht
2021-05-03

一 R中安装 phyloseq 的方法很多网上的教程使用的都是 source https bioconductor org biocLite R biocLite phyloseq 但是我尝试了很多次最后还是没有成功下面能成功安装 p
计算机科学丛书(2014-2018.Q1)

ISBN 名称作者出版时间 978 7 111 53451 8 数学设计和计算机体系结构原书第2版美戴维莫尼哈里斯莎拉 L 哈里斯著 978 7 111 44075 8 嵌入式计算系统设计原理美 Marilyn Wolf著
R语言与多元线性回归方程及各种检验

R语言与多元线性回归方程及各种检验文章目录 R语言与多元线性回归方程及各种检验一模型建立二多重共线性 1 产生的背景 2 多重共线性的检验 1 简单相关系数法 2 方差膨胀因子 vif 法 3 矩阵 X T X
R语言实现推荐系统

目录 1 理论基础 1 1 推荐系统 1 2 R语言 2 数据准备 2 1 数据获取 2 2 数据读取
R语言采集获取58商铺出租转让信息

前两篇文章给我一个朋友分析出店铺商品以及地址房源信息后来去看了下店铺房租有点贵还是毛坯房要自己装修本着节约成本的原则熬了个通宵给他采集了一些转租商铺数据因为数据比较多过于先进不方便展示我就将我爬虫程序的模版展示给大家观看

随机推荐

【任务调度系统第二篇】：XXL Job源码分析

文章目录写在前面一 XXL JOB项目源码整体概括 1 源码整体概括说明 2 分析该项目源码时一些必须的知识 2 1 quartz简单介绍 2 2 freemarker前端渲染模板简介 2 3 java基本功修炼二 xxl job a
Vscode编辑器下显示图片遇到的问题

在编辑器Vscode下显示jpg图片不成功测试代码和提示错误信息如下图但是在IDLE中进行如上操作却能正常显示 Python环境为anaconda PIL matplotlib 问题出在什么地方呢
算法1：一个无序的int数组，包含正负数，排序成：左边为负数右边为正数

public class MinusPlubs public static void minusLeftPlusRight int nums int p1 1 boolean firstTime true for int i 0 i lt
D2D通信的Matlab关键技术

D2D通信的Matlab关键技术 D2D Device to Device 通信是一种直接在终端设备之间进行通信的技术它可以提供高效的通信和资源共享在本文中我们将介绍D2D通信的一些关键技术并使用Matlab提供相应的源代码来实现这
利用Power BI计算组，设计个性化数据标签

利用Power BI计算组设计个性化数据标签知乎 zhihu com https zhuanlan zhihu com p 405532292
Exception 开发遇见异常

1 java lang OutOfmemoryError 原因常见的有以下几种 1 内存中加载的数据量过于庞大如一次从数据库取出过多数据 2 集合类中有对对象的引用使用完后未清空使得JVM不能回收 3 代码中存在死循环或循环产生过多
TCP协议如何保证可靠传输

TCP的功能是交付数据所以TCP的可靠就是保证每次数据按序按时不丢数据顺利的交付给对端可靠不等于安全 TCP尽最大可能的保证数据可靠性但是没有任何措施保证数据的安全性所谓安全就是你的数据不会被别人看到或者窃取到 TCP上的数据
Ubuntu安装Redis集群（主从+哨兵）

一下载官网 Download Redis 百度云链接 https pan baidu com s 1sQjpbiFIFhnSpa0 uCP53A 提取码 AA56 版本 redis 6 23 注本文依旧此博文修改而来那篇更为详细
使用Java实现七牛云OSS云存储上传图片至指定目录

使用Java实现七牛云OSS云存储上传图片至指定目录思路介绍 Controller代码 Util工具类代码配置类配置对象QnOssProperties 思路介绍首先介绍下我的实现思路前端通过Controller调用上传方法上传方
深分页优化总结

前言最近有面试过也遇到了问关于深分页问题在这里简单从MySQL ES等方面分享一下自己对该问题认识和总结一深分页定义可以从ES定义上来划分浅分页和深分页的边界即页数超过10000页为深分页少于10000页为浅分页二 MySQ
QT打包发布全流程，超详细

目录第一步配置环境变量这一步不会的可以看我另一篇文章 QT 打包发布之环境变量配置简单四步搞定第三步进行初步测试主演是看你的程序是否有错第四步程序能运行就可以在上层目录中看到生成了一个release文件夹第五步点开文
LeetCode周赛总结第277场

本文同步发布在我的个人博客 LeetCode周赛总结第277场欢迎访问本次周赛没想到比上周还要简单前三题都可以用非常简单的方法快速解决第四题如果想对了方向其实也比较简单元素计数题目链接元素计数解题思路相当基础的题目要同
华为OD机试 - 最佳植树距离（Java）

题目描述按照环保公司要求小明需要在沙化严重的地区进行植树防沙工作初步目标是种植一条直线的树带由于有些区域目前不适合种植树木所以只能在一些可以种植的点来种植树木在树苗有限的情况下要达到最佳效果就要尽量散开种植不同树苗之间的最
【Java script基础学习】本地对象 - Date

Date 日期对象用来操作计算机的日期和时间获取获取当前日期时间获取当前的时间戳 Date now 时间戳从1970 1 1 0 0 0 到此刻的毫秒数获取完整的日期对象 new Date 获取到的是一个对象类型的日期包含日期
STM32MP157驱动开发——Linux LCD驱动(上)

STM32MP157驱动开发 Linux LCD驱动上 0 前言一 LCD 和 LTDC 简介 1 LCD 简介 1 分辨率 2 像素格式 3 LCD 屏幕接口 4 LCD 时间参数 5 RGB LCD 屏幕时序 6 像素时钟 7 显存
【Python pygame】零基础也能轻松掌握的学习路线与参考资料

Python pygame是一款专门用于开发游戏和多媒体应用程序的Python库它可以帮助开发者实现丰富多彩的图形界面和实时动态交互效果本篇文章将为大家介绍Python pygame的学习路线包括入门基础进阶知识以及优秀实践帮助大
C++中return语句的用法

C 中的return语句是函数中一个重要的语句 return语句用于结束当前正在执行的函数并将控制权返回给调用此函数的函数 return语句有两种形式 return return expression 1 没有返回值的函数不带返回值的r
贪吃蛇（一）--用C++编写一个简单的贪吃蛇

这里简单介绍怎么用C 编写一个简单的黑白框的贪吃蛇游戏复杂的加了可视化界面程序点击这里贪吃蛇二 easyX图形库进行可视化界面制作首先分析在黑白框中的贪吃蛇需要哪些功能 1 需要能在界面指定位置 x y 直接输出对应内容 2 需要动态
学习的逻辑: 知识经济学

来自http liguanglei name blogs 2012 11 28 the logic of learning 1 怎么证明学会了 2 你的身价是由你表现出来的知识决定的不是你掌握的知识决定的万物有始皆有终我们的逻辑链条起
GEO分析

title R Notebook output html notebook 1 下载加载包 cran packages lt c tidyr tibble dplyr stringr ggplot2 ggpubr factoextra Fa

GEO分析

title: “R Notebook” output: html_notebook

1 下载加载包

2 下载数据

3 ID转换

3.1 方案一：可以找到对应平台

3.2 方案二：找不到GPL平台对应的R注释包

3.3 获取分组信息—group_list， 哪些组是control；哪些组是tumor

4 boxplot

4.1 检查表达矩阵，画典型基因表达量的boxplot

4.2 #各个样本表达量的boxplot， 准备画图所需数据exp_L

4.3 获得分组信息

5 ggplot2绘图，聚类，PCA

6 用limma对芯片数据进行差异分析

7 热图

8 火山图

9 富集分析

9.1 准备工作：首先对差异表达矩阵nrDEG，进行加工

1.把行名变成SYMBOL列

2.加change列：上调或下调，火山图要用

3.加ENTREZID列，后面富集分析要用

9.2 富集分析

9.2.1 clusterProfiler作kegg富集分析：

9.2.2 gsea作kegg富集分析

9.3 GO database analysis

9.3.1 富集分析

9.3.2 GO分析三大块

GEO分析 的相关文章

随机推荐

热门标签

title: “R Notebook”
output: html_notebook

3.3 获取分组信息—group_list，哪些组是control；哪些组是tumor

4.2 #各个样本表达量的boxplot，准备画图所需数据exp_L

GEO分析的相关文章