Affy芯片ATH1-121501探针注释的处理
BioC有Affy芯片ATH1-121501(GPL198平台)的注释库文件(R包),芯片分析后期处理经常要使用,导出方法如下。
先安装BioC的ath1121501.db包:
library("BiocInstaller")
biocLite("ath1121501.db")
使用plyr揉数据包整理探针id和AGI:
library(ath1121501.db)
library(plyr)
mapagis <-mappedkeys(ath1121501ACCNUM)
agis <- as.list(ath1121501ACCNUM[mapagis])
agis <- ldply(agis, paste, collapse="; ")
colnames(agis) <- c("id", "agi")
head(agis)
## id agi
## 1 244901_at ATMG00640
## 2 244902_at ATMG00650
## 3 244903_at ATMG00660
## 4 244904_at ATMG00670
## 5 244905_at ATMG00680
## 6 244906_at ATMG00690
还可以整合基于名称(符号):
mapsymb <-mappedkeys(ath1121501SYMBOL)
symb <- as.list(ath1121501SYMBOL[mapsymb])
symb <- ldply(symb, paste, collapse="; ")
colnames(symb) <- c("id", "symbol")
head(symb)
## id symbol
## 1 244901_at ORF25
## 2 244902_at NAD4L
## 3 244903_at ORF149
## 4 244904_at ORF275
## 5 244905_at ORF122C
## 6 244906_at ORF240A
results <- merge(x=agis, y=symb, by="id", all = TRUE)
head(results)
## id agi symbol
## 1 244901_at ATMG00640 ORF25
## 2 244902_at ATMG00650 NAD4L
## 3 244903_at ATMG00660 ORF149
## 4 244904_at ATMG00670 ORF275
## 5 244905_at ATMG00680 ORF122C
## 6 244906_at ATMG00690 ORF240A
当然还可以有基因本体注释(ath1121501GO)和KEGG途径,方法一样不用赘述。
作者: ZGUANG@LZU
Created: 2017-12-04 一 07:36
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)