背景
GEO数据库很多表达矩阵需要我们下载平台的探针注释文件,再得出基因表达矩阵。
如何优雅的使用R语言快捷的下载出来呢?
国外友人开发了geneExpressionFromGEO包。
使用方法
library(geneExpressionFromGEO)
library(limma)
library(GEOquery)
GSE="GSE3268"
af <- getGeneExpressionFromGEO(GSE,retrieveGeneSymbols=T,verbose=T)
af=t(af)
colnames(af)=af[nrow(af),]
af=t(af)
af=avereps(af)
af=af[,-ncol(af)]
afmt=rbind(ID=colnames(af),af)
write.table(afmt,file="matrix.txt",sep="\t",quote=F,col.names = F)
将以上的GSE3268替换为你需要的gse数据集号,就可以直接下载出来了。
后记
不过值得注意的是该R包仅适用于
Platforms available: GPL11532, GPL23126, GPL6244, GPL8300, GPL80, GPL96, GPL570, GPL571, GPL20115, GPL1293, GPL6102, GPL6104, GPL6883, GPL6884, GPL13497, GPL14550, GPL17077, GPL6480
等特定的平台,期待该包后续的升级更新了。 |