GEOmirror
Пакет для исследователей из материкового Китая, который позволяет загружать набор данных GEO. Он является заменой функции getGEO из пакета GEOquery.
Установите разрабатываемую версию с Github:
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("GEOquery")
library(remotes)
url='https://gitee.com/jmzeng/GEOmirror.git'
install_git(url)
Если это не удалось, возможно, проблема связана с плохим интернет-соединением. Вы также можете загрузить этот проект прямо на свой компьютер, а затем установить его локально.
Используйте её для загрузки набора данных GEO следующим образом:
library(GEOquery)
library(GEOmirror)
eSet=geoChina('GSE1009')
eSet=geoChina('GSE27533')
eSet=geoChina('GSE95166')
После загрузки ExpressionSet набора данных GEO вы можете получить доступ к матрице экспрессии и данным фенотипа:
library(GEOquery)
library(GEOmirror)
## скачать данные GSE95166
# https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE95166
#eSet=getGEO('GSE95166', destdir=".", AnnotGPL = F, getGPL = F)[[1]]
library(GEOmirror)
eSet=geoChina('GSE95166')
eSet
eSet=eSet[[1]]
probes_expr <- exprs(eSet);dim(probes_expr)
head(probes_expr[,1:4])
boxplot(probes_expr,las=2)
## информация о фенотипе
phenoDat <- pData(eSet)
head(phenoDat[,1:4])
# https://www.ncbi.nlm.nih.gov/pubmed/31430288
groupList=factor(c(rep('npc',4),rep('normal',4)))
table(groupList)
eSet@annotation
# GPL15314 Arraystar Human LncRNA microarray V2.0 (Agilent_033010 Probe Name version)
Простой пример последующего анализа профилирования экспрессии с помощью массива:
genes_expr=probes_expr
library("FactoMineR")
library("factoextra")
dat.pca <- PCA(t(genes_expr) , graph = FALSE)
dat.pca
fviz_pca_ind(dat.pca,
geom.ind = "point",
col.ind = groupList,
addEllipses = TRUE,
legend.title = "Groups"
)
library(limma)
design=model.matrix(~factor(groupList))
design
fit=lmFit(genes_expr,design)
fit=eBayes(fit)
DEG=topTable(fit,coef=2,n=Inf)
head(DEG)
# Мы обнаружили, что 2107 lncRNAs были активированы,
# в то время как 2090 lncRNAs были подавлены более чем в 2 раза,
# NKILA среди этих подавленных lncRNAs (рис. 1A, GSE95166).
## для графика вулкана
df=DEG
attach(df)
df$v= -log10(P.Value)
df$g=ifelse(df$P.Value>0.05,'stable',
ifelse( df$logFC >1,'up',
ifelse( df$logFC < -1,'down','stable') )
)
table(df$g)
df$name=rownames(df)
head(df)
library(ggpubr)
ggpubr::ggscatter(df, x = "logFC", y = "v", color = "g",size = 0.5,
label = "name", repel = T,
label.select =head(rownames(df)),
palette = c("#00AFBB", "#E7B800", "#FC4E07") )
detach(df)
x=DEG$logFC
names(x)=rownames(DEG)
cg=c(names(head(sort(x),100)),
names(tail(sort(x),100)))
cg
library(pheatmap)
n=t(scale(t(genes_expr[cg,])))
n[n>2]=2
n[n< -2]=-2
n[1:4,1:4]
ac=data.frame(groupList=groupList)
rownames(ac)=colnames(n)
pheatmap(n,show_colnames =F,show_rownames = F,
annotation_col=ac)
На самом деле, я должен изменить идентификатор зонда на имена генов, но это не задача этого пакета, поэтому я просто опускаю это.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )