1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/jmzeng-GEOmirror

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
Внести вклад в разработку кода
Синхронизировать код
Отмена
Подсказка: Поскольку Git не поддерживает пустые директории, создание директории приведёт к созданию пустого файла .keep.
Loading...
README.en.md

GEOmirror

Пакет для исследователей из материкового Китая, который позволяет загружать набор данных GEO. Он является заменой функции getGEO из пакета GEOquery.

Как установить

Установите разрабатываемую версию с Github:

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
BiocManager::install("GEOquery")

library(remotes)
url='https://gitee.com/jmzeng/GEOmirror.git' 
install_git(url)

Если это не удалось, возможно, проблема связана с плохим интернет-соединением. Вы также можете загрузить этот проект прямо на свой компьютер, а затем установить его локально.

Только одна функция: geoChina

Используйте её для загрузки набора данных GEO следующим образом:

library(GEOquery)
library(GEOmirror)
eSet=geoChina('GSE1009') 
eSet=geoChina('GSE27533') 
eSet=geoChina('GSE95166') 

Простая загрузка набора данных GEO и последующий анализ

После загрузки ExpressionSet набора данных GEO вы можете получить доступ к матрице экспрессии и данным фенотипа:

library(GEOquery)
library(GEOmirror)
## скачать данные GSE95166
# https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE95166
#eSet=getGEO('GSE95166', destdir=".", AnnotGPL = F, getGPL = F)[[1]]
library(GEOmirror)
eSet=geoChina('GSE95166')
eSet
eSet=eSet[[1]]


probes_expr <- exprs(eSet);dim(probes_expr)
head(probes_expr[,1:4])
boxplot(probes_expr,las=2)

## информация о фенотипе
phenoDat <- pData(eSet)
head(phenoDat[,1:4])
# https://www.ncbi.nlm.nih.gov/pubmed/31430288

groupList=factor(c(rep('npc',4),rep('normal',4)))
table(groupList)
eSet@annotation
# GPL15314	Arraystar Human LncRNA microarray V2.0 (Agilent_033010 Probe Name version)

Простой пример последующего анализа профилирования экспрессии с помощью массива:

genes_expr=probes_expr
library("FactoMineR")
library("factoextra")
dat.pca <- PCA(t(genes_expr) , graph = FALSE)
dat.pca
fviz_pca_ind(dat.pca,
             geom.ind = "point",
             col.ind = groupList,
             addEllipses = TRUE,
             legend.title = "Groups"
)
library(limma)
design=model.matrix(~factor(groupList))
design
fit=lmFit(genes_expr,design)
fit=eBayes(fit)
DEG=topTable(fit,coef=2,n=Inf)
head(DEG)
# Мы обнаружили, что 2107 lncRNAs были активированы,
# в то время как 2090 lncRNAs были подавлены более чем в 2 раза,
# NKILA среди этих подавленных lncRNAs (рис. 1A, GSE95166).

## для графика вулкана
df=DEG
attach(df)
df$v= -log10(P.Value)
df$g=ifelse(df$P.Value>0.05,'stable',
            ifelse( df$logFC >1,'up',
                    ifelse( df$logFC < -1,'down','stable') )
)
table(df$g)
df$name=rownames(df)
head(df)
library(ggpubr)
ggpubr::ggscatter(df, x = "logFC", y = "v", color = "g",size = 0.5,
          label = "name", repel = T,
          label.select =head(rownames(df)),
          palette = c("#00AFBB", "#E7B800", "#FC4E07") )
detach(df)


x=DEG$logFC
names(x)=rownames(DEG)
cg=c(names(head(sort(x),100)),
     names(tail(sort(x),100)))
cg
library(pheatmap)
n=t(scale(t(genes_expr[cg,])))
n[n>2]=2
n[n< -2]=-2
n[1:4,1:4]
ac=data.frame(groupList=groupList)
rownames(ac)=colnames(n)  
pheatmap(n,show_colnames =F,show_rownames = F,
         annotation_col=ac)

На самом деле, я должен изменить идентификатор зонда на имена генов, но это не задача этого пакета, поэтому я просто опускаю это.

Предупреждения

    1. Только наборы данных профилирования экспрессии методом массива будут предлагаться нашим пакетом.
    1. Это бесплатно для всех нас, поэтому мы не можем гарантировать, что интернет-соединение всегда будет лучше, чем у GEOquery.

Комментарии ( 0 )

Вы можете оставить комментарий после Вход в систему

Введение

Были созданы резервные копии матриц объёмов данных чипов и клинической информации, которые включают в себя почти все данные из матрицы объёмов в наборе данных чипов в базе данных GEO. Развернуть Свернуть
MulanPSL-2.0
Отмена

Обновления

Пока нет обновлений

Участники

все

Недавние действия

Загрузить больше
Больше нет результатов для загрузки
1
https://api.gitlife.ru/oschina-mirror/jmzeng-GEOmirror.git
git@api.gitlife.ru:oschina-mirror/jmzeng-GEOmirror.git
oschina-mirror
jmzeng-GEOmirror
jmzeng-GEOmirror
master