查看原文
其他

公共数据库,SCI怎么发?(三)

2017-11-06 老马 生信草堂

生信草堂

将会与更多的优秀微信公众号合作,把最优秀的微信推文呈现给大家,希望可以帮助读者更多的了解生信技术,培养和提高读者的生信分析能力!

号外,号外,号外

你想和生信分析大神做好朋友么?

你想认识更多爱好生信分析的小伙伴么?

你想让自己的生信分析走上快车道么?

那就赶快加入我们的生信交流微信群吧!

正确加入我们的模式是:

添加我们的微信bioinformatics88为好友

标注“加入生信草堂交流群

在群里请大家注明自己本名,单位,研究领域

便于小编管理


上面几期我们已经介绍了一些关于如何利用公共数据库中的数据发表SCI论文。如:公共数据库, SCI怎么发?(一)公共数据库, SCI怎么发?(二)

本期向大家推荐的一篇2017年刚发表的SCI文章,看作者们是如何利用公共数据库中已有的表达数据,重新分析,发现新的结果。


这篇文章,作者是想通过分析NCBI GEO数据库、Array Express数据库和Stanley Medical Research Institute Online Genomics数据库里与抑郁症研究有关的基因表达数据,发现新的与抑郁症相关的调节基因,并整合已有的GWAS、DNA 甲基化和miRNA表达数据进行分析。
抑郁症

是一种常见的精神疾病。单词缩写为Major Depressive Disorder,简称为:MDD。主要表现为情绪低落,兴趣减低、悲观、思维迟缓、缺乏主动性、饮食和睡眠差等等。担心自己患有各种疾病,感到全身多处不适,严重者可出现自杀念头和行为。目前,世界范围内抑郁症的发病率在11.2%,正在不断危害着人们的生产和生活。

近些年来,研究人员通过开展许多全基因组水平表达研究(Genome-wide expression studies, GWES)绘制抑郁症的表达谱。 这些研究基于一定数量的抑郁症患者和健康对照样本,并利用商业基因芯片平台对大量编码基因进行差异表达分析。利用这些发现的结果,可以进行miRNA、GO、KEGG等功能分类的富集分析,有利于发现抑郁症相关的生物信号通路及发病分子机制。考虑到Meta-analysis可以整合不同的数据集增大样本量,有利于发现更加可靠地结果。本文就基于抑郁症已有的GWES数据进行comprehensive meta-analysis。


1

材料收集

作者从三大表达数据库: NCBI GEO数据库、Array Express数据库和Stanley Medical Research Institute Online Genomics数据库中搜索基于case-control设计并含有原始数据的研究。另外,利用关键词检索(major depression 和 major depressive disorder)在PubMed和Google Scholar中检索可能存在的数据。还人工地查询了所有合格研究的参考文献以便找到其它未被PubMed或Google Scholar数据库索引的研究。
收集到的数据集如下图所示:6个数据集来自于Blood(Blo, 血液样本),2个数据集来自于Amygdala (Amy,杏仁体:大脑中的两个区域之一,与记忆、情绪及嗅觉有关),2个数据集来自于Cerebellum (Cer, 小脑),5个数据集来自于Anterior cingulate cortex (ACC, 前扣带皮层),9个数据集来自于Prefrontal cortex (PFC, 前额皮质)。


2

数据处理

基于Affymetric平台的原始数据(.CEL.files),利用R的affy包处理和标准化。基于其他平台,如Illumina或Agilent平台,直接下载处理够的数据进行后续分析。注释文件从NCBI GEO数据库下载。


3

Meta分析

本文基于random-effects model和rank-aggregation method的NetworkAnalyst在线软件进行全基因组表达水平的meta-analysis。FDR < 0.05表示矫正后显著。对5个不同区域发现的差异表达基因可以用Venn图进行找到共有基因。


4

功能性富集分析

利用DAVID和Babelomics在线分析软件对发现的差异表达基因进行功能性富集分析。富集的类别包括:Gene Ontology、KEGG、Chromosomal Location、miRNA Targets、Transcription Factor Binding Sites (TFBS)。


5

PPI网络分析

来自于Amygdala和Prefrontal cortex数据集的差异表达基因,作者从Human Interactome Project数据中找到已有的PPI数据。Cytoscape软件用于PPI网络的可视化。Babelomics 5中的SNOW工具用于PPI网络的富集分析。


6

其它基因组或者转录组数据集的验证

1. List of top SNPs were extracted from a mega-analysis of GWAS for MDD.

2. A GWAS for response to treatment with selective serotonin reuptake inhibitors.

3. A meta-analysis of GWAS for neuroticism.

4. A GWES for response to two antidepressants in a murine model.

5. Top protein-coding genes were extracted from genome-wide epigenetic analysis of MDD in brain and blood.

6. Top miRNAs were retrieved from a systematic study of miRNA expression in MDD.

7. A list of known druggable genes.


7

结果

通过分析,作者在不同组织区域中找到了一些差异表达的基因,Blood:25个,Amy:793个,Cer:231个,ACC:668个,PFC:252个。

基于不同区域的富集分析也找到了显著富集的功能分类:GO, signaling pathway和topographic parameters。

GWAS、DNA methylation和miRNA expression研究也有一致性证据发现。如一些差异表达基因富集在脑部表达的miRNA的靶基因上,而在之前的研究中已有证据显示这些miRNA与MDD有关。


小结:

这是关于MDD研究中最大的一个GWES。通过不同组学证据的整合,给我们提供了一个全面的概观了解导致MDD发生的潜在神经信号紊乱机制。同时,提供一些与MDD有关的差异基因可用于后续的研究。


查看相关文章

公共数据库,SCI怎么发?(一)

公共数据库, SCI怎么发?(二)

想发Meta的看这里 | Meta分析,SCI怎么发?

迟早会用到的SCI句型

几分钟,使用MedSci搜索SCI期刊最新的信息







您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存