查看原文
其他

又见数据挖掘|遗传与调控数据揭示肺癌亚型之间的若即若离

House 生信草堂 2022-06-15

生信草堂

将会与更多的优秀微信公众号合作,把更优秀的微信推文呈现给大家,希望可以帮助读者更多的了解生信技术,培养和提高读者的生信分析能力!

正确加入我们的模式是:

添加我们的微信bioinformatics88为好友

标注“加入生信草堂交流群

在群里请大家注明自己本名,单位,研究领域

便于小编管理

征稿邮箱

glb-biotech@zju.edu.cn

详情阅览

一手科研开花,一手赚钱养家

背景介绍

肺癌有两种主要的亚型:小细胞肺癌(Small cell lung cancer,SCLC)和非小细胞肺癌(non-small cell lung cancer, NSCLC),非小细胞肺癌又可分为肺腺癌(lung adenocarcinoma ,LUAD)和肺鳞状细胞癌(lung squamous cell carcinoma ,LUSC)。研究表明肺癌亚型之间存在一定的差异,主要体现在发病区域和原发细胞不同以及somatic mutation种类不同。但目前还没有文献在germline水平揭示各种肺癌亚型之间独特的或者共有的调控基因。

刚刚发表在《Genome Medicine》上的一篇文章巧妙地回答了以上问题。作者首先用来自于三种肺癌亚型的全基因组关联分析(GWAS)的适度显著信号(p < 1 × 10-3)之间进行比较,寻找三者共有的SNP。随后,在遗传调控水平上寻找由SNP影响的增强子的目标基因是否在三种亚型之间共享。最后,作者利用来自TCGA的基因型数据进行PCA分析,进一步在germline水平上阐释三种肺癌亚型之间的关系。下面就来详细解读一下。

正 文

1三种肺癌亚型之间仅有微弱的共有遗传信号

通过比较三种肺癌亚型的GWAS位点(p < 1 × 103),研究人员发现有10个三种肺癌亚型的共有SNP。在排除掉具有连锁不平衡的SNP之后,仅仅有一个SNP的信号保留(如图1)。该SNP是rs578776,位于CHRNA3的3’UTR区域。CHRNA3基因已经被很多研究证明于多种肺癌的发生发展相关。

图1. 三种肺癌亚型SNP位点之间比较结果

                                             

2鉴定eQTL基因和enhancer目标基因

SNP功能注释是遗传关联分析的重要步骤。通常认为距离显著SNP位点最近的基因具有比较重要的功能,但最近的很多重要文献都强调了SNP的远端调节作用,即通过影响基因表达和转录因子活性来调节基因。因此,本文在进行SNP注释时就首先考虑SNP的调控作用,作者通过GTEx数据库寻找能被SNP调控表达的基因,通过FANTOM数据库寻找SNP所在增强子区域的目标靶基因,形成一套基因鉴定流程,如图2.

图2. 基于eQTL和enhancer调控的基因鉴定流程


作者分别对三种肺癌亚型进行SNP功能注释,将以上流程鉴定得到的基因称为germline-regulated genes,然后比较这些基因之间是否重叠。如图3,一共有5个基因同时出现在三种肺癌亚型中,分别是CHRNA5, IDH3A, PSMA4, RP11-650 L12.2 TBC1D2B

图3. Germline-regulated genes在三种肺癌亚型之间的比较


此外,作者对三种癌症亚型找到的基因集合做了KEGG pathway的富集分析,发现共同富集在新陈代谢通路和蛋白酶体通路,如图4.

图4. 三种癌症亚型KEGG pathway富集结果


3TCGA基因型数据PCA分析

经过在SNP水平和基因水平的比较,作者发现三种肺癌亚型之间的共有信号不是很强烈。为了进一步扩展该结论,作者利用TCGA中6种癌症的基因型数据进行聚类分析。PCA分析能够在germline水平探究样本之间的遗传相似度,相似性越高,样本间聚类的距离就越近。通过比较六种癌症类型之间的相互距离,作者发现LUAC和LUSC之间的距离并没有比它们于其他癌症的距离更近,如图5。

图5. TCGA基因型数据PCA聚类分析


总 结

这篇文章在方法和生物学意义上都给了我们一定启发。通过借助GWAS,eQTL,enhancer等数据,寻找在不同肺癌亚型之间起共同调控作用的分子,结合基因型数据进一步探究癌症种类的亲缘关系。本文填充了germline水平上三种肺癌亚型的关系比较,告诉人们肺癌亚型之间存在一定程度上的异质性。

参考文献

O’Brien T D, Jia P, Caporaso N E, et al. Weak sharing of genetic association signals in three lung cancer subtypes: evidence at the SNP, gene, regulation, and pathway levels[J]. Genome Medicine, 2018, 10(1):16.


PS:发送“4.9文献”至后台获取解读文献

本文为生信草堂原创,欢迎个人转发分享,其它媒体或网站如需转载,请在正文前注明转自生信草堂并联系bioinformatics88

本周生物资讯锦集

相约华家池—转录组分析讲习班回顾

公共数据挖掘|利用GWAS和GEO expression数据揭示心血管疾病和二型糖尿病的共同分子调控网络




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存