查看原文
其他

技术推荐|文献解读|Hi-C还原我们染色体的真实构想

老马 生信草堂 2022-06-15

生信草堂

将会与更多的优秀微信公众号合作,把更优秀的微信推文呈现给大家,希望可以帮助读者更多的了解生信技术,培养和提高读者的生信分析能力!

号外,号外,号外

你想和生信分析大神做好朋友么?

你想认识更多爱好生信分析的小伙伴么?

你想让自己的生信分析走上快车道么?

那就赶快加入我们的生信交流微信群吧!

正确加入我们的模式是:

添加我们的微信bioinformatics88为好友

标注“加入生信草堂交流群

在群里请大家注明自己本名,单位,研究领域

便于小编管理


01

什么是Hi-C技术?

2009年,Job Dekker 研究团队利用Hi-C技术通过测量人类正常淋巴细胞染色体中基因座空间交互信息,首次提出Hi-C技术的概念。


Hi-C技术——以高通量测序为手段,结合生物信息分析方法,以3C Chromosome Conformation Capture)技术为基础的染色质构象捕捉技术,研究全基因组范围内整个染色质DNA在空间位置上的关系,获得高分辨率的染色质三维结构信息。Hi-C技术不仅可以研究染色体片段之间的相互作用,建立基因组折叠模型,还可以应用于基因组组装、单体型图谱构建、辅助宏基因组组装等,并可以与RNA-seqChIP-seq等数据进行联合分析,从基因调控网络和表观遗传网络来阐述生物体性状形成的相关机制。

染色体的3D构象


02

为什么Hi-C技术那么火?

Hi-C技术之所以火了,应该归因于三维基因组学的热度。结构基因组测序得到了很多物种的基因组信息,需要对基因组进行精细结构的注释,解释基因组功能的复杂性和多样性。很多基因在染色体和染色质不同状态转换时(超螺旋、复杂折叠等),在空间上的距离不断发生变化。这些基因彼此之间如何调控、如何相互影响?是一个非常有吸引力的课题,需要大量的研究来探讨。Hi-C技术可以基于高通量进行染色体构象的捕获,它能够在全基因组范围内捕捉不同基因座位之间的空间交互,研究三维空间中调控基因的DNA元件。因此Hi-C技术火起来也是情理之中的事情。开创性的研究才能发高分文章哦~


03

怎么应用Hi-C技术?

知道了,Hi-C技术那么火!那怎么应用这个技术到我们的科研中呢?或者说有哪些研究可以用这个技术呢?Hi-C有很多用武之地,比如说,(1)探索基因组的3D结构,有助于了解基因组折叠对基因的表达和调控的影响;(2)开发调控基因的DNA元件,揭示基因组远程调控元件介导的分子网络;(3 构建染色质跨度的单体型图谱:为肿瘤形成机制提供依据、为疾病风险预测提供思路、为农业动植物经济性状连锁标记及基因组进化奠定基础;(4)可以与RNA-SeqChIP-Seq等数据进行联合分析,从基因调控网络和表观遗传网络来阐述生物体性状形成的相关机制。


04

Hi-C相关的高质量SCI文章

这么火的技术,从2009年推出以来,一直有高质量SCI文章发表,越来越多的研究利用Hi-C技术揭秘不同物种染色体的空间构象和调控机制。详细文章见下表:

基于Hi-C技术发表的部分文章列表

发表作者

发表时间

研究内容

发表期刊

研究物种

Lieberman-Aiden et al.

2009

人淋巴细胞染色体中基因座空间交互信息

Science

Sexton et al.

2012

构建果蝇分辨率的三维基因组互作图谱

Cell

果蝇

Dixon et al.

2012

人及小鼠胚胎干细胞的三维基因结构

Nature

人和小鼠

Rao et al.

2014

绘制人基因组详细的图谱

Cell

Chandra et al.

2015

衰老细胞的细胞核空间结构

Cell Reports

Mifsud et al.

2015

基因组启动子的空间互作

Nature Genetics

Barutcu et al.

2015

乳腺癌细胞染色体三维结构特征

Genome Biology

Manuel et al.

2017

心力衰竭细胞系高分辨率染色体构象解析

Circulation


05

如何分析Hi-C数据?

虽然Hi-C的优势在于其结合了二代测序,增加了数据分析结果的完整性,但是,这势必也使得其数据分析相对复杂了。想学习如何分析Hi-C数据?可以阅读生信草堂之前的推文:功能基因组学研究利器——Hi-C 

这篇推文详细介绍了Hi-C技术的:工作流程+生物信息学分析方法+数据的可视化。


06

文献解读:如何利用Hi-C技术研究乳腺癌发生机制?

这里我们给大家分享一篇发表在《Genome Biology》上的文章:“Chromatin interaction analysis reveals changes in small chromosome and telomere clustering between epithelial and breast cancer cells”。这篇文章利用Hi-C技术研究乳腺癌细胞染色体三维结构特征。


本文的样本选择是人乳腺上皮细胞系MCF-10A和乳腺癌细胞系MCF-7。利用的文库和测序策略是Hi-C文库(HiSeq 2000测序,PE100+转录组文库(HiSeq 2000测序,SE100)。

首先,通过进行1M分辨率下人乳腺上皮细胞系MCF-10A和乳腺癌细胞系MCF-7在染色体互作的差异分析,结果如下图:


通过染色体相互作用热图比较,肉眼很难发现它们之间的差异。本文采用“减法”算法,巧妙地将两个细胞系的互作热图整合到一张图中,发现1M分辨率下人乳腺上皮细胞系MCF-10A和乳腺癌细胞系MCF-7在染色体互作上存在差异(如上图)。 发现在16-22号染色体中,MCF-10A细胞系中有较强的基因相互作用(如下图)。


此前的研究表明,基因组内的相互作用有两种模式:开放式(A-type)和封闭式(B-type)。 在人乳腺上皮细胞系MCF-10A和乳腺癌细胞系MCF-7基因组中鉴定出了两种区室,MCF-10AMCF-7的开方式和封闭式区域分布大体相似,只有一些区域有AB区室或者BA区室的转化。这些转化区域中的很多基因和癌症重要通路WNT相关(如下图)。


MCF-10AMCF-7基因组中大规模染色体相互作用差异和改变的基因区室内是否会对TADTopologically associating domains 这里TAD被定义为相互调节的基因集,包含的基因的增强子和启动子之间相互作用)形成和基因表达造成影响是未知的。为解决这个问题,用40kb分辨率来鉴定TAD边界,发现一些TAD边界是乳腺癌细胞系特有的(如下图)。

PS:后台发送“3.7文献”领取文献解读的文献


本 期 推 荐

功能基因组学研究利器——Hi-C

MAGMA很好的GWAS数据通路富集方法|别样的公共数据库挖掘(内有练习资料)

公共数据库,SCI怎么发?(一)|内有视频讲解





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存