登录
首页 >> 健康生活

Nat,Genet:对表观遗传的遏制或可抑制基因组的不稳定性

妙手生春 2024-05-29 11:41:17

Nat,Genet:对表观遗传的遏制或可抑制基因组的不稳定性

2016年10月13日讯 最近,刊登于国际杂志Nature Genetics上的一项研究报告中,瑞士巴塞尔弗雷德里希米歇尔研究所的研究人员通过研究发现,真核生物或许能够通过特殊的途径来保护基因组免于重排以及因重复DNA而带来的剔除。人类的基因组就好比是某些简单动物的基因组,比如线虫,其中充满着重复的序列,而其中很多序列都是过去病毒感染的残留物,这种重复的DNA通常都处于静默状态。

研究者发现,这些重复的DNA转录成为RNA就能够产生RNA和DNA的毒性杂交体,而这些异常的R-环(R-loop)就会导致缺失和插入,从而影响基因组的完整性;位于组蛋白上的甲基化基团就能够充当细胞机器中的一种信使来确定是否DNA序列能够被转录,而且H3赖氨酸9位上的组蛋白甲基化处于更加紧密地包裹状态,而且缠绕在其上面的DNA并不易于到达转录机器,当其不能够被表达时,组蛋白甲基化就会使得基因保持沉默状态,然而组蛋白甲基转移酶(HMTs)却能够参与细胞的分化以及一系列癌症的发生,其特殊的抑制剂目前正处于临床试验中。

这项研究中,研究者想通过研究阐明,当从复杂有机体中消除大量组蛋白修饰后会发生什么,研究者发现HMTs在发育过程中是非常必要的,而且其在基因组稳定性上扮演着重要角色。HMTs能够对组蛋白H3在赖氨酸9位上进行甲基化(H3K9me HMTs),哺乳动物的细胞中至少含有8种H3K9的组蛋白甲基转移酶,研究者发现,重复性元件中H3K9me的存在非常重要,当H3K9甲基化缺失时,这些区域就会转录成为RNA,而且不合适的转录往往和插入、缺失以及拷贝数变化直接相关,缺少特殊的HMTs会直接导致基因组突变率水平的提高。

当细胞中的复制机器被阻断时,不必要的DNA损伤就会产生,而其中一个常见的原因就是具有转录作用的DNA复制聚合酶的“碰撞”导致的,研究者假设,R环状结构能够产生在H3K9me缺失的线虫机体中发现的突变。最后研究者Gasser说道,对于目的是抑制H3K9甲基转移酶的癌症疗法而言,本文研究或许是一条重大新闻;我们并不想利用一种癌症疗法的制剂来使得健康细胞的基因组变得不稳定,尤其是考虑到H3K9me的缺失会以惊人的速度引入缺失和插入;后期研究中研究者希望能够阐明是否本文中对线虫的研究结果能够直接影响人类癌症的靶向性疗法。

综述-测序时代的结构变异

该文大部分来自Nature Reviews Genetics的综述“Structural variation in the sequencing era” 的翻译,详细内容请阅读 原文 。

鉴定结构变异对于进一步了解基因组的特征至关重要。但由于之前的基因组测序技术具有明显的局限性,鉴定结构变异一直是一个难题。随着第三代单分子测序和相关鉴定算法的发展,以使数百万SV的鉴定成为可能。研究发现,SV与疾病和一些生物机制的调控密切相关。鉴于SV的类型和大小的多变性,以及新的基因组技术的检测偏差,因此,解决多平台间造成的差异,构造较为一致的结构变异图谱很有必要。作者回顾了当前鉴定SV的方法,并提出将生物学信息与SV结合起来将对全面了解SV对人类基因组的影响是很必要的。

个体间遗传变异一般分为两种,一类是长度<50bp的,包括单核苷酸变异( single- nucleotide variants, SNVs)和小的插入和删除(indels);另一类是> 50 bp的结构变异( structural variations,SVs)。进一步可以将SV细分为非平衡的拷贝数变异(CNVs),包括插入,删除和重复;以及平衡的重排,包括倒位和染色体内及染色体间的易位。此外,SV还包括转座子插入,拷贝数高度可变的多等位基因CNV,片段重复和复杂重排。

相较于SNV等鉴定的准确性和研究的广泛性,SV的鉴定和分析却远远落后,这是由于SV的鉴定不准确并且对应的参考基因组也缺乏多样性,样本量和测序深度。随着新的测序技术和SV鉴定算法的发展,使得集合多个软件来从多种测序技术的数据中鉴定SV成为可能。

SV的检测策略一般包括4种:Read-pair,Read-depth,Split-read,Sequence assembly,关于其详细的介绍可参考这篇文章: 一篇文章说清楚基因组结构性变异检测的方法 。然而,现有的大多数软件采用的为单一的检测策略,因此不能很好的全面检测结构变异。所以,比较好的方式就是进行多策略多工具整合,以全面检测结构变异。但这样又会带来一个问题,多个软件的结果如何合并和过滤,作者根据已有的研究,总结了主要的几个标准,包括断点置信区间重叠情况,断点距离,鉴定错误率的大小,采取的鉴定策略优先级,鉴定结果的一致性等,几乎所有的整合工具都考虑了SV的坐标是否重叠,总结一下也就是下面这张图:

现有的整合多种策略进行SV鉴定的工具(针对二代测序数据)有如下几个:

这些整合多策略的工具仍然有其局限性,主要是由二代短读长数据导致,大片段的结构变异无法准确检测到,仅能检测重复区域之外的小片段的SV。

合成长reads测序技术有很多,包括合并克隆测序,Illumina合成长reads测序,10x Genomics reads连接测序等。这种长reads很适合用来鉴定SV,由于低错误率和读长较长(多达100kb),因此很多时候用来构建单体型。利用这种数据鉴定SV的方法有Long Ranger,GROC- SVs,LinkedSV,NAIBR,VALOR2,ZoomX,详细见下表:
[图片上传失败...(image-d74713-1576071182641)]
[图片上传失败...(image-c7bbb7-1576071182641)]

该方法仅对双链中的模板链进行测序,因只含一条链,故该方法可以用来构建单倍型。该测序方法可以用于检测倒位,大片段的缺失和重复等,相应地检测工具有BAIT和Invert.R。
[图片上传失败...(image-ee6ae1-1576071182641)]
[图片上传失败...(image-477986-1576071182641)]

Hi-C的reads长度可以达到Mbp级别,从而使得其适合用于检测大片段的SV,尤其是易位,检测出的SV片段大小一般大于2Mb。然而由于reads长度太长,Hi-C并不适合检测小片段的SV。检测的工具主要包括HiCNV + HiCtrans,Hi-C Breakfinder。
[图片上传失败...(image-bb58a4-1576071182641)]
[图片上传失败...(image-f47b6a-1576071182641)]

检测SV的算法一般通过利用reads内部和reads之间的特征来检测SMRT数据中的SV。对于reads内部的特征,可以直接用来鉴定SV,一般是序列删除和插入。而对于reads之间的特征,可能涉及多个reads,相关检测工具一般是通过在reads与参考基因组比对后的结果中从reads方向,位置等的异常中检测出SV。采用这种方法的工具有CORGi,PBHoney,pbsv,Sniffles,SMRT-SV,SVIM。
[图片上传失败...(image-9eb503-1576071182641)]
[图片上传失败...(image-3c56dc-1576071182641)]

用于从ONT数据中检测SV的方法与PacBio数据中的类似,工具主要包括 NanoSV, Picky, Sniffles,SVIM。有研究表明,ONT数据的检测SV工具对于小片段的SV的检测并不准确,所以,ONT数据并不适用于检测小片段SV(< 200bp)。

光学图谱系统基于单分子光学图谱技术,通过其特有的芯片技术使完整的单一DNA分子可以在纳米通道中平行排列,拍照成像,可以展示更完整的基因图谱。通过将光学图谱上的标记于已酶切的参考基因组比较来鉴定SV:缺失或多余的标记以及标记间的距离可以用来确定是否有缺失或插入;重复的标签表明有序列重复;非参考序列上存在独特的切口表示有易位;切口反向表示有倒位。光学图谱生成的片段一般长达1Mb,从而使得其适合于检测大片段的重排和插入,也可检测重复区域中的。由于光学图谱产生的片段是酶切过的,所以检测SV的分辨率很难达到碱基级别。由于光学图谱的成本较低,所以在只是检测一些大片段的SV时选光学图谱还是一个不错的选择。相应的检测工具主要包括 OMSV,Bionano Solve。

[图片上传失败...(image-605067-1576071182641)]

利用多个平台产生的数据来检测SV,这方面的工具主要有两个:MultiBreak- SV,HySA。
[图片上传失败...(image-c932f4-1576071182641)]
[图片上传失败...(image-537ea1-1576071182641)]

有一些工具也可以用来检测一些复杂的SV,列举如下:
[图片上传失败...(image-29c029-1576071182641)]
对于不同平台的数据,SV在其中的表现形式也不太相同,作者为此进行了总结:

SV不只是检测完就这么简单,还需要阐明发生SV背后的生物学机制以及造成的影响,这就需要将鉴定到的SV与现有的生物学信息(包括基因表达,表观遗传和三维基因组结构)结合起来综合分析,才能达到最终的研究目的。有研究就发现,SV比SNV和indels对基因表达的影响要大很多。作者也进行了相关总结,以帮助理如何将SV与其他生物学数据结合分析。
[图片上传失败...(image-c4d736-1576071182641)]
更多更详细的内容还请阅读文章原文,更好的阅读体验请移步我的博客 综述-测序时代的结构变异 。

Ho, S.S., Urban, A.E. & Mills, R.E. Structural variation in the sequencing era. Nat Rev Genet (2019) doi:10.1038/s41576-019-0180-9

浅谈全基因组复制

多倍化(polyploidy)或全基因加倍/复制(whole genome duplication, WGD)事件是指基因组内的所有序列都发生重复,重复为生物进化提供了原始的遗传材料,使植物基因组快速重组,丢失大量基因,增加结构变异,对植物进化极其重要。

多倍体植物广泛存在于自然界中,如日常生活中的马铃薯、小麦、棉花等。多倍化事件或全基因组复制事件直接将染色体进行加倍,被认为是一种物种分化的驱动力。研究发现多倍化在有花植物进化过程中十分频繁,在现存的被子植物和种子植物分化之前,都分别发生过加倍事件,可能对花和种子的产生有重要贡献 (Jiao et al., 2011)。基因组加倍为物种提供了丰盛的演化材料(图1)。被认为是提升了物种多样性、环境适应能力等(Jiao, 2018)。多倍化后的物种需要在原植物多倍化的研究对于生物进化、物种保护及遗传育种等方面都具有重要的理论指导意义及实践应用价值。

鉴定全基因组复制的方法一般可以通过以下三种:

下面我们就前两种方式进行重点介绍。

基因组共线性是基因组加倍比较直接的证据,通过比较两个基因组的序列并将共线性的区域作图展示,可以直观发现全基因组加倍的痕迹,如图2(左)苹果基因组(Daccord et al., 2017)的circos图中,可以明显染色体间大片段的共线性,表明该物种近期发生了全基因组复制。在向日葵基因组(Badouin et al., 2017)中,通过基因组自身的比对展示如图2(右),对角线为物种自身的基因和其本身的共线性。其余的点为基因组其他位置的旁系同源基因对。图中红色圆圈标注的位置,表明这两段之间具有一定的共性,为基因组加倍事件留下的痕迹。

如果物种经历过多次全基因组加倍事件,近期的加倍事件会加速早期加倍事件的基因丢失,早期的加倍事件痕迹往往越来越不明显,共线性直观上不明显,这就需要我们探索其他方式来挖掘加倍事件,这就用到了4DTv和Ks的信息。下面我们对这两种方式来进行简单的介绍。

同义突变指突变并不影响氨基酸序列,进而不会影响蛋白结构与功能。一般认为,同义突变不受自然选择,同义突变率(Ks)的计算为同义突变SNP数/同义位点数。由于同义位点突变不会引起氨基酸的变化,可以认为对编码蛋白没有影响,那么密码子同义位点的变化是完全随机的,并随时间推移累积。如果物种发生了全基因组加倍事件,现有基因组中会有一定数量的基因保留下来,这些基因在进化过程中累积的同义突变接近,计算得到的Ks值也接近,在某一个Ks值处会形成一个峰(ks peak)。如果这处Ks值的基因数目足够多,就会形成比较间的峰值,可以认为在进化过程中该处发生过全基因组加倍事件。全基因组加倍发生的时间越久远,基因丢失越多,发生的变化也要越大,形成的Ks峰越扁平,影响对全基因组加倍事件的判断。

4DTv与Ks有异曲同工之处(Tang et al., 2008),如果密码子的某个位点上任何核苷酸的改变都不影响其都编码的氨基酸,则称这个位点为4倍简并位点(fourfold degenerate site)是指共线性区段所包含的基因对的4DTV值可反映物种在进化史中的物种相对分化事件以及全基因组复制事件。4DTV指4D位点上发生颠换(嘌呤突变为嘧啶或者嘧啶突变为嘌呤)的位点所占的比例。

以辣椒基因组文章中的4DTv和罂粟基因组文章中的Ks结果为例,解析全基因组复制事件。在辣椒基因组(Qin et al., 2014)文章中(如图3),选取了辣椒(pepper)、葡萄(grape)、土豆(potato)、番茄(tomato)进行4DTv分析。结果如下图。从图中可以看出在辣椒和葡萄分后(黄色线,4DTv值0.5处),茄科植物辣椒、土豆和番茄在分化之前共同发生了全基因组复制(图中指示WGD位置,黑线、蓝线和红线在4DTv值0.3处的峰值),之后辣椒和番茄分开(图中绿线,4DTv值0.1处)。关于4DTv如何推断全基因组加倍时间,文章中也给出了建议:在4DTv值0.48和0.1处分别为辣椒和葡萄、辣椒和番茄的物种分化时间,对应的时间点为?89和20Mya,辣椒、番茄和土豆共有的全基因组加倍事件在4DTv值约0.3处,基于此可以大致推断该全基因组复制事件发生的时间约在55Mya。

在罂粟基因组文章(Guo et al., 2018)中,选取了罂粟(opium poppy)、耧斗菜(Aquilegia coerulea)、莲(otus)、葡萄(grape)、拟南芥(Arabidopsis)进行Ks分析,结果如图4,从Ks峰图和进化树可以看出,葡萄和罂粟在Ks值约1.6处(黄线)分开,葡萄在Ks值约1.4处(绿线)发生了核心双子叶植物共有的全基因组三倍化事件,耧斗菜在Ks值约1.0-1.2处发生了单独的全基因组复制,由于复制时间比较久远,所以峰较为扁平,莲在Ks值约0.5处发生了单独的全基因组复制事件,罂粟在Ks值约0.1处发生了全基因组复制,这是一个较为近期的全基因组复制事件。通过公式T=Ks/2r可以计算全基因组加倍事件发生的时间,r为核苷酸替代率,在文章中使用了6.98 × 10-9,计算得到的加倍时间在7.8百万年前。

全基因组加倍后的复制基因的命运各有不同,其保留与丢失是否有偏向性?哪些基因倾向于保留,保留基因功能是否发生变化?保留的重复基因及其对调控网络进化的影响?基因组加倍在被子植物的适应性进化中发挥的作用,如何帮助植物适应剧烈环境变化等(Wu et al., 2020),这些都是全基因组复制后续可以挖掘的内容,在此不做过多介绍。

Badouin, H., Gouzy, J., Grassa, C.J., Murat, F., Staton, S.E., Cottret, L., Lelandais-Briere, C., Owens, G.L., Carrere, S., Mayjonade, B., et al. (2017). The sunflower genome provides insights into oil metabolism, flowering and Asterid evolution. Nature 546, 148-152.

Daccord, N., Celton, J.M., Linsmith, G., Becker, C., Choisne, N., Schijlen, E., van de Geest, H., Bianco, L., Micheletti, D., Velasco, R., et al. (2017). High-quality de novo assembly of the apple genome and methylome dynamics of early fruit development. Nat Genet 49, 1099-1106.

Guo, L., Winzer, T., Yang, X., Li, Y., Ning, Z., He, Z., Teodor, R., Lu, Y., Bowser, T.A., Graham, I.A., et al. (2018). The opium poppy genome and morphinan production. Science 362, 343-347.Jiao, Y. (2018). Double the Genome, Double the Fun: Genome Duplications in Angiosperms. Mol Plant 11, 357-358.

Jiao, Y., Wickett, N.J., Ayyampalayam, S., Chanderbali, A.S., Landherr, L., Ralph, P.E., Tomsho, L.P., Hu, Y., Liang, H., Soltis, P.S., et al. (2011). Ancestral polyploidy in seed plants and angiosperms. Nature 473, 97-100.

Qin, C., Yu, C., Shen, Y., Fang, X., Chen, L., Min, J., Cheng, J., Zhao, S., Xu, M., Luo, Y., et al. (2014). Whole-genome sequencing of cultivated and wild peppers provides insights into Capsicum domestication and specialization. Proc Natl Acad Sci U S A 111, 5135-5140.

Tang, H., Wang, X., Bowers, J.E., Ming, R., Alam, M., and Paterson, A.H. (2008). Unraveling ancient hexaploidy through multiply-aligned angiosperm gene maps. Genome Res 18, 1944-1954.

Wu, S., Han, B., and Jiao, Y. (2020). Genetic Contribution of Paleopolyploidy to Adaptive Evolution in Angiosperms. Mol Plant 13, 59-71.

本文地址:http://www.dadaojiayuan.com/jiankang/293833.html.

声明: 我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本站部分文字与图片资源来自于网络,转载是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们(管理员邮箱:douchuanxin@foxmail.com),情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

上一篇:

下一篇:

相关文章