登录
首页 >> 健康生活

RNA分子的选择性剪接或可作为治疗肥胖、癌症的药物的新靶点

佚名 2024-05-30 21:06:20

RNA分子的选择性剪接或可作为治疗肥胖、癌症的药物的新靶点

2016年10月03日讯 近日,来自肯塔基大学医学院的研究人员通过研究鉴别出了小核仁RNA(snoRNAs)的一种新功能,即其能够调节一种名为选择性剪接(alternative splicing)的基础细胞过程,这项研究发现或将帮助开发治疗肥胖和癌症的新型疗法。选择性剪接能够使得细胞通过单一基因制造多种蛋白质。

在选择性剪接过程中,一种名为前体信使RNA(pre-mRNA)(被拼接的分子)是DNA模板间的中间产物,而DNA模板中包含了多种能够制造蛋白质的指令,同时这种蛋白质产物最终还能够被这些指令所产生。在上述过程中,细胞中的剪接机器能够切断pre-mRNA的片段,随后其能够将剩下的片段进行拼接产生一种成熟的mRNA,而这种mRNA就能够用来翻译产生蛋白质,许多pre-mRNA都能以多种方式来进行拼接,而且产生的不同的mRNA都能够用于产生独特的突变体蛋白。

但大多数mRNA并不能产生蛋白质,在这些所谓的非编码RNAs中都是一些小核仁RNA,其能够知道特定的RNA修饰蛋白进入到自己的“工作岗位”,让研究者好奇的是,有些小核仁RNA的缺失被认为和某些疾病的发生有关,比如特定的癌症或普拉德-威利综合征等,普拉德-威利综合征是一种遗传性的肥胖疾病,这些关联都表明,小核仁RNA所干的事情或许要比直接进行RNA修饰要多得多。

文章中,研究者发现,某些小核仁RNA能够与一些新发现的细胞伙伴来合作共同调节选择性剪接过程,由于选择性剪接能够调节蛋白质的功能,因此研究者推测,小核仁RNA的角色或许就能够解释为何特定小核仁RNA的缺失会和疾病发生关联。如果缺失小核仁RNA是引发某些疾病的原因,那么研究者就假设,如果能够利用合成性的替代品来移除缺失的小核仁RNA或许就能够有效治疗某些疾病。此前研究中,研究人员发现了一种名为SNORD115的小核仁RNA,其并不会在普拉德-威利综合征患者机体中产生,但其却能够调节血清素2C受体的pre-mRNA进行选择性剪接,由于该受体参与了食欲的控制及饮食的摄入,因此研究者表示,选择性剪接诱导的功能改变或许就能够诱发普拉德-威利综合征患者过度摄食,随后研究者计划深入研究来确定是否替代SNORD115就能够成功治疗患者的症状。

研究者Stamm表示,为了阻断患者过度饮食的行为,我们寻找了一种方法来替代小核仁RNA,最终我们找到了一种寡核苷酸(断链RNA),其能够模拟自然发生的小核仁RNA的效应。当研究人员在动物模型中检测这种寡核苷酸时,他们发现,接受寡核苷酸的动物摄食量相比对照组明显减少了;这就表明,在选择性剪接的水平下食物的消耗能够被调节,而且研究者还能够利用RNA寡核苷酸来干扰整个系统。

因此帕-魏二氏综合征患者机体中缺失的小核仁RNA或许就能够帮助研究人员开发新型疗法来治疗疾病,而且该研究还能够帮助开发多种治疗罕见遗传障碍的策略;普拉德-威利综合征是一种遗传性疾病,该病是正常肥胖的“扩大”版,基于本文研究结果,研究者希望后期通过更为深入的研究来开发出治疗一般人群肥胖的新疗法。

生物电化学的研究领域

近几十年来生物电化学发展非常迅速 ,其研究分别在分子、细胞和生物组织等三个不同层次上进行。目前的研究领域主要有以下几个方面:
1.生物膜与生物界面模拟研究
主要研究膜的电化学热力学性质、物质的跨膜传输和生物电的传递等现象。
(1)SAM膜模拟生物膜的电化学研究
SAM是基于长链有机分子在基底材料表面的强烈化学结合和有机分子链间相互作用自发吸附在固/液或气/固界面,形成的热力学稳定、能量最低的有序膜。在单分子层中分子定向、有序、紧密地排列在一起,并且膜的结构和性质可以通过改变分子的头基、尾基以及链的类型和长度来调节。因此,SAM成为研究各种复杂界面现象,如膜的渗透性、摩擦、磨损、湿润、粘结、腐蚀、生物发酵、表面电荷分布以及电子转移理论的理想模型体系。有关SAM的电化学主要是用电化学方法研究SAM的绝对覆盖量、缺陷分布、厚度、离子通透性、表面电势分布、电子转移等。利用SAM可研究溶液中的氧化还原物种与电极间的跨膜(跨SAM)电子转移,以及电活性SAM本身与电极间的电子转移。在膜电化学中,硫醇类化合物在金电极表面形成的SAM是最典型的和研究最多的体系。因为长链硫醇类化合物在分子尺寸、组织模型和膜的自然形成三方面很类似于天然的生物双层膜,同时它具有分子识别功能和选择性响应,且稳定性高。所以硫醇类化合物在金电极上形成的SAM对仿生研究有重要意义。例如可用SAM表面分子的选择性来研究蛋白质的吸附作用;以烷基硫醇化合物在金上的SAM膜为基体研究氧化还原蛋白质中电子的长程和界面转移机制等;在硫醇SAM上沉积磷脂可较容易地构造双层磷脂膜,以SAM来模拟双层磷脂膜的准生物环境和酶的固定化使酶进行直接电子转移已在生物传感器的研究中得到应用。如以胱氨酸或半胱氨酸为SAM,通过缩合反应键合上媒介体(如TCNQ、二茂铁、醌类等)和酶可构成测葡萄糖、谷胱甘肽、胆红素、苹果酸等的多种生物传感器。
(2) 液/液界面模拟生物膜的电化学研究
所谓液/液(L/L)界面是指在两种互不相溶的电解质溶液之间形成的界面,又称为油/水(O/W)界面。有关L/L界面电化学的研究范围很广,包括L/L界面双电层、L/L界面上的电荷转移机理及动力学、生物膜模拟、以及电化学分析应用等。L/L界面可以看作与周围电解质接触的半个生物膜模型。生物膜是一种极性端分别朝细胞内和细胞外水溶液的磷脂自组装结构,磷脂的亲脂链形成像油一样的膜内层。因此,从某种意义上来说,吸附着磷脂单分子层的L/L界面非常接近于生物膜/水溶液界面。磷脂是非常理想的实验材料,它能很好地吸附在L/L界面上。电荷或电势和磷脂单分子层表面张力之间的偶联作用被认为是细胞和细胞中类脂质运动的基本驱动力。可见,L/L界面生物电化学是一很有生命力的研究领域,将继续受到人们的广泛重视。
生物细胞膜是一种特殊类型的半透膜。
细胞膜对K+Cl-Na+等离子的通透性也不相同。
细胞膜内外的K+Cl-Na+等离子的浓度不同,因此产生的膜电势称为(细胞)生物膜电势。
不同的电流通过动物细胞膜,死的细胞和活的细胞的表现不同。
2.生物电化应用技术
由于生命现象与电化学过程密切相关,因此电化学方法在生命科学中得到广泛应用,主要有:电脉冲基因直接导入、电场加速作物生长、癌症的电化学疗法、电化学控制药物释放、在体研究的电化学方法、生物分子的电化学行为、血栓和心血管疾病的电化学研究、骨骼的电生长、心电图和脑电图的研究、生物电池等。
电脉冲基因直接导入是基于带负电的质粒DNA或基因片断在高压脉冲电场的作用下被加速“射”向受体细胞,同时在电场作用下细胞膜的渗透率增加(介电击穿效应),使基因能顺利导入受体细胞。由于细胞膜的电击穿的可逆性,除去电场,细胞膜及其所有的功能都能恢复。此法已在分子生物学中得到应用。细胞转化效率高,可达每微克DNA1010个转化体,是用化学方法制备的感受态细胞的转化率的10~20倍。
电场加速作物生长是很新的研究课题。Matsuzaki等报道过玉米和大豆苗在含0.5mmol/l K2SO4培养液中培养,同时加上20Hz,3V或4V(峰 峰)的电脉冲,6天后与对照组相比,秧苗根须发达,生长明显加速。其原因可能是电场激励了生长代谢的离子泵作用。
癌症的电化学疗法是瑞典放射医学家Nordenstrom开创的治疗癌症的新方法。其原理是:在直流电场作用下,引起癌灶内一系列生化变化,使其组织代谢发生紊乱,蛋白质变性、沉淀坏死,导致癌细胞破灭。一般是将铂电极正极置于癌灶中心部位,周围扎上1~5根铂电极作负极,加上6~10V的电压,控制电流为30~100mA,治疗时间2~6小时,电量为每厘米直径癌灶100~150库仑。此疗法已推广用于肝癌、皮肤癌等的治疗。对体表肿瘤的治疗尤为简便、有效。
控制药物释放技术是指在一定时间内控制药物的释放速度、释放地点,以获得最佳药效,同时缓慢释放有利于降低药物毒性。电化学控制药物释放是一种新的释放药物的方法,这种方法是把药物分子或离子结合到聚合物载体上,使聚合物载体固定在电极表面,构成化学修饰电极,再通过控制电极的氧化还原过程使药物分子或离子释放到溶液中。药物在载体聚合物上的负载方式分为共价键合型和离子键合型负载两类。共价键合负载是通过化学合成将药物分子以共价键方式键合到聚合物骨架上,然后利用涂层法将聚合物固定在固体电极表面形成聚合物膜修饰电极,在氧化或还原过程中药物分子与聚合物之间的共价键断裂,使得药物分子从膜中释放出来。离子键合负载是利用电活性导电聚合物如聚吡咯、聚苯胺等在氧化或还原过程中伴随有作为平衡离子的对离子的嵌入将药物离子负载到聚合物膜中,再通过还原或氧化使药物离子从膜中释放出来。
在体研究是生理学研究的重要方法,其目的在于从整体水平上认识细胞、组织、器官的功能机制及其生理活动规律。由于一些神经活性物质(神经递质)具有电化学活性,因此电化学方法首先被用于脑神经系统的在体研究。当采用微电极插入动物脑内进行活体伏安法测定获得成功后,立即引起了人们的极大兴趣。该技术经过不断的改善,被公认为在正常生理状态下跟踪监测动物大脑神经活动最有效的方法。通常可检测的神经递质有多巴胺、去甲肾上腺素、5-羟色胺及其代谢产物。微电极伏安法成为连续监测进入细胞间液中原生性神经递质的有力工具。在体研究一般采用快速循环伏安法(每秒上千伏)和快速计时安培法。快速循环伏安法还被用于研究单个神经细胞神经递质释放的研究,发展成为所谓的“细胞电化学”。
生物分子的电化学行为的研究是生物电化学的一个基础研究领域,其研究目的在于获取生物分子氧化还原电子转移反应的机理,以及生物分子电催化反应机理,为正确了解生物活性分子的生物功能提供基础数据。所研究的生物分子包括小分子如氨基酸、生物碱、辅酶、糖类等和生物大分子如氧化还原蛋白、RNA、DNA、多糖等。
3.电化学生物传感器和生物分子器件 传感器与通信系统和计算机共同构成现代信息处理系统。传感器相当于人的感官,是计算机与自然界及社会的接口,是为计算机提供信息的工具。
传感器通常由敏感(识别)元件、转换元件、电子线路及相应结构附件组成。生物传感器是指用固定化的生物体成分(酶、抗原、抗体、激素等)或生物体本身(细胞、细胞器、组织等)作为感元件的传感器。电化学生物传感器则是指由生物材料作为敏感元件,电极(固体电极、离子选择性电极、气敏电极等)作为转换元件,以电势或电流为特征检测信号的传感器。由于使用生物材料作为传感器的敏感元件,所以电化学生物传感器具有高度选择性,是快速、直接获取复杂体系组成信息的理想分析工具。一些研究成果已在生物技术、食品工业、临床检测、医药工业、生物医学、环境分析等领域获得实际应用。
根据敏感元件所用生物材料的不同,电化学生物传感器分为酶电极传感器、微生物电极传感器、电化学免疫传感器、组织电极与细胞器电极传感器、电化学DNA传感器等。
(1)酶电极传感器
以葡萄糖氧化酶(GOD)电极为例简述其工作原理。在GOD的催化下,葡萄糖(C6H12O6)被氧氧化生成葡萄糖酸(C6H12O6)和过氧化氢。根据上述反应,显然可通过氧电极(测氧的消耗)、过氧化氢电极(测H2O2的产生)和PH电极(测酸度变化)来间接测定葡萄糖的含量。因此只要将GOD固定在上述电极表面即可构成测葡萄糖的GOD传感器。这便是所谓的第一代酶电极传感器。这种传感器由于是间接测定法,故干扰因素较多。第二代酶电极传感器是采用氧化还原电子媒介体在酶的氧化还原活性中心与电极之间传递电子。第二代酶电极传感器可不受测定体系的限制,测量浓度线性范围较宽,干扰少。现在不少研究者又在努力发展第三代酶电极传感器,即酶的氧化还原活性中心直接和电极表面交换电子的酶电极传感器。
目前已有的商品酶电极传感器包括:GOD电极传感器、L-乳酸单氧化酶电极传感器、尿酸酶电极传感器等。 (2)微生物电极传感器
将微生物(常用的主要是细菌和酵母菌)作为敏感材料固定在电极表面构成的电化学生物传感器称为微生物电极传感器。其工作原理大致可分为三种类型:其一,利用微生物体内含有的酶(单一酶或复合酶)系来识别分子,这种类型与酶电极类似;其二,利用微生物对有机物的同化作用,通过检测其呼吸活性(摄氧量)的提高,即通过氧电极测量体系中氧的减少间接测定有机物的浓度;其三,通过测定电极敏感的代谢产物间接测定一些能被厌氧微生物所同化的有机物。
微生物电极传感器在发酵工业、食品检验、医疗卫生等领域都有应用。例如;在食品发酵过程中测定葡萄糖的佛鲁奥森假单胞菌电极;测定甲烷的鞭毛甲基单胞菌电极;测定抗生素头孢菌素的Citrobacterfreudii菌电极等等。微生物电极传感器由于价廉、使用寿命长而具有很好的应用前景,然而它的选择性和长期稳定性等还有待进一步提高。
(3)电化学免疫传感器
抗体对相应抗原具有唯一性识别和结合功能。电化学免疫传感器就是利用这种识别和结合功能将抗体或抗原和电极组合而成的检测装置。电化学免疫传感器从结构上可分为直接型和间接型两类。直接型的特点是在抗体与其相应抗原识别结合的同时将其免疫反应的信息直接转变成电信号。这类传感器在结构上可进一步分为结合型和分离型两种。前者是将抗体或抗原直接固定在电极表面上,传感器与相应的抗体或抗原发生结合的同时产生电势改变;后者是用抗体或抗原制作抗体膜或抗原膜,当其与相应的配基反应时,膜电势发生变化,测定膜电势的电极与膜是分开的。间接型的特点是将抗原和抗体结合的信息转变成另一种中间信息,然后再把这个中间信息转变成电信号。这类传感器在结构上也可进一步分为两种类型:结合型和分离型。前者是将抗体或抗原固定在电极上;而后者抗体或抗原和电极是完全分开的。间接型电化学免疫传感器通常是采用酶或其他电活性化合物进行标记,将被测抗体或抗原的浓度信息加以化学放大,从而达到极高的灵敏度。
电化学免疫传感器的例子有:诊断早期妊娠的HCG免疫传感器;诊断原发性肝癌的甲胎蛋白(AFP)免疫传感器;测定人血清蛋白(HSA)免疫传感器;还有IgG免疫传感器、胰岛素免疫传感器等等。
(4)组织电极与细胞器电极传感器
直接采用动植物组织薄片作为敏感元件的电化学传感器称组织电极传感器,其原理是利用动植物组织中的酶,优点是酶活性及其稳定性均比离析酶高,材料易于获取,制备简单,使用寿命长等。但在选择性、灵敏度、响应时间等方面还存在不足。
动物组织电极主要有:肾组织电极、肝组织电极、肠组织电极、肌肉组织电极、胸腺组织电极等。 植物组织电极敏感元件的选材范围很广,包括不同植物的根、茎、叶、花、果等。植物组织电极制备比动物组织电极更简单,成本更低并易于保存。 细胞器电极传感器是利用动植物细胞器作为敏感元件的传感器。细胞器是指存在于细胞内的被膜包围起来的微小“器官”,如线粒体、微粒体、溶酶体、过氧化氢体、叶绿体、氢化酶颗粒、磁粒体等等。其原理是利用细胞器内所含的酶(往往是多酶体系)。
(5)电化学DNA传感器
电化学DNA传感器是近几年迅速发展起来的一种全新思想的生物传感器。其用途是检测基因及一些能与DNA发生特殊相互作用的物质。电化学DNA传感器是利用单链DNA(ssDNA)或基因探针作为敏感元件固定在固体电极表面,加上识别杂交信息的电活性指示剂(称为杂交指示剂)共同构成的检测特定基因的装置。其工作原理是利用固定在电极表面的某一特定序列的ssDNA与溶液中的同源序列的特异识别作用(分子杂交)形成双链DNA(dsDNA)(电极表面性质改变),同时借助一能识ssDNA和dsDNA的杂交指示剂的电流响应信号的改变来达到检测基因的目的。
4.生物能学和代谢过程
包括酶催化的氧化还原反应的力能学、线粒体呼吸链、光氧化还原反应和光合作用。光合作用作为整个过程,包括了吸收光子后的电子激发过程、膜电位的产生、电子和质子的转移过程,以及随后的一系列代谢反应。
生物电化学研究手段目前除了采用传统的电化学方法外,电化学紫外可见光谱、电化学现场红外光谱、电化学现场拉曼光谱、X射线衍射、扫描探针技术、电化学石英晶体微天平等方法得到广泛应用。
生物材料敏感元件+电极转换元件
例如:酶电极传感器
以葡萄糖氧化酶(GOD)电极为例
其工作原理为:在GOD的催化下,葡萄糖(C6H12O6)
被氧氧化,生成葡萄糖酸(C6H12O7)和过氧化氢。
反应式
根据上述反应,可以通过测量氧的消耗(氧电极),或者过氧化氢的产生(过氧化氢电极)等,间接测量葡萄糖的含量。
这就是所谓的第一代酶电极传感器,目前种类很多,包括用于检测司机是否饮酒的。乙醇氧化酶电极传感器。
专利技术:将乙醇氧化酶电极传感器与汽车的点火装置相连
细胞膜水通道,以及离子通道结构和机理 2003年的NOBEL化学奖介绍
彼得·阿格雷:美国科学家。1949年生于美国明尼苏达州小城诺斯菲尔德,1974年在巴尔的摩约翰斯·霍普金斯大学医学院获医学博士学位,现为该学院生物化学教授和医学教授。 罗德里克·麦金农:美国科学家。1956年出生,在美国波士顿附近的小镇伯灵顿长大,1982年在塔夫茨医学院获医学博士学位,现为洛克菲勒大学分子神经生物学和生物物理学教授。
生物电化学
科学贡献
他们发现了细胞膜水通道,以及对离子通道结构和机理研究作出了开创性贡献。这是个重大发现,开启了细菌、植物和哺乳动物水通道的生物化学、生理学和遗传学研究之门。
对生活的影响
水溶液占人体重量的70%。生物体内的水溶液主要由水分子和各种离子组成。它们在细胞膜通道中的进进出出可以实现细胞的很多功能。水分子是如何进出人体的细胞的?了解这一机理将极大地帮助人们更好地认识许多疾病,比如心脏病、神经系统疾病等。他们的发现阐明了盐分和水如何进出组成活体的细胞。比如,肾脏怎么从原尿中重新吸收水分,以及电信号怎么在细胞中产生并传递等等,这对人类探索肾脏、心脏、肌肉和神经系统等方面的诸多疾病具有极其重要的意义。
实际上,早在十九世纪中期,人们就猜想人体细胞一定存在用以传输水分的特别的通道。然而,直到1988年,才由阿格雷在分离一种膜蛋白上获得成功,约一年后,他明白了这个蛋白一定就是长期以来所寻求的水通道。这一决定性的发现打开了通向细菌、植物及哺乳动物体内水通道的生物化学、生理学以及遗传学等完整的系列研究之门。今天,学者们详知水分子通过细胞膜的方式并了解为何只有水分子能穿过而不是其他更小的分子或离子。
现代生物化学在求解生命过程的基本原理方面已经深入到了原子的水平。 另一种类型的膜通道是离子通道。离子通道在神经和肌肉应激系统中具有重要意义。当位于神经细胞表面的离子通道在来自邻近的神经细胞的化学信号的作用下而开启时,会产生一种被称为神经细胞电压的作用,于是,一种电脉冲信号就会通过在数毫秒之内开启和关闭的离子通道而沿着神经细胞的表面传递。麦金农在1998年确定了钾离子通道的空间结构(高分辨率电子显微镜)而使整个学术界震惊。这项贡献,使我们现在知道离子可以通过由不同的细胞信号控制其开启和关闭的通道而流动。

RNA干扰的原理是什么?最好有原理图?

作用机制:病毒基因、人工转入基因、转座子等外源性基因随机整合到宿主细胞基因组内,并利用宿主细胞进行转录时,常产生一些dsRNA。宿主细胞对这些dsRNA迅即产生反应,其胞质中的核酸内切酶Dicer将dsRNA切割成多个具有特定长度和结构的小片段RNA,即siRNA。

siRNA在细胞内RNA解旋酶的作用下解链成正义链和反义链,继之由反义siRNA再与体内一些酶(包括内切酶、外切酶、解旋酶等)结合形成RNA诱导的沉默复合物。

RISC与外源性基因表达的mRNA的同源区进行特异性结合,RISC具有核酸酶的功能,在结合部位切割mRNA,切割位点即是与siRNA中反义链互补结合的两端。被切割后的断裂mRNA随即降解,从而诱发宿主细胞针对这些mRNA的降解反应。

siRNA不仅能引导RISC切割同源单链mRNA,而且可作为引物与靶RNA结合并在RNA聚合酶作用下合成更多新的dsRNA,新合成的dsRNA再由Dicer切割产生大量的次级siRNA,从而使RNAi的作用进一步放大,最终将靶mRNA完全降解。

RNAi的临床应用

RNAi 机制可作为真核生物的基因组免疫系统 , 抑制外源和内源有害基因的表达。人类目前对病毒 ( 如 HIV) 所致疾病缺乏理想的治疗方法 , 如果利用 RNAi 技术把与病毒基因具同源性的 siRNA 引入感染细胞将会抑制病毒的增殖 , 这为病毒相关疾病的治疗提供了新的思路。

另外 , 利用 RNAi 技术还可以高效、特异、快速的抑制细胞内癌基因的表达 , 人类的许多癌症是由于少数癌基因超表达导致细胞过度增殖所致 , 如果利用 RNAi 技术抑制过度表达的癌基因将会使癌症表型逆转或病程得以控制。

可以预测 , RNAi 技术将会很快应用于癌症和病毒疾病的治疗 , 并可能会为这些疾病治疗带来突破。

测序相关知识总结

高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变,一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能, 所以又被称为深度测序(Deep sequencing)。

Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核苷酸为止。每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。

全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。

de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。获得一个物种的全基因组序列是加快对此物种了解的重要捷径。随着新一代测序技术的飞速发展,基因组测序所需的成本和时间较传统技术都大大降低,大规模基因组测序渐入佳境,基因组学研究也迎来新的发展契机和革命性突破。利用新一代高通量、高效率测序技术以及强大的生物信息分析能力,可以高效、低成本地测定并分析所有生物的基因组序列。

外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel等具有较大的优势,但无法研究基因组结构变异如染色体断裂重组等。

转录组学(transcriptomics)是在基因组学后新兴的一门学科,即研究特定细胞在某一功能状态下所能转录出来的所有RNA(包括mRNA和非编码RNA)的类型与拷贝数。Illumina提供的mRNA测序技术可在整个mRNA领域进行各种相关研究和新的发现。mRNA测序不对引物或探针进行设计,可自由提供关于转录的客观和权威信息。研究人员仅需要一次试验即可快速生成完整的poly-A尾的RNA完整序列信息,并分析基因表达、cSNP、全新的转录、全新异构体、剪接位点、等位基因特异性表达和罕见转录等最全面的转录组信息。简单的样品制备和数据分析软件支持在所有物种中的mRNA测序研究。

Small RNA(micro RNAs、siRNAs和 pi RNAs)是生命活动重要的调控因子,在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要的作用。Illumina能够对细胞或者组织中的全部Small RNA进行深度测序及定量分析等研究。实验时首先将18-30 nt范围的Small RNA从总RNA中分离出来,两端分别加上特定接头后体外反转录做成cDNA再做进一步处理后,利用测序仪对DNA片段进行单向末端直接测序。通过Illumina对Small RNA大规模测序分析,可以从中获得物种全基因组水平的miRNA图谱,实现包括新miRNA分子的挖掘,其作用靶基因的预测和鉴定、样品间差异表达分析、miRNAs聚类和表达谱分析等科学应用。

成熟的microRNA(miRNA)是17~24nt的单链非编码RNA分子,通过与mRNA相互作用影响目标mRNA的稳定性及翻译,最终诱导基因沉默,调控着基因表达、细胞生长、发育等生物学过程。基于第二代测序技术的microRNA测序,可以一次性获得数百万条microRNA序列,能够快速鉴定出不同组织、不同发育阶段、不同疾病状态下已知和未知的microRNA及其表达差异,为研究microRNA对细胞进程的作用及其生物学影响提供了有力工具。

染色质免疫共沉淀技术(ChromatinImmunoprecipitation,ChIP)也称结合位点分析法,是研究体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。将ChIP与第二代测序技术相结合的ChIP-Seq技术,能够高效地在全基因组范围内检测与组蛋白、转录因子等互作的DNA区段。

ChIP-Seq的原理是:首先通过染色质免疫共沉淀技术(ChIP)特异性地富集目的蛋白结合的DNA片段,并对其进行纯化与文库构建;然后对富集得到的DNA片段进行高通量测序。研究人员通过将获得的数百万条序列标签精确定位到基因组上,从而获得全基因组范围内与组蛋白、转录因子等互作的DNA区段信息。

CHIRP-Seq( Chromatin Isolation by RNA Purification )是一种检测与RNA绑定的DNA和蛋白的高通量测序方法。方法是通过设计生物素或链霉亲和素探针,把目标RNA拉下来以后,与其共同作用的DNA染色体片段就会附在到磁珠上,最后把染色体片段做高通量测序,这样会得到该RNA能够结合到在基因组的哪些区域,但由于蛋白测序技术不够成熟,无法知道与该RNA结合的蛋白。

RNA Immunoprecipitation是研究细胞内RNA与蛋白结合情况的技术,是了解转录后调控网络动态过程的有力工具,能帮助我们发现miRNA的调节靶点。这种技术运用针对目标蛋白的抗体把相应的RNA-蛋白复合物沉淀下来,然后经过分离纯化就可以对结合在复合物上的RNA进行测序分析。

RIP可以看成是普遍使用的染色质免疫沉淀ChIP技术的类似应用,但由于研究对象是RNA-蛋白复合物而不是DNA-蛋白复合物,RIP实验的优化条件与ChIP实验不太相同(如复合物不需要固定,RIP反应体系中的试剂和抗体绝对不能含有RNA酶,抗体需经RIP实验验证等等)。RIP技术下游结合microarray技术被称为RIP-Chip,帮助我们更高通量地了解癌症以及其它疾病整体水平的RNA变化。

CLIP-seq,又称为HITS-CLIP,即紫外交联免疫沉淀结合高通量测序(crosslinking-immunprecipitation and high-throughput sequencing), 是一项在全基因组水平揭示RNA分子与RNA结合蛋白相互作用的革命性技术。其主要原理是基于RNA分子与RNA结合蛋白在紫外照射下发生耦联,以RNA结合蛋白的特异性抗体将RNA-蛋白质复合体沉淀之后,回收其中的RNA片段,经添加接头、RT-PCR等步骤,对这些分子进行高通量测序,再经生物信息学的分析和处理、总结,挖掘出其特定规律,从而深入揭示RNA结合蛋白与RNA分子的调控作用及其对生命的意义。

什么是metagenomic(宏基因组):

Magenomics研究的对象是整个微生物群落。相对于传统单个细菌研究来说,它具有众多优势,其中很重要的两点:(1)微生物通常是以群落方式共生于某一小生境中,它们的很多特性是基于整个群落环境及个体间的相互影响的,因此做Metagenomics研究比做单个个体的研究更能发现其特性;(2) Metagenomics研究无需分离单个细菌,可以研究那些不能被实验室分离培养的微生物。

宏基因组是基因组学一个新兴的科学研究方向。宏基因组学(又称元基因组学,环境基因组学,生态基因组学等),是研究直接从环境样本中提取的基因组遗传物质的学科。传统的微生物研究依赖于实验室培养,元基因组的兴起填补了无法在传统实验室中培养的微生物研究的空白。过去几年中,DNA测序技术的进步以及测序通量和分析方法的改进使得人们得以一窥这一未知的基因组科学领域。

10 .什么是SNP、SNV(单核苷酸位点变异)

单核苷酸多态性singlenucleotide polymorphism,SNP 或单核苷酸位点变异SNV。个体间基因组DNA序列同一位置单个核苷酸变异(替代、插入或缺失)所引起的多态性。不同物种、个体基因组DNA序列同一位置上的单个核苷酸存在差别的现象。有这种差别的基因座、DNA序列等可作为基因组作图的标志。人基因组上平均约每1000个核苷酸即可能出现1个单核苷酸多态性的变化,其中有些单核苷酸多态性可能与疾病有关,但可能大多数与疾病无关。单核苷酸多态性是研究人类家族和动植物品系遗传变异的重要依据。在研究癌症基因组变异时,相对于正常组织,癌症中特异的单核苷酸变异是一种体细胞突变(somatic mutation),称做SNV。

基因组上小片段(>50bp)的插入或缺失,形同SNP/SNV。

基因组拷贝数变异是基因组变异的一种形式,通常使基因组中大片段的DNA形成非正常的拷贝数量。例如人类正常染色体拷贝数是2,有些染色体区域拷贝数变成1或3,这样,该区域发生拷贝数缺失或增加,位于该区域内的基因表达量也会受到影响。如果把一条染色体分成A-B-C-D四个区域,则A-B-C-C-D/A-C-B-C-D/A-C-C-B-C-D/A-B-D分别发生了C区域的扩增及缺失,扩增的位置可以是连续扩增如A-B-C-C-D也可以是在其他位置的扩增,如A-C-B-C-D。

染色体结构变异是指在染色体上发生了大片段的变异。主要包括染色体大片段的插入和缺失(引起CNV的变化),染色体内部的某块区域发生翻转颠换,两条染色体之间发生重组(inter-chromosome trans-location)等。一般SV的展示利用Circos 软件。

15.什么是Segment duplication

一般称为SD区域,串联重复是由序列相近的一些DNA片段串联组成。串联重复在人类基因多样性的灵长类基因中发挥重要作用。在人类染色体Y和22号染色体上,有很大的SD序列。

既基因型与表型;一般指某些单核苷酸位点变异与表现形式间的关系。

17.什么是soft-clipped reads

当基因组发生某一段的缺失,或转录组的剪接,在测序过程中,横跨缺失位点及剪接位点的reads回帖到基因组时,一条reads被切成两段,匹配到不同的区域,这样的reads叫做soft-clipped reads,这些reads对于鉴定染色体结构变异及外源序列整合具有重要作用。

由于大部分测序得到的reads较短,一个reads能够匹配到基因组多个位置,无法区分其真实来源的位置。一些工具根据统计模型,如将这类reads分配给reads较多的区域。

21.什么是Contig N50?

Reads拼接后会获得一些不同长度的Contigs。将所有的Contig长度相加,能获得一个Contig总长度。然后将所有的Contigs按照从长到短进行排序,如获得Contig 1,Contig 2,Contig 3...………Contig 25。将Contig按照这个顺序依次相加,当相加的长度达到Contig总长度的一半时,最后一个加上的Contig长度即为Contig N50。举例:Contig 1+Contig 2+ Contig 3+Contig 4=Contig总长度 1/2时,Contig 4的长度即为Contig N50。Contig N50可以作为基因组拼接的结果好坏的一个判断标准。值越大,contig越长组装效果越好,测序效率也就越好了.
给定一组具有其自身长度的重叠群,L50计数被定义为长度总和占基因组大小一半的重叠群的最小数量。
21.1 什么是Scaffold N50?
Scaffold N50与Contig N50的定义类似。Contigs拼接组装获得一些不同长度的Scaffolds。将所有的Scaffold长度相加,能获得一个Scaffold总长度。然后将所有的Scaffolds按照从长到短进行排序,如获得Scaffold 1,Scaffold 2,Scaffold 3...………Scaffold 25。将Scaffold按照这个顺序依次相加,当相加的长度达到Scaffold总长度的一半时,最后一个加上的Scaffold长度即为Scaffold N50。举例:Scaffold 1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold总长度 1/2时,Scaffold 5的长度即为Scaffold N50。Scaffold N50可以作为基因组拼接的结果好坏的一个判断标准。
22.什么是测序深度和覆盖度?
测序深度是指测序得到的总碱基数与待测基因组大小的比值。假设一个基因大小为2M,测序深度为10X,那么获得的总数据量为20M。覆盖度是指测序获得的序列占整个基因组的比例。由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖有所的区域,这部分没有获得的区域就称为Gap。例如一个细菌基因组测序,覆盖度是98%,那么还有2%的序列区域是没有通过测序获得的。

RPKM,Reads Per Kilobase of exon model per Million mapped reads, is defined in thisway [Mortazavi etal., 2008]: 每1百万个map上的reads中map到外显子的每1K个碱基上的reads个数。 假如有1百万个reads映射到了人的基因组上,那么具体到每个外显子呢,有多少映射上了呢,而外显子的长度不一,那么每1K个碱基上又有多少reads映射上了呢,这大概就是这个RPKM的直观解释。

如果对应特定基因的话,那么就是每1000000 mapped到该基因上的reads中每kb有多少是mapped到该基因上的exon的read Total exon reads:This is the number in the column with header Total exonreads in the row for the gene. This is the number of reads that have beenmapped to a region in which an exon is annotated for the gene or across theboundaries of two exons or an intron and an exon for an annotated transcript ofthe gene. For eukaryotes, exons and their internal relationships are defined byannotations of type mRNA.映射到外显子上总的reads个数。这个是映射到某个区域上的reads个数,这个区域或者是已知注释的基因或者跨两个外显子的边界或者是某个基因已经注释的转录本的内含子、外显子。对于真核生物来说,外显子和它们自己内部的关系由某类型的mRNA来注释。

Exonlength: This is the number in the column with the header Exon length inthe row for the gene, divided by 1000. This is calculated as the sum of thelengths of all exons annotated for the gene. Each exon is included only once inthis sum, even if it is present in more annotated transcripts for the gene.Partly overlapping exons will count with their full length, even though theyshare the same region.外显子的长度。计算时,计算所有某个基因已注释的所有外显子长度的总和。即使某个基因以多种注释的转录本呈现,这个外显子在求和时只被包含一次。即使部分重叠的外显子共享相同的区域,重叠的外显子以其总长来计算。 Mapped reads: The sum of all the numbers in the column with header Totalgene reads. The Total gene reads for a gene is the total number ofreads that after mapping have been mapped to the region of the gene. Thus thisincludes all the reads uniquely mapped to the region of the gene as well asthose of the reads which match in more places (below the limit set in thedialog in figure18.110) that have been allocated tothis gene's region. A gene's region is that comprised of the flanking regions(if it was specified in figure 18.110), the exons, the introns andacross exon-exon boundaries of all transcripts annotated for the gene. Thus,the sum of the total gene reads numbers is the number of mapped reads for thesample (you can find the number in the RNA-Seq report).map的reads总和。映射到某个基因上的所有reads总数。因此这包含所有的唯一映射到这个区域上的reads。

举例:比如对应到该基因的read有1000个,总reads个数有100万,而该基因的外显子总长为5kb,那么它的RPKM为:10 9*1000(reads个数)/10 6(总reads个数) 5000(外显子长度)=200或者:1000(reads个数)/1(百万) 5(K)=200这个值反映基因的表达水平。

FPKM(fragments per kilobase of exon per million fragments mapped). FPKM与RPKM计算方法基本一致。不同点就是FPKM计算的是fragments,而RPKM计算的是reads。Fragment比read的含义更广,因此FPKM包含的意义也更广,可以是pair-end的一个fragment,也可以是一个read。

什么是转录本重构

用测序的数据组装成转录本。有两种组装方式:1,de-novo构建; 2,有参考基因组重构。其中de-novo组装是指在不依赖参考基因组的情况下,将有overlap的reads连接成一个更长的序列,经过不断的延伸,拼成一个个的contig及scaffold。常用工具包括velvet,trans-ABYSS,Trinity等。有参考基因组重构,是指先将read贴回到基因组上,然后在基因组通过reads覆盖度,junction位点的信息等得到转录本,常用工具包括scripture、cufflinks。

什么是genefusion

将基因组位置不同的两个基因中的一部分或全部整合到一起,形成新的基因,称作融合基因,或嵌合体基因。该基因有可能翻译出融合或嵌合体蛋白。

什么是表达谱

基因表达谱(geneexpression profile):指通过构建处于某一特定状态下的细胞或组织的非偏性cDNA文库,大规模cDNA测序,收集cDNA序列片段、定性、定量分析其mRNA群体组成,从而描绘该特定细胞或组织在特定状态下的基因表达种类和丰度信息,这样编制成的数据表就称为基因表达谱

什么是功能基因组学

功能基因组学(Functuionalgenomics)又往往被称为后基因组学(Postgenomics),它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质得研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入对基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等。采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的

分析,新的技术应运而生,包括基因表达的系统分析(serial analysis of gene expression,SAGE),cDNA微阵列(cDNA microarray),DNA 芯片(DNA chip)和序列标志片段显示(sequence tagged fragmentsdisplay。

什么是比较基因组学

比较基因组学(ComparativeGenomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构。

什么是表观遗传学

表观遗传学是研究基因的核苷酸序列不发生改变的情况下,基因表达了可遗传的变化的一门遗传学分支学科。表观遗传的现象很多,已知的有DNA甲基化(DNAmethylation),基因组印记(genomicimpriting),母体效应(maternaleffects),基因沉默(genesilencing),核仁显性,休眠转座子激活和RNA编辑(RNA editing)等。

什么是计算生物学

计算生物学是指开发和应用数据分析及理论的方法、数学建模、计算机仿真技术等。当前,生物学数据量和复杂性不断增长,每14个月基因研究产生的数据就会翻一番,单单依靠观察和实验已难以应付。因此,必须依靠大规模计算模拟技术,从海量信息中提取最有用的数据。

什么是基因组印记

基因组印记(又称遗传印记)是指基因根据亲代的不同而有不同的表达。印记基因的存在能导致细胞中两个等位基因的一个表达而另一个不表达。基因组印记是一正常过程,此现象在一些低等动物和植物中已发现多年。印记的基因只占人类基因组中的少数,可能不超过5%,但在胎儿的生长和行为发育中起着至关重要的作用。基因组印记病主要表现为过度生长、生长迟缓、智力障碍、行为异常。目前在肿瘤的研究中认为印记缺失是引起肿瘤最常见的遗传学因素之一。

什么是基因组学

基因组学(英文genomics),研究生物基因组和如何利用基因的一门学问。用于概括涉及基因作图、测序和整个基因组功能分析的遗传学分支。该学科提供基因组信息以及相关数据系统利用,试图解决生物,医学,和工业领域的重大问题。

什么是DNA甲基化

DNA甲基化是指在DNA甲基化转移酶的作用下,在基因组CpG二核苷酸的胞嘧啶5'碳位共价键结合一个甲基基团。正常情况下,人类基因组“垃圾”序列的CpG二核苷酸相对稀少,并且总是处于甲基化状态,与之相反,人类基因组中大小为100—1000 bp左右且富含CpG二核苷酸的CpG岛则总是处于未甲基化状态,并且与56%的人类基因组编码基因相关。人类基因组序列草图分析结果表明,人类基因组CpG岛约为28890个,大部分染色体每1 Mb就有5—15个CpG岛,平均值为每Mb含10.5个CpG岛,CpG岛的数目与基因密度有良好的对应关系[9]。由于DNA甲基化与人类发育和肿瘤疾病的密切关系,特别是CpG岛甲基化所致抑癌基因转录失活问题,DNA甲基化已经成为表观遗传学和表观基因组学的重要研究内容。

什么是基因组注释?

基因组注释(Genomeannotation) 是利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释,是当前功能基因组学研究的一个热点。基因组注释的研究内容包括基因识别和基因功能注释两个方面。基因识别的核心是确定全基因组序列中所有基因的确切位置。

什么是Q30?

Q30是指一个碱基的识别可靠性等于99.9%,或者说出错可能性是0.1%。Q20则是指碱基识别的可靠性等于99%。

Q30数据量是指一批数据中,质量高于等于Q30的数据的量的总和。

测序数据的PF data/PF reads是什么意思?

PF是pass filter的意思。也就是质量合格的意思。Illumina的测仪序会自动地对一个read(序列)的质量可靠性进行打分。

对于前25个碱基中的是否有两个碱基的识别可靠性低于0.6,是PF的判断标准。这句话翻译成较容易理解的话: 就是前25个碱基中,如果低质量的数据有2个或更多,则这条read被判定为不合格,PF就不通过。反之,则质检通过。

PF是国际公认的质检标准。

你们给的数据是什么质量的?

对于哺乳动物基因组重测序、外显子测序,我们保证数据质量是Q30的比例高于80%。对于mRNA测序,smRNA测序,我们保证对照Lane的数据质是Q30的比例高于80%。

一般情况下:

哺乳动物基因组重测序、外显子测序,GC比例在40%左右,Q30的比例是80~95%

RNA-seq,GC比例在50%左右,Q30的比例是~80%。如果Poly(A)特别多的情况下,Q30会更低一些

SmRNA-seq,因为有许多的read读通之后,只剩下一串的A,质量会更低,我们的实验结果%Q30在70~75%

测序中的Duplication是什么,如何避免,一般会有多少Duplication?

所谓Duplication是指起始与终止位置完全一致的片段。

引起Duplication的主要原因是因为在测序中有PCR过程,来源于同一个DNA片段PCR的产物被重复测序,就会是Duplication。次要原因是正巧两个片段的头和尾的位置完全一致。

一般通过控制PCR的循环数来控制Duplication。我们一般控制PCR的循环次数在10~12个循环。

在药明康德外显子测序中,如果用illumina的捕获试剂盒Duplication的比例约为10%,如果用Nimblegen的捕获试剂盒Duplication的比例波动较大,在5~50%范围 ,平均为30%。

在RNA-seq中,Duplication的比例约为40%。RNA-seq中,因为高丰度的mRNA集中在几个基因上,集中度很高,所以Duplication的比例也就高。

测序的插入片段一般是多长?

测序的插入片段一般是100bp到600bp.

因为Hiseq测序过程中有一个桥式PCR的过程。如果插入片段过长,测桥式PCR产生的Cluster就会太大,而且光强也会减弱。所以插入片段的长度是有限制的。

PhiX文库有什么用?

PhiX文库是一种用病毒基因组做的文库。其基因序列已精确知晓,GC比例约为40%,与人类、哺乳类的基因组的GC比例接近。其基因序列又与人类的基因序列相去甚远,在与哺乳类基因组一些测序时,可以轻松地通过基因序列比对而将之去除。

在测四种碱基不平衡(A、G、C、T四种碱基的含量远远偏离25%)的样本时,可以加入大量的PhiX文库,以部分抵消样本的不平衡性。例如ChIPed DNA测序,或者亚硫酸氢盐处理过的DNA文库,或者扩增子测序(PCR样测序),都可以加入PhiX,以部分弥补碱基不平衡性。

也可以少量地加入样本,以作为control library来验证测序质量。

本文地址:http://www.dadaojiayuan.com/jiankang/295503.html.

声明: 我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本站部分文字与图片资源来自于网络,转载是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们(管理员邮箱:douchuanxin@foxmail.com),情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

上一篇:

下一篇:

相关文章