Genome Research | 张国捷和Tomàs Marquès-Bonet研究团队共同揭示灵长类转录组演化特征
近日,基因组学领域权威期刊 Genome Research 在线发表了题为 “Transcriptome innovations in primates revealed by single-molecule long-read sequencing”的论文。浙江大学生命演化研究中心张国捷教授、西班牙国家研究委员会和庞培法布拉大学联合演化生物学研究所 (IBE) David Juan 教授和 Tomàs Marquès-Bonet 教授担任共同通讯作者,IBE Luis Ferrández-Peral 博士和深圳华大生命科学研究院詹小瑜助理研究员担任共同第一作者。
图1:Genome Research 官网截图
该项工作结合高深度的第三代和第二代转录本测序以及蛋白组学,对灵长类的五个标志性物种(人类、大猩猩、黑猩猩、红毛猩猩和猕猴)的类淋巴母细胞细胞系(LCL)样品进行研究 (图2)。产生了迄今为止灵长类动物最大的全长转录异构体集合。在此基础上,研究识别出大量先前未被报道过的转录异构体(图3)。
图2:项目设计
图3:五个灵长类物种未被报道的转录异构体比例
该工作通过物种间的转录组比较分析,重构转录异构体在灵长类演化过程中的获得与丢失(图4),揭示了数百种与免疫功能和免疫疾病相关的物种特异表达和差异使用。
图4: 五个灵长类物种转录异构体的演化动态
在真核生物中,蛋白编码基因通过转录形成mRNA,mRNA翻译形成蛋白质并执行生物学功能。基因序列包含了内含子和外显子。在转录的过程中,内含子和外显子都会被转录形成mRNA前体,后期内含子序列通过剪接等方式被去除,最终形成成熟的mRNA。然而,实际情况中,转录本之间保留或去除内含子存在一定差异,该现象也被称为可变剪切。基因组上的基因数目是有限的,但通过包含可变剪切在内的不同RNA加工事件的组合,相同的基因可以产生多样的转录异构体,极大提高了转录组的复杂性。
传统的第二代测序技术可以识别单个可变剪切事件,但由于读长较短,使其难以直接捕获转录本全长信息,即可变剪切事件的组合,很大程度局限了该领域的研究。近年来出现的第三代全长转录组测序技术很好地解决了这个问题,测序结果无需组装便可以获得转录本的全长信息,这项技术在非模式物种中也得到了广泛的应用,是进行转录组比较分析的一大利器。
有趣的是,虽然在转录层面观察到丰富多样的转录异构体,它们是否可以顺利被翻译并形成具有生物学功能的蛋白质仍为未知。为了回答这个问题,该研究结合高质量的全长转录本和蛋白质谱数据确认了部分未被报道的转录异构体的翻译。此外,通过重构转录组在灵长类演化过程中的演化动态,研究人员观察到剪切信号的改变和基因组重复序列的外显子化与转录异构体的差异表达之间存在一定的关系。进一步的研究显示,物种特异的转录异构体表达、转录异构体的差异使用和外显子的差异使用倾向于富集在与先天免疫系统和细胞增殖相关的基因。
这项工作结合多项技术,扩大了我们目前对人类和非人类灵长类动物的转录组复杂度和蛋白质多样性的认识,对丰富完善灵长类的基因模型有重要的意义,为揭示物种差异的分子基础提供了新视角