2022 年 12 月 22 日

漫远的新基因演化的探索历程

The Journey of 

Long to New Gene Evolution

演化生物学的独特魅力之一,是其诞生之初就伴随了从生物学辐射和碰撞届时社会思想的过程。1859年《物种起源》的出版向自然界拷问的就是带有历史哲学意味的问题:“从哪里来?”,“到那里去?”。在一百五十多年以后大众已经早已对“基因改造”,“基因诊断”等等词汇不再陌生的今天,作为遗传基本单元之一的基因从何而来,在历史演化过程中的命运又是如何?从1993年,美国芝加哥大学演化与生态学系的龙漫远教授(当时在加州大学戴维斯分校)发表了第一篇关于新基因如何起源的研究论文之后[1],就开创了一个如今欣欣向荣并与其他演化生物学领域交叉的研究范式,并培养了一批活跃于世界各地的演化生物学家。

 


高更的油画 Where do we come from? What are we? Where are we going? 藏于波士顿美术馆  

 

精卫, 孙大圣和斯芬克斯

对基因如何起源与演化,早在上个世纪70年代美籍日裔演化生物学家大野乾(Susumu Ohno)的著作《基因重复介导的演化》(Evolution by Gene Duplication)中首先有系统的理论假设[2]。Ohno还在其他著作中提出了影响深远的假说,例如性别决定染色体起源于常染色体,以及雄性的X染色体通过加倍基因表达的方式补偿几乎不含等位基因的Y染色体的等等。有意思的是,Ohno的本科实际毕业于东京农工大学的兽医学专业,因为他年轻时对动物,尤其是马非常感兴趣,这对他之后的职业生涯有巨大影响。他在《基因重复所介导的演化》序言中就写到:“只有当人的思维模式从为了日复一日的生计劳作而产生的担忧中解放出来,他的创造天赋才能真正地绽放,从而能够从那些显然“无用的想法中找到乐趣”(Man’s creative genius flourished only when his mind, freed from the worry of daily toils, was permitted to entertain apparently useless thoughts)。这本经典著作至今早已引用超过8000多次,Ohno在书中提出,基因组或者单个基因的复制是演化极为关键的驱动力之一,导致了例如脊椎动物相比无脊椎动物基因组组成和功能方面的巨大飞跃。他把自然选择作用比喻为行之有效的警察,只有当重复产生的新的基因组和基因拷贝积累了突破禁锢的突变(forbidden mutations),新的生物学功能就诞生了。Ohno的模型尽管非常具有前瞻性,却面临着很多问题的挑战:第一、当时人们并不清楚一个基因复制产生了一个新的拷贝以后,这个拷贝是如何获得功能变成新基因的?第二、像其他大多数的突变一样,新的基因拷贝一开始被普遍认为大概率“活不过第一季”,即很快就作为有害突变在群体中被清除了,因此新基因在演化中的贡献究竟是昙花一现(a potential force)还是至关重要(a potent force)?第三、除了就其取材地复制一个已经存在的基因以外,是否基因组还有其他新基因起源的方式,例如开天辟地式的通过非编码序列“从头起源”(de novo origination)方式?

 


Ohno对自己所拥有的名为Kolman的马的画像
(引用自Ulrich Wolf Cytogenet Cell Genet 80:8–11 (1998))
Evolution by Gene Duplication一书的封面也为Ohno自己所画的半鱼半人的抽象画

 

这些问题以龙漫远1993年完成并发表于《科学》杂志上的第一个研究新基因的个案为标志才开始逐渐有了解答,而他根据这个果蝇的新基因的起源过程将之命名为“精卫”。精卫在《山海经》传说里是炎帝的女儿,在东海游泳溺亡,化身为叫精卫的鸟,“常衔西山之木石,以堙于东海”。尽管这是实验刻画的第一个新基因,但其起源过程却异常复杂,其名字也有很多层涵义。精卫基因的祖先序列一部分是一个古老的“炎帝”(也就是传说中精卫的父亲)基因。另外一个果蝇的乙醇脱氢酶基因(Adh,在人类中的这个同源基因负责把乙醇转化为乙醛,和亚洲人的喝酒容易上脸有关)发生了逆转座(类似病毒通过转录mRNA,然后逆转录为DNA整合到宿主基因组里)产生的DNA复制序列插入到炎帝基因的内含子中,形成了新的嵌合基因,即形成了精卫基因。这个过程既包含了DNA水平的基因复制(炎帝基因本身其实是另外一个“黄帝”基因的复制产物),也有RNA水平的基因复制(逆转座),然后两者的产物再结合形成嵌合基因。而这么复杂的新基因起源过程发生于两百五十万年以内,这在演化的时间尺度上是非常短暂的,例如人类和黑猩猩的共同祖先估算也就大约为六到七百万年前。精卫基因起源过程的重要启示是:第一、新基因起源的过程远比Ohno假设的单纯的基因复制复杂许多,可能涉及不同的祖先基因,不同机制的共同作用;第二、新基因很有可能是有重要功能而不是“活不过第一季”,后续的实验证明精卫基因不再与乙醇代谢,而是与果蝇的外激素代谢有关;第三,自然选择的“无形之手”可能会“青睐”不同序列来源的嵌合基因,因为它们很可能整合了不同祖先序列的功能。

 

 


精卫,孙大圣和斯芬克斯

 

对这种嵌合基因,龙漫远实验室当时的博士后王文(现为西北工业大学教授)在果蝇中发现了另一个案例[3],并按埃及和希腊神话中人首狮身的斯芬克斯形象命名,寓意其嵌合形成的过程(世界各国这种嵌合(Chimera)不同动物的神话形象很多,例如我国的麒麟、龙凤、希腊神话的狮鹫等等)。斯芬克斯基因甚至比精卫基因更年轻,只是遗传明星物种黑腹果蝇所特有,其近缘果蝇物种不携带。与精卫类似的是,斯芬克斯起源于一个ATP合成酶基因发生逆转座以后与其他DNA转座子序列的嵌合。比较特别的是斯芬克斯并没有完整的蛋白读码框,仅在雌雄果蝇之间的基因表达模式不同。这种对其功能的质疑到了2008年通过对该基因的敲除完全烟消云散:丢失了该基因的雄性果蝇成了同性恋[3, 4]!突变型的果蝇出现对雌性果蝇置若罔闻,只追求其他雄性果蝇的表型,并在实验室中会形成特殊的一个雄性追着另一个雄性一串的“交配链”(mating chain)。Sphinx的例子告诉我们,新的功能基因未必是一个蛋白编码基因,今天生物学家已经通过发展新的研究手段对大量的长片段非编码RNA基因有了新的认识,这也帮助我们认识“究竟什么是基因”这个问题提供了素材。其他由龙漫远实验室或者其培养的博士、博士后所研究并命名的基因还包括猴王基因Monkey King[5], 该基因由祖先基因通过复制以后再分裂成两个,寓意为孙大圣拔毛变小猴子,也由王文所鉴定;Hun基因[6]由博士毕业生Roman Arguello(现为瑞士洛桑大学助理教授)鉴定,意为玛雅神话中的Hunahpu生殖神, 也契合其嵌合形成过程;以及宙斯基因Zeus,由博士毕业生陈思迪(现为耶鲁大学医学院副教授)所鉴定,意指该基因影响雄性生殖的功能[7]。同时其他研究小组对许多果蝇以外的物种,包括哺乳动物,酵母,植物中新演化出的功能基因的个案研究揭示演化过程中产生的物种或者群体特异的新基因对物种表型的多样性有重要贡献。

 


敲除掉Sphinx基因的雄性果蝇形成了相互追逐,无视雌性果蝇的“交配链” Dai et al. 2008 PNAS

 

运气还是规律?

个案尽管具有启发性和能够揭示基因起源过程的各种细节,在全基因组水平,新基因的起源到底多频繁?多少新基因有机会成为有功能的基因?不同的基因起源机制各自相对的贡献又是如何?这些规律性的问题在2008年之后新的测序技术和CRISPR/Cas9敲除技术的发明应用得到了解答。

 

最早的一项基因组水平研究新基因工作之一是我还在中国科学院昆明动物研究所王文实验室做博士研究生期间的工作,最终以致敬达尔文On the origin of species《物种起源》“On the origin of new genes in Drosophila”为标题命名文章[8]。当时我和张国捷(现也为浙江大学生命演化研究中心教授)等同事共同比较鉴定了几个果蝇物种基因组中所有的新近起源的基因,并且对它们的起源机制做了个定量比较。我们发现非常年轻的新基因有一个“扎堆”的特性,就是会在同一条染色体上相互串联靠得很近,但它们是否有功能并不能确定。而那些年纪比较“大” (超过五百万年之前起源),多个物种都共有的新基因,也就是非常有可能有功能的新基因则相互“敬而远之”,在同一条染色体上相隔很远,甚至在不同的染色体上。很有意思的是,这些有功能的新基因中有12%的基因,在其他的物种中没有任何蛋白序列相似的基因,简直就像是孙大圣从石头里蹦出来一样。这些“从无到有”的从头起源(de novo origin)基因提示Ohno的关于基因起源的假设并不全面。在他当时的《基因重复介导的演化》中他写到:“每一个基因必然来自于另一个早已存在的基因祖先”(Each gene must have arisen from an already existing gene)。然而事实并非如此,许多基因起源于基因组中的非编码序列快速演化并形成完整的读码框以后的结果。

 


新基因各种起源机制的贡献
(Zhou  et al. 2008 Genome Res)

 

我还记得2007年在我的结果还未正式发表之前,我和另一位美国朋友访问了芝加哥大学,并给龙漫远教授讲了这个结果。现在早已记不清他当时对这个新结果是否表现出兴奋,因为按同行另一个美国朋友的评价“Manyuan is like a Buddha (宠辱不惊)!”。只清楚记得当时一日三餐他亲自下厨,在他家好生款待,顺便还讲了很多他在出国前下乡插队在田埂,在乡村邮局工作的经历,完全没有距离感!

 


2007年,与龙漫远教授摄于芝加哥大学校园的林奈像前

 

从头起源基因(de novo gene)在很长的一段时间内成为人类演化生物学研究的热点之一,发表了大量从基因组水平大规模鉴定的工作[9-11]。而龙漫远实验室在2019年也发表了在水稻中研究从头起源基因的工作,由当时的博后张力(现为北京脑科学于类脑研究中心研究员)领衔,结合转录组和蛋白组测序的技术,对我们熟悉的粳稻(中国北方种植的主要水稻品种)基因组鉴定了175个从头起源,有蛋白质表达(因此它们更有可能是功能基因)的新基因[12]。而对这些从头起源基因在其他水稻品种中同源的非编码序列的研究提示从头起源的基因可能在演化过程中先获得转录的活性,然后获得蛋白翻译的功能。这一结果与更早时间2014年王文的博士生之一赵莉(现为美国洛克菲勒大学助理教授),在博士后期间果蝇中对从头起源基因的研究不谋而合[13]。因此一个基因的演化的历程,可能会经历从一段非编码序列通过突变形成可编码蛋白的阅读框,先获得转录活性,成为一个RNA基因,然后有一部分会获得翻译活性,成为蛋白编码基因。在起源或者接下来的演化过程中,这些基因可能会自我复制,进一步产生新的有可能有功能的基因拷贝。

 

但多少新基因是真正有功能的?陈思迪在2010年对195个年轻的果蝇新基因的RNA干扰敲降(RNAi knockdown)发现相当比例(30%左右)的新基因被干扰以后,会导致果蝇致死,也就是这些新基因是“生来重要”,一旦通过突变产生于基因组中就是关乎性命的关键基因(essential genes)[14]。考虑到RNA干扰脱靶效应的技术问题,最近龙漫远的实验室与国内北京动物研究所的张勇实验室合作,进一步结合少量的基因CRISPR/Cas9敲除实验,验证了相当比例的新基因很快成为关键基因的结论[15]。

 

阿波罗和戴安娜—新基因和性别演化

在龙漫远实验室培养的博士和博士后“前辈”中,有一位西班牙裔的女科学家Esther Betran(现为美国德州大学Arlington分校正教授)在我看来是非常有原创力的(May the power be with her!)。她的最重要的具有理论前瞻性的发现有两项:一项是发现果蝇的X染色体,似乎是一个新基因特别厌恶的位置[16]。因为有大量X染色体上的祖先基因,产生新基因以后都通过逆转座或者DNA复制的方式去了常染色体。这可能跟果蝇以及人类中,雌性或者女性有两条X染色体,雄性或者男性只有一条X染色体有关:因为X染色体更多的时间在女性细胞内遗传,所以X染色体是一条与常染色体相比更“女性化”的染色体;而新基因甫一诞生通常都是在雄性或者男性的精巢中(不论果蝇和哺乳动物都发现了这个现象)偏好表达,因此新基因因为“性别对抗”而更倾向避免在“女性化”的X染色体,而是坐落在在常染色体上。这个现象之后进一步由龙漫远实验室的J.J. Emerson(现为美国加州尔湾分校副教授)和Margarida Moreira (现为伦敦Crick研究所研究员)在哺乳动物中发现类似的情况,并命名为“X染色体上的基因流”(X-linked gene traffic)[17]。而当时龙漫远实验室的巴西裔博士后Mariah Vibronovoski(现为美国亚利桑那大学副教授)和张勇(现为北京动物所研究员),对影响新基因染色体位置的另一个因素,即减数分裂过程中的染色体失活,在果蝇和哺乳动物里进行了进一步研究[18, 19]。第二项Esther原创性的工作, 尽管可能未必那么出名,是她很早就总结提出了新基因的起源可能可以弥合了性别对抗而产生的基因之间的矛盾[20]。除了性染色体外,雌性和雄性有着几乎完全相同的基因组,尽管他/她们受到的选择是完全不同的。同一个基因的产物对于雄性来说可能是“汝之蜜糖”,但对雌性来说完全可能是“彼之砒霜”,反之也可能,这种现象即被称为“基因内的性别对抗”(intralocus sexual conflict)。一个比较容易理解的个案是增加雄性动物个体鲜艳度和美观的基因,例如体色,羽毛等等,可以让这个雄性个体在雌性的眼里更有吸引力,更利于他的基因传播给下一代,但同一个基因只能让雌性变得更容易被捕食者抓获。解决这一矛盾的方式,一者是使这样的基因在雄性中(或雌性中)特异地表达;二者就是Esther提出的通过让这个基因重复或者新基因的产生,变成一个在雄性里专门工作,另一个在雌性里专门工作。

 


大英博物馆收藏的绘有阿波罗(中),戴安娜(右)和他们母亲勒托(左)的古希腊时期(公元前500年)的水瓶

 

这种理论模型在龙漫远实验室2018年的一项研究新基因的工作中得到证实[21]。他们发现一对非常年轻(起源时间仅在20万年左右)的分别命名为阿波罗和阿耳特弥斯(或者在拉丁语中有一个大家更熟悉的名字戴安娜)的基因。在希腊神话中,阿波罗和戴安娜是一对孪生姐弟,对应于这一对基因互为基因重复的关系。除了他们大家比较熟悉的太阳神和狩猎神的身份,他们又各自是男孩和女孩的守护神。这正对应了这两个基因,在敲除以后分别影响雄性生殖能力和雌性生殖能力的表型,同时也支持了新基因的产生可能解决两性对抗矛盾的假说。

 


通过新基因的起源解决性别对抗矛盾的简单模型
(引自Jennifer C. Perry 2018)

 

新基因研究的社会影响力

在小小果蝇里的对新基因的研究只体现了科学家们对自我兴趣的不懈追求?答案显然是否定的,新基因研究的影响远远不止基础科学研究领域。就像我开篇所说,演化生物学的魅力之一是其哲学意味的结果和可能与社会思想的碰撞。一个最直接的证据是,在美国2005年著名的“多福案”(Kitzmiller v. Dover)中,龙漫远实验室新基因起源的系统研究当庭被用作证据证明演化是真实发生的客观过程,不需要任何超自然的外力或者是智能设计(Intelligent Design), 就能推动生物界新的遗传单元或者表型的出现(完整的庭供https://www.talkorigins.org/faqs/dover/day1am2.html)。在达尔文出版《物种起源》超过150多年的今天,美国依然是神创论和演化论激辨的前沿。2019年Gallup调查咨询公司的研究显示将近73%的美国人相信上帝创造了人,或者人在上帝的指引下发展到了今天(https://news.gallup.com/poll/261680/americans-believe creationism.aspx)。而在更早2006年的一项对30多个国家的调查中,美国人群对演化的接受度排在倒数第二,仅比土耳其高出一些[22]。在这个背景下,就不难理解2005年多福案:2004年宾夕法尼亚州多福校区试图将智能设计论,即超自然的设计可以解释宇宙和生命起源,纳入生物学教学大纲。在多福校区的十一名父母将这一试图在教学大纲中夹带“神创论”的私货的行为一举告到美国联邦法院并最终胜诉,其间就引用了龙漫远教授实验室新基因的研究作为演化发生的证据。

 

盖洛普和皮尤公司对演化论接受程度的调查


今年四月,龙漫远教授因为他和他培养的学生和博士后在新基因起源和演化方面长时间连续的工作得到了古根海姆奖。这个奖项每年从2500多名科学家,人文学者,作家和艺术家竞争者中挑选180名获奖者,在过去30年间,仅有五名华人学者获此殊荣。在12月22日,他同时将在全球华人生物学家大会上接受吴瑞奖,该奖自2009年设立以来颁发给了施一公,林海帆,谢晓亮等知名华人学者,是首次颁发给一位华人演化生物学家。

回望The Journey of Long to New Gene Evolution,我领悟到一个科学家的成功,一开始或许是他/她研究了什么内容,出版了什么成果;但另一方面从我这篇小文章大家也能看到,也在于他/她成功培养和正面影响了多少全世界范围年轻一代新的科学家。

 

参考文献


1. Long M, Langley CH. Natural Selection and the Origin of jingwei , a Chimeric Processed Functional Gene in Drosophila. Science. 1993;260(5104):91-5.

 

2. Ohno S. Evolution by Gene Duplication: Springer Science & Business Media; 2013 2013/12/11. 160 p.

 

3. Wang W, Brunet FG, Nevo E, Long M. Origin of sphinx , a young chimeric RNA gene in Drosophila melanogaster. Proceedings of the National Academy of Sciences. 2002;99(7):4448-53.

 

4. Dai H, Chen Y, Chen S, Mao Q, Kennedy D, Landback P, et al. The evolution of courtship behaviors through the origination of a new gene in Drosophila. Proceedings of the National Academy of Sciences. 2008;105(21):7478-83.

 

5. Wang W, Yu H, Long M. Duplication-degeneration as a mechanism of gene fission and the origin of new genes in Drosophila species. Nat Genet. 2004;36(5):523-7.

 

6. Arguello JR, Chen Y, Yang S, Wang W, Long M. Origination of an X-linked testes chimeric gene by illegitimate recombination in Drosophila. PLoS Genet. 2006;2(5):e77.

 

7. Chen S, Ni X, Krinsky BH, Zhang YE, Vibranovski MD, White KP, et al. Reshaping of global gene expression networks and sex-biased gene expression by integration of a young gene. The EMBO Journal. 2012;31(12):2798-809.

 

8. Zhou Q, Zhang G, Zhang Y, Xu S, Zhao R, Zhan Z, et al. On the origin of new genes in Drosophila. Genome Research. 2008;18(9):1446-55.

 

9. Ruiz-Orera J, Hernandez-Rodriguez J, Chiva C, Sabidó E, Kondova I, Bontrop R, et al. Origins of De Novo Genes in Human and Chimpanzee. PLoS Genet. 2015;11(12):e1005721.

 

10. Guerzoni D, McLysaght A. De Novo Origins of Human Genes. PLoS Genetics. 2011;7(11):e1002381.

 

11. Wu D-D, Irwin DM, Zhang Y-P. De Novo Origin of Human Protein-Coding Genes. PLoS Genetics. 2011;7(11):e1002379.

 

12. Zhang L, Ren Y, Yang T, Li G, Chen J, Gschwend AR, et al. Rapid evolution of protein diversity by de novo origination in Oryza. Nat Ecol Evol. 2019;3(4):679-90.

 

13. Zhao L, Saelao P, Jones CD, Begun DJ. Origin and Spread of de Novo Genes in Drosophila melanogaster Populations. Science. 2014;343(6172):769-72.

 

14. Chen S, Zhang YE, Long M. New genes in Drosophila quickly become essential. Science. 2010;330(6011):1682-5. 

 

15. Xia S, VanKuren NW, Chen C, Zhang L, Kemkemer C, Shao Y, et al. Genomic analyses of new genes and their phenotypic effects reveal rapid evolution of essential functions in Drosophila development. PLoS Genet. 2021;17(7):e1009654. 

 

16. Betran E. Retroposed New Genes Out of the X in Drosophila. Genome Research. 2002;12(12):1854-9. 

 

17. Emerson JJ, Kaessmann H, Betrán E, Long M. Extensive gene traffic on the mammalian X chromosome. Science. 2004;303(5657):537-40. 

 

18. Zhang YE, Vibranovski MD, Landback P, Marais GAB, Long M. Chromosomal redistribution of male-biased genes in mammalian evolution with two bursts of gene gain on the X chromosome. PLoS Biol. 2010;8(10).

 

19. Vibranovski MD, Lopes HF, Karr TL, Long M. Stage-specific expression profiling of Drosophila spermatogenesis suggests that meiotic sex chromosome inactivation drives genomic relocation of testis-expressed genes. PLoS Genet. 2009;5(11):e1000731. 

 

20. Gallach M, Betrán E. Intralocus sexual conflict resolved through gene duplication. Trends Ecol Evol. 2011;26(5):222-8. 

 

21. VanKuren NW, Long M. Gene duplicates resolving sexual conflict rapidly evolved essential gametogenesis functions. Nature Ecology & Evolution. 2018;2(4):705-12.

 

22. Miller JD, Scott EC, Okamoto S. Public Acceptance of Evolution. Science. 2006;313(5788):765-6.