基因神剪 CRISPR :当初被发现及命名的故事

当石野良纯还是日本大阪大学的学生时,他的博士论文就纳入了大肠杆菌的基因定序。那时是 1986 年,基因定序还是一项劳心劳力又伤神的过程,但他终究还是确认了组成目标基因的 1038 组 DNA 碱基对。他在第二年发表的一篇基因研究的长篇论文最后一段,提到了一个他认为并没有重要到需在论文摘要中提及的反常现象。

“我们发现了一个不寻常的结构,”他写道,“29 个核苷酸中有 5 个高度同源的序列,直接以重复型态排列。”换言之,他发现 DNA 中有 5 个完全相同的片段。这些相同的片段,每段都有 29 对碱基的长度,夹在看起来正常的 DNA 序列之间。他称这些片段为“间隔”。这些丛聚的重复序列到底是什么,石野完全摸不着头脑。他在这篇论文的最后一行写着,“这些序列在生物学上的重要性,目前还不可知。”他没有针对这个问题继续研究下去。

第一个厘清这个重复序列作用的研究者,是法兰西斯可.莫伊卡(Francisco Mojica),他是西班牙地中海岸边阿利坎特大学(University of Alicante)的学生。 1990 年,他着手进行自己的博士论文,主题是古菌。古菌就和细菌一样,是没有细胞核的单细胞有机体。他所研究的古菌,在比海水咸 10 倍的盐池里如鱼得水。当他在为一些他认为或许能解释这种细菌之所以热爱盐分的细胞内部分进行定序工作时,发现了 14 个以规律的间隔重复排列、完全相同 DNA 序列。这些重复的序列似乎呈现出回文结构,也就是说它们不论是从正面看过去,还是反面看过来,都完全一样。

莫伊卡一开始以为自己搞砸了定序工作。 “我以为发生了失误,因为在那个年代,定序是很困难的工作,”他爽朗地笑着说。不过到了 1992 年,当他的资料一再显示出这种规律性间隔的重复时,他就开始质疑以前是否有人发现过类似的现象。那个时代,谷歌大神还未出世,网路索引也不存在,因此他只能利用一套学术论文索引的印刷品《现期期刊目次》(Current Contents),透过引文中出现的“重复”这两个字,一笔笔地亲自翻查资料。这已是前一个世纪的事情了,那时候几乎没有什么网路出版品。莫伊卡如果发现任何他觉得有希望的清单,就必须去图书馆把相关期刊找出来。最后,他找到了石野的论文。

石野研究的大肠杆菌与莫伊卡的古菌非常不一样,也因此当他知道两人都碰到了这种重复的序列以及间隔片段时,他真的非常惊讶。这个发现让莫伊卡相信,这个现象在生物学上必然有着相当重要的目的。他和他的论文指导教授在他 1995 年所发表的报告中,称这种现象为“衔接重复序列”,而且他们猜测这种现象可能与细胞复制有关,当然,他们这样的假设并不正确。

当莫伊卡结束了分别在盐湖城以及牛津两地的短期博士后研究工作后,他于 1997 年回到了离自己出生地仅隔着几哩的阿利坎特大学,并组织了一个研究小组,开始研究这些神秘的重复序列。资金取得非常困难。 “他们告诉我别再对那些重复序列执迷不悟了,因为有机体的这类现象实在太多种了,我发现的这种状况,可能根本没什么特别的,”他说。

可是他很清楚,细菌与古菌的遗传物质数量都很少,所以这些有机体不可能浪费那么大量的遗传物质在毫无重要功效的序列上。他继续努力厘清这些丛聚重复的目的。或许它们可以帮助塑造 DNA 结构,又或者在形成蛋白质可以锁定的环圈时,能够提供什么样的助力。这两种假设后来都证明是错的。

CRISPR 这个名字怎么来的?

那个时候,研究人员已经在 20 种不同的细菌与古菌中发现了这些重复的序列,而大家对这个现象所取的名字五花八门。莫伊卡对论文指导教授强迫他接受的“衔接重复”愈来愈不满意。这些序列都有间隔,并不是衔接。于是他重新用了自己最初取的名字“短间隔重复序列”,或简称 SRSR。虽然这个名称更贴切,但是缩写后的字母无法以一个单词的形式发音,大家记不住。

莫伊卡一直都与荷兰乌特勒支大学(Utrecht University)同样在研究结核杆菌中这些序列的儒德.杰森(Ruud Jansen)通信往来。杰森称这些序列为“直接重复序列”,不过他也同意这种现象应该有一个更好的名字。

有天晚上,从自己实验室开车回家的路上,莫伊卡突然想出了 CRISPR 这个缩写后的名字,意思是“常间回文重复序列丛集”。尽管不可能会有人记得这串突兀的措辞,但是缩写 CRISPR 的读音确实干脆又清楚。再说,虽然 PR 读音所漏掉的母音「e」,为这个词汇增加了一层未来主义的光泽,但这个读音听起来还是给人一种友善而非恐惧的感觉。他回家后,询问妻子对这个名字的感觉。 “听起来像是一个非常棒的狗狗名字,”她说,“CRISPR、CRISPR,来这里,乖狗狗!”莫伊卡大笑,并决定就是这个名字了。

2001 年 11 月 21 号,杰森在回覆莫伊卡有关名称建议的一封电子邮件中,就这么把这个名称给定了下来。 “亲爱的法兰西斯,”他在电子邮件中写着,“CRISPR 这个缩写实在太棒了。我觉得拿掉任何一个字母都让这个名称变得没那么干脆,所以我很喜欢这个活泼的 CRISPR,远胜于 SRSR 或 SPIDR。”

杰森在 2002 年 4 月所发表的论文中,更正式地认可了这个名字。他在那篇论文中,报告自己所发现的基因似乎与 CRISPR 有关。大部分拥有 CRISPR 现象的有机体,重复序列旁都会出现某一种编入了制造酵素指令的基因。他称这种酵素为“CRISPR 关联”酵素,简称 Cas 酵素。

作者:是柚子呀,如若转载,请注明出处:https://eozlab.com/zirankexue/shengwu/2830.html