克莱格·文特尔,美国生物学家,人类长寿有限公司(Human Longevity,Inc)首席执行官,同时也是我们这个时代少有的集荣誉和争议于一身的科学狂人。他曾公开叫板人类基因组计划,组建塞莱拉公司与政府主导的基因组项目激烈竞争,使人类基因组草图的完成提前了整整四年;2016 年,文特尔的团队又在Science 上发表论文,宣布设计并制造出最简单的人工合成生命体,这一成果也将他再一次卷入舆论漩涡。
文特尔的人生经历堪称绚烂,他玩过冲浪,参加过越战,读过社区大学,在他主导的疯狂的测序竞赛如火如荼之时,文特尔一度试图将人类基因组图谱申请为专利。保守者叫他科学狂人,追随者尊称他“半人半神”,还有许多人因为他合成人造生命体的工作指责他在“扮演上帝”。面对话筒,他却收敛锋芒,宣称自己并非上帝,只是一个追寻真理的科学家。也许在短短半个小时的采访根本无法让我们抽丝剥茧地梳理出这位话题人物背后的行为逻辑,但是测序中国仍然真诚地希望读者能从这篇简短的文字中,透过他如同魔幻现实主义小说一般的人生年鉴,窥视到一个真实的克莱格·文特尔,他的初衷,他的哲学,和他对未来的深刻洞见。以下为测序中国与克莱格·文特尔的访谈实录。
机器学习所能告诉我们的比大家通常想象的更多。举一个具体的例子来说明这个问题。在 HLI 我们创建了一个机器学习团队,这个团队的成果之一就是根据基因编码的信息来预测人的长相。我们招募了一千名以上的受试者,为他们拍摄脸部的 3D 照片,收集了多维度的信息,之后对所有受试者进行测序。接下来,我们将这些数据作为训练集去训练我们的预测模型,目前得到的结果是很令人满意的。
简而言之,机器学习帮助我们找到六十亿对碱基之间隐含的联系,以及他们与表型之间深刻的关联。这与人们之前所相信的,仅用若干个特定的突变就可以解释特定表型变化的观点是大相径庭的。我们的研究发现了更多与面部特征相关的位点,约为已知位点的两倍之多。训练集越大,(通过模型)得到的信息就越准确,因此我们还在不断扩大实验的规模,收集更多人的图像和基因组信息,在更大的量级上利用机器学习技术推进我们的研究。
扮演上帝?不不不,我对于成为传说中的人物不感兴趣。我想在这个国家(中国)说这句话应该是安全的。(笑)我们的所作所为并不是在扮演上帝,而仅仅是探究科学的真理,尝试去理解生命的本质。
难道还有比看着这个小生命一点点生长起来更有乐趣的事情吗?(笑)从目的上说,我们进行这项研究是想探究基因组的最基本构成,从而在分子水平上更为深刻地去理解生命的定义。现在我们已经了解了最小基因组的一种组成方式,但是这样的基因组可能会有成千上万种,所以重要的是,我们得到的并不是“最小的基因组”,而是“最小的基因组之一”。
整个研究过程也并不是一帆风顺的。最初我们从学界公认的生命所必须的基因组合着手进行合成基因组的研究,但是没能得到可以存活的细胞。通过不断的摸索,在添加了 149 个基因之后,我们终于成功地使细胞得以生存。由此我们可以看出,科学界有时候因为缺乏足够实验的支撑,对于一些问题的认识或预估未免过于粗浅,这也是我们为什么将 Richard Feynman(理查德·费曼,美籍犹太裔物理学家,1965 年获得诺贝尔物理学奖)的名言——“我无法理解我造不出来的东西”——以一种特殊的编码方式加入到我们的合成基因组序列中。如果无法用实验的方法实现你的假设,那么也许假设本身就是错的,这可能是合成基因组研究带来的一个很重要的启示。
全部!科学家们应该学会去质疑人们告知他的一切观点。在我开始测序工作的时候,人们还普遍相信人类基因组中的基因数量应该在 10 万到 30 万之间。事实上,成功的科学家并不一定是靠谱的预言家,尤其是在他们所从事的领域之外,科学家们所持有的观念未必正确。蛋白质和 DNA 的遗传物质之争就是一个很好的例子:许多人认为,因为蛋白质比 DNA 要复杂的多,所以DNA不可能是生物的遗传物质。这一观点整整延误了科学家们半个世纪的时间。想想看吧,如果我们从 1900 年就开始研究基因组的话,目前的生命科学将会有怎样的发展?
在科学史上,存在着太多的信念——或者信念系统——最终被事实所证伪。科学的关键在于打破固有思维,这也是为什么很多科学成果诞生于那些转换了领域的研究者的工作之中。我曾经从事蛋白质化学的研究,后来转向了分子生物学领域,并做出了传统分子生物学者难以想象的成果。因此对于志在从事科学工作的人来说,敢于挑战现有的信条是很重要的。
我不太确定自己当时的用词,但这确实是一个值得讨论的问题。追溯到二战结束之后,人们在纳粹的集中营遗址中发现了大量的利用人体进行实验的证据,这让政府和公众感到深深的不安,从那以后在世界范围内开始全面限制人体实验。研究者需要先在动物实验中得到可靠的证据,才能在人的身上开展后续实验。而将基因编辑技术应用于胚胎的问题在于,目前的基因编辑技术并不足够精准,实验中有可能出现脱靶效应,因此将基因编辑技术应用于人类胚胎,进行疾病的干预可能会带来不可预测的结果。
一个更为关键的问题是,我们并不完全了解人类基因组,过往的研究仅仅覆盖了基因组中的一小部分。如果你只了解引擎 1%的部分,怎么可能在它出了问题时有把握将它修好呢?因此我认为,在我们对基因组有足够的了解,并CRISPR被证明具有足够的精确性,有十足的把握实现我们想要的碱基改变之前,应该完全禁止利用 CRISPR 进行人体实验。
在大学教育系统中,教授常常把学生培养成他们自己的“复制品”——学生们想要成为大学教授,是因为他们就是被如此训练的。之前有一位哈佛大学的教授来到我们的测序工厂参观,他很惊讶地告诉我,来到这里之前他从未想过这样的产业能够存在。事实上,随着时代的进步,很多学生在未来也许会从事一些现在并不存在的工作,而大学教授们应该意识到自己的责任,让学生们为这样的未来做好准备。
让我们从机器学习的角度再来看看这个问题。在未来的二十年之内,医学博士将会更多地扮演“生命指导员”(Life coaches)的角色,因为随着机器学习的急速发展,未来的人工智能诊断设备将会远远超过目前最优秀的医生。因此我们需要一个与未来新技术的快速发展、快速迭代相适应的教育体制。前几天我在北京大学访问的时候遇到了许多非常聪明的学生,问了我一些很棒的问题,他们中的很多人都极富潜力——但是这些天赋异禀的学生们同样需要一个完善的体制,帮助他们去尝试全新的想法,惟其如此才可以推动技术与社会的发展和进步。
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!