近日,100位来自人工智能、生物医药、材料科学等前沿领域的顶尖科学家在国家会议中心汇聚一堂,共同参与北京2017全球移动互联网大会(GMIC)G-Summit全球科学创新峰会。作为基因大数据领域的青年创新领袖代表,中科晶云CEO赵屹博士与创新企业领袖、专家学者、前瞻投资人一道,以科学之名,共同探讨大数据与精准医学的发展,展开了一场集国际性、科学性和社交性于一体的探索之旅。
中科晶云CEO赵屹博士自2000年开始在中国科学院计算技术研究所从事疾病多组学数据挖掘算法研究及生物医药云计算平台研发工作,现任中科院计算所前瞻研究中心P.I.,博士生导师,中科信息产业研究院精准医学研究所所长。作为学者又是创业者,赵屹博士对于精准医学发展有着怎样的感悟?医学与人工智能的深度结合又会给生物医药行业创造出怎样的未来?基于此,赵屹博士接受了测序中国等媒体的采访,分享了他在人工智能和精准医学领域的思考与实践。
测序中国:赵屹博士,您好,感谢您接受我们的采访。“科学复兴”是本次大会的主题,其中一个特别重要的环节就是如何借助科学的力量来解决文明和社会发展中出现的问题。您在生物信息和人工智能领域深耕多年,同时又以中科晶云创始人的身份在科研成果转化领域做了大量的工作。那么这些科研工作以及产业转化实践的主线是什么?想要解决的是什么问题?
赵屹博士:“科学复兴”体现着“中华民族复兴”的理念和精神,也是中华民族实现复兴必然的和必要的途径。就我们团队的经历来讲,我们一直致力于医学领域和IT领域,在做信息科学的结合,十多年来一直从事生物信息学的研究,与此同时不断地探索着信息技术在医学领域的应用,这可以说是我们工作的主线。
目前新一代基因测序技术带来的分子水平的诊断,包括影像学的识别和处理,都会大量地用到IT的技术,和人工智能的算法。这些算法能对大量积累的数据进行深度挖掘,找到以前并不知道的知识,这是科技为行业带来的促进,甚至在一定程度上可以说是一种颠覆。但医生并不喜欢“颠覆”这个词,在移动互联网的时代,很多创业者提出,我们能做大量“让医生下岗”的工作。可是,为什么非要取代医生?这些技术包括人工智能可以作为更加高效、稳定的手段来辅助医生,帮助医生更好地进行诊断和治疗,我认为这是一件很有意义的事情。
我们从事精准医疗行业,在第一个层面上,精准医学要解决概念的问题。我们要向大众解释清楚,到底这些技术精准在哪里。这其实并不复杂,对于病人,我们要进行精准诊断和治疗;对于健康人群,我们要做到精准预防,我们可以告诉大众在什么情况下有较高的疾病风险,如糖尿病等慢性病的风险。
那么如何做到精准医疗?这就是第二个层面的问题——技术。现在高通量的基因测序技术已经能以很低廉的价格完整地测序人类基因组。除了感染和外伤,其他很多疾病或多或少都有遗传因素的影响。基因检测能对疾病进行早期的预警,包括疾病发生后如何合理用药,这背后其实有着IT技术的支撑。因为基因测序的数据量非常庞大,对于其中数据的处理、分析算法以及存储都有着很高的要求。IT技术与BT(biotechnology)的结合正在整体地推动着精准医学的发展。
第三个层面是公共(医疗)资源配置。就医难一直是国家头疼、老百姓叫苦的问题,其中最核心的一件事是让病人精准地找到其所患疾病的医生。很多时候,一个病人先是在地方医院就医,然后不断地换科室、转院,花费了大量时间和费用,同时也消耗了很多医疗成本,最终走了很多弯路才找到合适的医生。因此,精准医疗还有一个重要的目标,就是快速地为每个人找到最合适的医生。
最后,我们要为健康人提供精准的疾病预防。在未来的两三年内,随着可穿戴设备的发展,以及更便捷、高效的数据采集设备的不断普及,每个人的健康状态将会处于各种设备的监控(检测)之下。像目前比较普及的智能手环,以及智能手机上的APP,其实就是在不断地动态搜集数据。实时健康数据、基因检测数据以及定期体检的数据,共同勾勒出了个体的健康画像。互联网公司的客户画像是通过浏览记录、购物记录来刻画的,与之相比,个体的健康画像具有毫不逊色的重要意义,而且它是真正的大数据,最终目的是对每个人的健康问题提出预警,避免患病或者延迟患病,使大众在患病后能及早治疗,其治疗效果也会更好。
测序中国:您能否描述一下当前精准医学具体的应用场景?
赵屹博士:精准医疗上升到国家战略层面去推行、铺展是近两年的事情,其背后是二代测序技术成本下降所带来的临床应用发展。目前,精准医学落到了医疗的水平,与传统的医学和医疗还是有所不同的,医学需要探索,需要数据的积累,再总结出规律、知识,进而上升到诊断的指南。
目前来看,卫计委跟药监局批准了NIPT(无创产前筛查)技术,它比原有的羊水穿刺方法更便捷,危险性也更小,在临床上得到了比较广泛的应用。肿瘤靶向用药的筛选也是一个很好的例子。因为肿瘤的靶向治疗大概每年需要30-80万元的费用,十分昂贵。而利用基因检测方法花费几千元就能精准地知道受检者更适合哪种靶向药,避免无效的治疗。
此外,还有遗传病的筛查和辅助诊断。如果我们对新生儿进行全基因组或者部分基因的测序,那么一些代谢性的遗传病就可以得到早期的诊断和干预。比如有些携带致病突变的孩子,通过正常的母乳喂养或饮食,摄入了某些蛋白质之后,其代谢产物无法继续代谢进而在体内蓄积,随着时间推移就会出现智力发育或行为方面的问题。但是,如果这些孩子做了新生儿基因筛查,进行早诊断、早干预、早治疗,就会拥有完全不同的人生。
目前在国内,很多地方政府已经免费让新生儿进行耳聋基因检测。除了耳聋之外,还有许多遗传病是可干预、可治疗的。目前我们与卫计委、药监局以及优生优育学会都有着积极的沟通,希望以部分地区的试点为起始,慢慢普及到全国所有的新生儿。
测序中国:您作为一个科学家又是一名创业者,对精准医学的发展以及普及有着怎样的观察和思考?
赵屹博士:从事精准医疗,绝对不能草率地认为二代测序技术就能够解决所有的事情,从公司的角度讲,如果不与医生进行深入的合作,很多情况下会陷入盲目的境地。所以对于精准医疗,我们应不要一窝蜂地凭着想象或热情盲目地向前冲。我们更看好那些敢用事实来说话、以数据作为支撑的团队。
测序中国:近年来基因检测行业出现了一些检测项目,比如争议很大的“天赋基因检测”,以及去年曝光的江苏老人陷入基因检测骗局的新闻。您认为对于普通消费者来说,哪些基因检测服务是可以信赖的?
赵屹博士:相对来说,应用于临床的产品,严谨程度要高一些,更高一些。市面上也有很多公司从事消费级的基因检测,这是有一定科学依据的,只是各家公司的严谨性不一样。要实现更为准确的疾病风险预警,需要非常庞大的数据库来支持。如果没有成熟的中国人自己的数据库就去做解读,尤其是天赋基因方面,很轻率地去判断一个儿童有什么天赋资质,我认为是很危险的。
总体来说,基因检测领域也需要国家相关部门的监管,监管暂时没有的时候,可以借助行业内协会的力量,在专家共识的层面进行初步的行业规范。
测序中国:您刚才谈到,大数据和人工智能为生物医药行业带来了很多新的活力,那么您能否具体谈谈,人工智能为我们带来了哪些新的可能?
赵屹博士:就我们的研究实践来说,人工智能在医学影像学的诊断上确实能媲美专家的水平,而且更稳定,它可以24小时不间断地工作,不会疲劳。我们知道,像看病理切片、CT等的水平很依赖于医生经验的积累,而我们通过人工智能的学习算法,以专家的水平通过深度学习的方法建立了模型之后,就为大规模的推广创造了条件。
从某种程度上说,人工智能增加了医疗资源的供给,并且为医疗资源的优化配置提供了更多可能。医生专家是有限的,且集中在大城市,但是人工智能可以源源不断地复制“专家”,让偏远地区的老百姓也能享受到优质的医疗资源,这也是我们说的医疗资源的“下沉”。
测序中国:您能否介绍一下人工智能在医疗领域的技术进展?
赵屹博士:第一,人工智能可以通过语音识别辅助电子病历的录入。这解放了医生繁重的病例录入工作,提高了工作效率,尤其是对于接诊急症患者时候留下的文字的记录,人工智能会使这件事情非常便捷。
第二是影像识别。比如Nature上发表的文章,提出用手机拍摄皮肤的痣、溃疡、破损等,然后把照片传到云端之后,通过深度学习训练好的模型,快速、准备地判断这些是否有癌变的问题。对于其他的皮肤病,这也具有很好的应用价值。除此之外,如中山大学附属医院也在眼科视网膜的眼底病变的影像图片方面,做了一些深度的学习,实现了视网膜早期病变的判断,并且其诊断水平跟专家水平是一致的。
第三是分子水平,在phenotype(表型)和genetype(基因型)的关联性上,深度学习是做得非常好的。从医学上说,疾病有很多症状,或症候群。在探索它们和基因组上的某些区域的关联时,深度学习有着非常好的应用,将来也会在基因诊断的时候进行很好的辅助。
测序中国:说到人工智能,再过两周柯洁就要迎战AlphaGo了,您有怎样的预测?
赵屹博士:我的猜测或者说预测,AlphaGo基本上很有优势能战胜柯洁,因为目前人工智能算法确实在很多领域取得了超乎我们普通人想象的突破性进展。所以在这里我可以做一个大胆的预测,人类可能面临失败。但是对于大众来讲,这是一个很好的推广或科普的机会,至少会让更多的人产生好奇心:每个人手上都有笔记本或者个人电脑,为什么它现在能发展得这么快?为什么它能够在某些领域里面完胜人类,包括在凝集着人类智慧的棋类的比赛中。
无论结果如何,这次对决都将是一个很好的向大众普及的机会。下一步,我们更为关心的问题是,人工智能是否进入到应用层面,如在无人驾驶、图像识别等领域有了突破性的进展,进入到老板姓的生活场景中,那将是一个极大的成功。基因检测也是一样,老百姓也许一时间并不完全理解,但是如果能实实在在给他们带来好处,带来便捷,那么也会反过来有利于科普的工作。所以说,人工智能也好基因检测也好,最后一定要落到产品或应用上。
测序中国:最后一个问题,您认为精准医学在技术层面最需要去做的事情是什么?
赵屹博士:最重要是两件事。一件是建设中国人群数据库,现在我们对疾病进行判断的时候,都依赖于高加索人的数据,这肯定是有问题的。我们已经发现很多反例,在高加索人群中某个位点的突变会导致疾病,在中国人群中则没有;另外也漏掉了中国人特有的基因位点。所以当务之急就是建设中国人群自己的数据库,这个数据库会给我们很多基线,告诉我们某种慢性病或者肿瘤的基线水平是怎么样的,从而帮助我们更好地去进行诊疗。
第二件事就是数据的存储、处理和解读。IT的任务是解决一级计算问题,或者解决P级或者P以上的数据的存储,怎么去分布式存储,快速地进行冷存储、热存或快速地响应、调度、查询。而最重要的是如何有效地去做标准以及快速查询。因为一个人好查,一百万人群要统计一个位点,则需要更先进的查询技术,我觉得这个是精准医学最核心的算法问题。
最后,数据的解读也很重要,当前行业内需要更多的专业遗传咨询人员,帮助百姓去理解检测结果的意义,帮助他们正确地认识和面对。只有在解读层面真正实现规范、专业化,才能够有效避免一些行业乱象的发生,确保我国的精准医疗始终处于健康、高速发展的快车道。
本文由 SEQ.CN 作者:戴胜 发表,转载请注明来源!