朱启超,美国堪萨斯州立大学癌症基础研究中心分子生物学博士,癌症基因组研究与癌症个体化诊治专家,具有超过15年在国际知名生物制药公司工作的经验。先后担任莱斯康制药、礼来制药和勃林格殷格翰集团的首席或资深科学家,现任西奈山医学院遗传和基因组学的副教授。近日测序中国邀请到朱启超博士接受专访,围绕肿瘤个体化医疗、数据共享与数据安全、数据分析、大数据挖掘等热点问题进行了深入的交流,探讨如何利用基因大数据推动精准医学发展。
测序中国:朱博士您好!很高兴邀请到您接受测序中国的专访。我们了解到,您在美国长期从事肿瘤的个体化诊疗工作,积累了丰富的经验。那么您是如何理解精准医疗和个体化医疗这两个概念的?
朱博士:首先很高兴接受测序中国的专访,作为行业内的一名科学工作者,我也很愿意和大家分享近年来在美国的医疗机构和制药公司从事精准医疗的经验。关于“精准医疗”和“个体化医疗”,我认为在实质上是没有区别的。在奥巴马提出精准医疗这一概念之前,我们一般使用的术语就是“Personalized Cancer Medicine”(个体化癌症诊疗)。为什么要说癌症呢?因为它是个体化治疗领域起步比较早、发展比较快的一个方向。从2000年起,大量肿瘤靶向药物逐步上市,以基因测序为技术手段的肿瘤伴随诊断也随之发展起来,根据患者个体的突变情况采用针对性的治疗手段。
而随着医学的发展,我们对于疾病的认识不断加深,更多的疾病开始有了个体化的检测方法和治疗手段,这个时候有必要对Personalized Cancer Medicine的概念进行扩展,于是就有了“精准医疗”这样的说法,包括了肿瘤、糖尿病、传染病等多种疾病的个体化诊断和治疗。在未来,通过与大数据技术的深度结合,我们希望精准医疗能够覆盖更多的疾病种类,为大众的健康和医疗做出贡献。
朱博士:我们先来看一下美国的情况。医疗机构是怎么做的呢?拿西奈山医院做个例子,比如它与Vishuo(为朔医学)合作的过程中,双方确定了一套严格的机制来保证数据安全,比如在数据库中对包括位点信息在内的关键信息进行密码化,可以有效避免信息的泄露。从更宏观的角度来说,美国对于知识产权的保护也的确比较到位,合作双方通常会签署保密协议,在相关的法律法规的约束下,可以有效规范契约双方的行为。
对于医疗机构和商业公司来说,无论是在开展服务的过程中积累的数据,还是从公共文献、数据库中下载的数据,对它的收集、整理乃至挖掘都涉及到人力成本的付出,应该属于知识产权的范畴。相信随着国内相关制度的完善,我们可以在确保数据安全的前提下,摸索出高效的数据共享模式,推动精准医疗更快发展。
朱博士:这个问题分两部分来说。一方面是针对过去已发表文献的文本挖掘,目前世界上各大生物及制药公司常用的文献挖掘工具是英国Linguamatics公司的I2E,美国的大多数生物制药公司使用的也是这个平台。I2E有着自己的一套语法规则,用户可以利用它进行复杂问题的文本挖掘,当然费用也相对比较昂贵。它的优点是覆盖度较好,但是准确度稍逊一筹,有“假阳性”的存在。
另一方面是基于基因和表型数据进行的数据挖掘。公共数据,包括与已发表文献相关的实验数据是一个很重要的数据来源,但也存在着由于实验条件不同所带来的误差。因此,进行数据挖掘前需要进行降噪和数据标准化工作。数据挖掘技术可以帮助研究者们发现未知的致病突变或转录水平的改变,进而对疾病的发生发展有更加深入的理解。目前数据挖掘的工具有很多种,但是想要做好数据挖掘,还需要具有丰富经验的专业人士对不同工具进行组合,才能得到理想的结果。数据挖掘技术在精准医疗领域有着广阔的前景,目前已经有很多相关的文献发表在知名期刊上。
朱博士:数据分析对于精准医疗确实具有很重要的意义,它的质量取决于很多因素,包括数据本身的质量、分析的水平、解读能力等等。iCMDB有着完善的质量控制体系,可以对原始数据进行多级质控,确保覆盖度、碱基错误率等众多关键指标合乎要求,从而构建一个准确的、适合临床应用的数据库和分析系统。
朱博士:个体化医疗这个概念发展到现在已经有20余年的时间了,随着靶向药物的增加,个体化医疗的普及必将达到全新的广度和深度,癌症和重大慢病是精准医疗的前沿领域,在不远的将来,与遗传变异有关的疾病都会为精准医疗所覆盖。
但是与此同时,精准医疗还有很长的路要走。例如我们之前讨论的准确性问题,即便是测序的错误率非常的低,但放在30亿个碱基的背景下,也会对诊断的准确性造成一定影响,对临床决策构成潜在的风险。另外一个例子是肿瘤的异质性,不同的肿瘤细胞可能携带有不同的变异,从而给检测造成困难。液体活检和单细胞检测技木有望成为克服肿瘤异质性的有效手段,但是也面临着富集困难、背景噪声强、灵敏度要求高等挑战,让液体活检和单细胞检测技术真正成为可靠的临床应用还有待于从业者的努力。
另外还有经济层面的因素。测序成本虽然一再下降,但是对于一般老百姓来说仍然较为昂贵,保险买单不失为一种较好的解决办法。在美国,已经有部分检测,如BRCA基因的检测,进入到了保险的覆盖范畴。在未来,随着检测费用的下降,老百姓可以借助保险选择更多有效的检测手段,从而使得精准医疗可以真正普及、普惠,带来更多的社会效益。
iCMDB(individual Clinical Medicine Database)是一款由Vishuo公司自主研发的个性化临床医学数据库系统,包含了疾病、生物标记物、变异位点、药物、诊疗方案等数据库,利用热点矩阵等多种模型自动关联各大数据库,通过海量基因信息库全面解析样本基因信息,形成一个在分子水平上的自动化医学检索分析平台,为临床医生治疗决策提供详实的、最新最权威的循证医学方案。为朔(Vishuo)成立于2011年,致力于人类基因大数据的分析、注释、解读等精准医疗领域,http://www.vishuo.com。
本文由 SEQ.CN 作者:王迪 发表,转载请注明来源!