从癌症或遗传病基础分子机理研究到临床检测,NGS技术的快速发展已经深入到生物医学的方方面面。而NGS检测相对于传统的分子检测具有流程复杂、周期长、产出数据量大、信息量大等特点。因此,从前期不起眼的核酸抽提到后期的数据分析以及最后的变异位点解读,每个环节都会影响最后的结果。
如今,由于上游较高的技术门槛,这一领域已经被传统的老牌公司占据主导地位,而相对容易进入的后期数据分析则成为多数创业公司的切入点。作为开源工具的领头羊,GATK和Samtools在科研和商业上占据了DNA-seq数据分析的半壁江山。而随着研究的深入,研究人员对分析速度、分析通量、多组学数据的分析等方面有了越来越高的要求,随之也出现了基于算法优化的Sentieon、基于硬件优化的Edico Genome(被Illumina收购)、基于云计算的DNAnexus、基于多组学分析的OmicSoft (2017年被QIAGEN收购)以及提供桌面化分析工具的CLC Bio (2013年被QIAGEN收购)等优秀的商业化软件公司。
当测序通量和分析速度逐渐解决,随之而来的则是如何从海量的变异位点中筛选出真正具有生物学意义、真正致病或者能够作为药物靶点的基因位点。这一领域看似不需要复杂的算法和高性能计算的变异位点注释和筛选过程,但实际上该领域却成为了目前精准医学行业的最大瓶颈之一。为了规范变异位点的解读,早在2015年,美国医学遗传学和基因组学(ACMG)以及分子病理学协会(AMP)曾联合出版了变异位点解读指南,基于28个判断标准(criteria)将变异位点分为了Pathogenic、Likely pathogenic、Uncertain significance、Likely benign和Benign五个级别。同样,在2017年,AMP、ASCO和CAP也联合制定了体细胞突变变异位点解读指南,基于变异位点的临床意义将其分为Tier I、Tier II、Tier III、Tier IV四个级别。
虽然目前行业内已经拥有了标准的ACMG-AMP行业指南,但是研究者通过评估美国9个顶级实验室采用ACMG-AMP指南对99个变异位点的分级结果后发现,评级的一致性只有34%;另外有44%是不一致的,但是不会影响用药或治疗;剩下的22%解读结果截然相反,会影响患者的用药或治疗。评级结果之所以有如此大的差异,主要在于支持变异位点的文献、数据库信息是否充分或正确。
图1. 9个实验室对99个变异位点的分类一致性结果
在国内外众多生物技术公司中,QIAGEN早期便敏锐地捕捉到变异位点解读这一挑战。面对该挑战,QIAGEN的解决方法和策略是什么?又采取了哪些措施和手段? 早在2015年,QIAGEN便推出了针对变异位点解读的临床决策支持系统QIAGEN Clinical Insight Interpret (QCI-I)。该决策系统基于人工矫正的>5 million与生物学意义相关的证据、自主开发的Phenotype-Driven Ranking 算法以及变异位点解读指南(ACMG/AMP)和体细胞变异位点解读指南(AMP/ASCO/CAP)快速鉴定致病位点并提供相应的treatment、clinical trial、prognostic、clinical case、references等信息。
图2. QIAGEN Clinical Insight Interpret决策系统
据了解,QCI-I决策系统背后基于QIAGEN Knowledge Base(QKB)数据库,该数据库整合了QIAGEN 2014年收购的遗传病变异位点金标准数据库HGMD、变异位点用药数据库PGMD、2013年收购的Ingenuity Knowledge Base 数据库、临床诊断的罕见病变异位点数据库CentoMD(目前包含17万例罕见病患者)以及第三方的数据库包括COSMIC、OMIM、ClinVar、1000genome、Allele Frequency Community等。QKB总共包含了>13 Million findings、18,029个基因、933,702个变异位点、>300,000 curated articles、跨越了>4,000种同行审议的杂志、分析样本数>500,000、文章引用率>25,000篇。这些完善的数据库信息,尤其是人工矫正的文献信息,为触发ACMG-AMP、ASCO/AMP/CAP指南中的co-segregation、de novo status、co-occurrence、functional study criteria 提供了充足的信息,而这些是公共数据库信息很难提供的。
图3. QKB包含的信息
图4. QKB与HGMD和ClinVar比较
QCI-I决策系统中所有变异位点的分级均采用行业的标准指南ACMG-AMP,AMP/ASCO/CAP对变异位点的致病性和临床意义进行评估。同时,在分析结果中实时展示触发的指南criteria以及对应支持文献。对于解读结果,遗传咨询师或临床医生可以完全自主进行级别重定义以及自定义是否在报告中展示。此外,列为Reportable的变异位点会自动构建成内部数据库,如果有相同的变异位点在新的患者中出现,会自动标注该位点在以前的报道中有出现过。
图5:QCI-I决策系统变异位点分析页面
QKB中包含了>20,000中疾病类型、>8,000种药物、>13,000条人工矫正的变异、药物和疾病关系的条目,其中有>1400条条目与NSCLC相关。同时在美国和欧洲每个月平均有1~3个药物被审批、250个癌症相关的clinical trial开始并且有140个癌症相关的clinical trial停止招募,所以QCI-I会每周进行FDA/EMA药物label和Clinical Trial的更新,在分析报告中提供最新的用药和临床实验信息。
图6. QCI-I包含的用药信息在不同癌症中的比例
此外,QCI-I决策系统通过与美国知名的临床基因检测公司Counsyl合作,发现Counsyl人工解读团队80%的时间花在了文献整理(50%)和变异解读(30%)上。这种低效率和耗时的工作主要是由于越来越多的VUS被发现,需要花费大量的时间去阅读文献、查找数据库进行确定。而采用QCI-I系统进行变异位点可以由原来的80个小时缩短到20个小时,减少了75%的时间(解读1000个变异位点),这样研究人员可以有更多的时间进行新产品研发、回顾性大样本的分析等。
图7. 人工和QCI-I解读1000个变异位点时间
如何降低VUS一直是临床基因组学的挑战。为了比较采用人工矫正的primary literature(第一篇报道变异位点的文章)和不采用人工矫正的primary literature对变异位点解读的差异,研究人员随机挑选了180个与Lynch syndrome相关的变异位点和99个与cardiology disease相关的变异位点,然后采用添加人工矫正的primary literature信息和不添加人工矫正的primary literature信息后QCI-I进行解读。结果发现,添加人工矫正的primary literature信息后分级为VUS的变异位点可以减少27%~33%。
图8. QCI-I包含primary literature和不包含primary literature 信息解读Lynch syndrome(左)和cardiology disease(右)结果比较,数值表示两者之差
如今,基因检测技术正在临床环境中担任着越来越关键的角色,是临床辅助查找病因、帮助医疗工作者做出个性化治疗决策或用药选择的重要技术手段,因此变异解读结果的准确性和一致性显得尤为重要。基因检测与解读相对复杂,这需要数据分析方和需要医务工作者的共同努力,但临床决策系统的发展与革新必将大大缩短基因检测的“最后一公里”。
7月24日晚上20:00,QIAGEN公司专家会进行在线直播,详细介绍QCI-I临床决策系统并进行案例分享,可以通过以下两种方式进入参与学习和讨论。
1. 电脑端:
网页端登陆该网址:http://cloud.xylink.com/live/v/ff80808163d5a29c016492c4fab033b6
2. 手机端
扫描以下二维码进入:
本文由 SEQ.CN 作者:陈初夏 发表,转载请注明来源!