2021年,艾吉泰康®依托卓越的探针设计算法和丰富的基因捕获经验,基于人类参考基因组GRCh38捕获基因组编码区(Ref:20200817)的艾全外®V3核心版本,针对遗传病领域检测需求,开发了艾全外®V3遗传版人全外显子组测序产品。
据悉,艾全外®V3遗传版基于人类参考基因组GRCh38及最新补丁序列设计,应用三层叠瓦式探针覆盖方案和全新的TargetSeq One® v2.0液相探针杂交捕获体系,保证了对编码区(Coding sequence,CDS)和ClinVar数据库中疾病重要变异位点的高度覆盖。同时,艾全外®V3遗传版可完整捕获线粒体全长序列,并专门添加可提高CNV检出准确度的高密度SNP骨架,可以更全面、更精准、更快速的检出高质量SNV、InDel、CNV等变异信息。
自2009年,美国华盛顿大学在《Nature》上发表首个利用全外显子组测序验证弗里曼-谢尔登综合征致病突变的报道以来,全外显子组检测被广泛应用于遗传病、肿瘤、大健康等多领域研究和诊断中。随着全外显子组测序应用场景越来越多,单纯的编码区测序已不能满足多样化的变异检出需求。因此,根据不同应用场景打造特色全外显子组检测产品,一次捕获得到多方面信息的检测结果,成为被大家广泛认同的高效、便捷的测序方案。艾吉泰康将携艾全外®V3遗传版引领人全外显子组捕获测序新风潮。
什么是基因组补丁序列?
人类参考基因组序列来自于多个个体DNA序列的整合,但是由于每个个体基因组序列的不同使参考基因组不能代表所有人的基因组序列情况。同时由于技术限制等原因,被测个体并不是所有的DNA序列都能被测到,组装好的地方也可能存在错误,同时一个基因可能有多个单体型(如HLA),新发现的单体型信息也需及时补充。因此,研究人员不定期将补丁序列(包括fix patches和novel patches)加入参考基因组中,这些新加入的补丁并不会改变原有序列,如补丁版本GRCh38.p10,这样既不会导致基因坐标的频繁改变,又提供了最新的参考基因组序列,从而使参考基因组更完善。
补丁序列也是真实的参考基因组,对于变异信息的筛选至关重要。探针设计时如果忽略补丁序列,极可能导致重要变异位点的漏检。
艾全外®V3核心CDS区基于参考基因组GRCh38及GRC官网最新补丁序列设计,补充超过200个基因的补丁序列,对参考基因组所有序列进行探针设计,真正做到了编码区的高度覆盖,并且对单体型有更好的检测效果。补丁对于参考基因组是非常有价值的补充,可以纠正比对错误以及显示正确的单体型,比如某基因在alt单体型上的深度(图1)明显高于参考基因组的单体型(图2),说明该样本在该基因上属于其它单体型。
图1.实测样本某基因在补丁序列上的覆盖情况
需要注意的是,因为单体型在序列上比较相似,在比对中往往对应为多比对序列,MAPQ值或很低或为零,会对后续分析带来干扰(图中reads颜色为白色),建议使用较新版本BWA中的bwakit解决比对问题,以及GATK特殊的alternate contigs相关流程解决call变异的问题。
https://gatk.broadinstitute.org/hc/en-us/articles/360037498992
艾全外®V3遗传版针对最新RefSeq、CCDS 和 GENCODE等数据库设计蛋白质编码区域捕获探针,同时对基因组高GC区和高重复区等难捕获区域特殊设计优化,以期更全面的捕获基因组CDS区。如图一所示,艾全外®V3遗传版对基因组CDS区超高覆盖,优于其他供应商全外显子产品。
图3. 艾全外®V3遗传版与其他供应商WES产品CDS区探针覆盖度
ClinVar数据库是NCBI主办的与疾病相关的人类基因组变异数据库,它整合了dbSNP、Pubmed、OMIM等多个数据库在遗传变异和临床表型方面的数据信息,是一个集遗传变异、临床表型、实证数据、功能注释与分析为一体的权威数据库。
艾全外®V3遗传版对ClinVar数据库(版本:20210501)覆盖度高(图4),可以得到更多非编码区的疾病重要变异。
图4. 艾全外®V3遗传版实测样本ClinVar数据库真实覆盖度
特色四:增加全基因组范围内高密度SNP骨架和疾病重要基因超高密度SNP骨架,CNV变异检出更准确
CNV(Copy number variation,拷贝数变异)是人类遗传病的一大重要原因,由基因组发生重排而导致。CNV在全基因组范围内都可能发生,如果仅针对外显子区检测会导致大量的疾病相关CNV的漏检。为了更全面的检出CNV,艾全外®V3遗传版增加全基因组范围内高密度SNP骨架(图5)。
图5. 艾全外®V3遗传版SNP骨架在各染色体上的分布
SNP骨架设计时,首先在全基因组范围内间隔100kb筛选出东亚人群中高MAF的 SNP位点,保证全基因组大片段CNV的检出。同时,根据ClinGen筛选含重要CNV变异的基因(如DMD等),这些基因内部按照间隔10kb筛选SNP位点,并且将外显子附近15kb区域SNP位点的密度增加至3kb(图6),以实现重点区域的更高分辨率CNV检测。
图6. 艾全外®V3遗传版DMD基因探针设计覆盖情况
线粒体基因病(Mitochondrial genic disorders)是由线粒体DNA(mtDNA)突变所导致的一类疾病,捕获完整的线粒体基因组有利于遗传性视神经病、线粒体脑肌病、遗传性肌肉衰弱症等线粒体基因病的检测与研究。
艾全外®V3遗传版可完整捕获16569bp的mtDNA全长(图7),从而得到更多线粒体基因病重要变异信息。
艾全外®V3遗传版采用艾吉泰康全新升级的TargetSeq One®v2.0捕获体系,实测数据中各项指标表现优异。
艾全外®V3遗传版illumina平台实测样本reads捕获效率(Target reads capture rate)平均可达80.29%,侧翼捕获效率(Flank reads capture rate)平均可达88.26%(图8),有效降低测序成本。
艾全外®V3遗传版不同样本建核心CDS区和整体目标区域覆盖度均可达99.6%以上,可获得更全面的变异信息(表1)。
表1. 艾全外®V3遗传版实测样本覆盖度
艾全外®V3遗传版基于专门捕获CDS区的艾全外®V3核心版基础上设计。如表2所示,不同样本间艾全外®V3核心版CDS区均一性指标高度稳定。
表2. 艾全外®V3核心版实测样本CDS区均一性
艾全外®V3遗传版在艾全外®V3核心版基础上增加ClinVar数据库、SNP骨架和线粒体全长。经过体系的反复优化,保证线粒体区域超高深度捕获的同时,目标区域整体均一性指标依旧具有良好表现(表3)。
表3. 艾全外®V3遗传版实测样本目标区域均一性
艾吉泰康®产品线已全面覆盖基因捕获领域的上、中、下游,可为整个产业链提供基因捕获一站式解决方案。艾吉泰康®根据临床及科研领域多方向的检测需求,可为客户定制专属的特色人全外显子组检测产品。艾吉泰康®可提供从全外显子产品定义、探针设计合成及性能指标测试的一体化服务,定制周期短,售后服务更完善。同时,艾吉泰康®可提供全外显子产品基因捕获全套试剂及实验仪器,助力客户全外显子检测业务的快速开展。
日前,目标捕获CDS区的艾全外®V3核心版已正式上市,以核心版为基础打造的艾全外®V3遗传版即将正式推出。客户可基于核心版或遗传版灵活定制增加区域,如HLA、MSI、Fusion等,专业研发团队将提供一对一的专享服务。
艾全外®V3遗传版的上市,将成为人全外显子组测序产品在遗传病检测领域的重大革新。艾吉泰康®未来将在遗传病检测领域持续深耕,为用户提供更优质的全外显子定制及检测服务。
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!