核酸分子的精确定量在很多生物学应用中都扮演着重要角色,其在DNA水平和RNA水平都可以开展。在DNA水平,拷贝数变异(copy number variations,CNV)在肿瘤细胞中广泛发生,其发生率介于3~98%之间,因此具有广泛的基因诊断和靶向治疗价值。近期发表在Nature上的一篇论文表明,可以利用CNV预测癌细胞的进化,为研究肿瘤耐药和新的治疗方法提供了思路[2]。阅尔基因合作伙伴美国C2i公司利用血浆游离DNA(cfDNA),开发将CNV融入微小残留病灶(MRD)的检测,使得CNV的检测可以应用于液体活检和肿瘤复发监测领域[3]。在RNA水平,基因表达谱的定量分析可以反映细胞和组织的状态,对于理解疾病发生机制也有重要意义。
ddPCR是目前CNV分析的金标准,可以检测最低达2.3倍的倍性变异。然而,液体活检样本的cfDNA含量很低,即拷贝数异常的肿瘤细胞的比例很低,使得样本中拷贝数变异的倍性变化差异很小,现有的ddPCR技术常常无法精确检出其拷贝数变化。为了提高精度通常需要在有限起始量的前提下增加区段内的检测位点,然而受限于荧光通道的个数,ddPCR很难做到超多重定量。
基于此,阅尔基因的研究团队开发出了高转化率的多重定量扩增子测序技术(QASeq),将最低检测限(LoD)进一步优化到2.05,并利用57个来自ERBB2阳性晚期乳腺癌患者的血浆cfDNA样本进行了性能验证。此外,研究团队也构建了一个覆盖20个基因的RNA panel对不同样本类型成功实施了表达量检测。
QASeq利用两步经过设计的PCR反应将唯一分子标签(UMI)连接到起始DNA上,测序完成后,含有相同UMI序列的reads归为一个UMI family,最后通过计算靶标序列的UMI family大小还原起始样本中不同分子的拷贝数。研究人员设计了包含ERBB2(靶标)和EIF2C1(内参)的2-plex panel与ddPCR方法进行平行比较。10ng gDNA投入量的结果显示,QASeq获得了更高的转化率(86% vs 53%)以及更低的波动系数(CV:3.25% vs 13%);当DNA投入量在1ng到100ng范围内,QAseq均有更高转化率。
图1. 基于NGS的QASeq技术。
为降低取样的随机性,通常采用针对多个位点进行CNV检测的方法。研究团队利用一个含有49个ERBB位点、123个参考序列的位点以及3个X染色体(共计175个位点)的panel进行检测, CV值进一步下降到0.69%,并能有效区分2和2.05的倍性差异,与泊松分布模型的理论计算值相吻合。
随后,研究团队展示了多重QASeq panel检测肿瘤组织样本时的表现,对比方法包括ddPCR和IHC,结果同样获得了很好的一致性。考虑到临床样本的复杂性以及可能发生的假阳性,研究人员首先利用健康人群样本的检测结果作为训练集,在分析流程中对涉及的每个基因都进行序列化Mann-Whitney U检验,确保了LoD达到1.97倍的缺失和2.04倍的扩增,并且波动水平在10%以内。175-plex panel理论上相当于15,225种不同的ddPCR实验,从18个肿瘤组织样本的对比检测结果可以看出,QASeq可以将ddPCR的CNV漏检率降低44%。此外,QASeq在UMI的加持下可以定量检测低至0.1% VAF的突变。值得注意的是,通过在乳腺癌的热点突变区域设计扩增子引物,QASeq可以同时检测CNV和热点突变。
图2. 用于CNV检测的多重绝对定量panel。
接下来,研究团队将目光投向了对灵敏度要求极高的液体活检领域,并从15名ERBB2阳性晚期乳腺癌患者的血浆中共采集57份cfDNA样本进行探索性验证。结果显示,共有8名患者在随访期间出现病情进展,其中6名都观察到ERBB2倍性增加的趋势。有两名病例除了发生了ERBB2倍性变异,其疾病进展还与PIK3CA G1049R突变和ERBB2 SNP状态改变相关。综上所述,8名疾病进展患者中均检测到异常事件的发生。同时作者也强调,有4名未复发患者依然检测到了ERBB2倍性增加,考虑到患者均采取了靶向治疗,单一的CNV结果也许并不能解释所有的临床现象。
基于QASeq可以同时检测CNV和热点突变。根据QASeq可检测的VAF能够计算出cfDNA中的肿瘤分子占比,再结合CNV结果可以巧妙推断出肿瘤细胞的ERBB2倍性。而掌握真实的倍性值其临床意义往往更大。研究团队将利用cfDNA计算的肿瘤拷贝数变异和使用FISH方法计算的肿瘤拷贝数变异进行比较, QASeq检测出与FISH一致的拷贝数变异,同时比FISH方法提前5个月检出。因此,该研究提出了一种利用血液样本、非侵入式、高灵敏度、兼具拷贝数变异和点突变检测的纵向研究方法,对于解释疾病进展和耐药机制具有重要指导意义。
图3. 使用QASeq动态监测15名ERBB2+ mBC患者的血浆样本。
最后,研究团队开发的针对乳腺癌的多基因RNA检测panel在FFPE、血液等多种样本类型中进行了可行性验证。模拟样本中目标RNA分子数在3~100,000之间,结果显示,RNA QASeq在稳定性、重复性以及灵敏度上均有不错的表现。与CNV定量类似,增加单个基因上扩增子的密度可以降低定量结果的波动偏差。同时,针对乳腺癌和肺癌患者的FFPE样本,研究人员对比了其它五种类似技术(RNAseq、NanoString nCounter、Microarray、RT-qPCR)的检测结果。其中,Nanostring的检测技术与RNA QASeq均有很好的一致性,但RNA QASeq所需的RNA起始量更少;RNA QASeq与RNAseq的多数样本具有较好的一致性,然而RNAseq是组学范围的检测,RNA QASeq则避免了大量不需要的信息检测,有效地降低了成本;RT-qPCR和RNA QASeq的一致性较高,但其通量远不及RNA QASeq。
图4. QASeq用于基因表达水平定量。
总之,作为一种精确的核酸绝对定量方法,QASeq技术凭借更高的转化率以及更灵活的多重设计克服了CNV检测中源自样本本身的误差,进而实现从二倍体背景中分辨出2.05倍的扩增,而常规基于UMI的测序技术检测CNV的能力通常一般。其中一个关键点在于:连接分子标签时使用基于PCR的方法而非基于连接酶的方法。同时,合理的引物设计以及数据分析方法可以极大降低引物二聚体和非特异性扩增带来的干扰,提高整体中靶率。理论上QASeq可以实现超千重设计。尽管可以通过增加扩增子覆盖密度提高目标基因的检测LoD,但最终的检测效果依然存在边际递减效应,该研究中的175-plex panel提供了一个重数和LoD之间相关性的范式。
作者点评
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!