体细胞突变是在DNA修复或复制过程中出现错误造成的,已有研究揭示体细胞突变与癌症等人类疾病有关。目前,关于体细胞突变的大多数信息来自于克隆扩增突变细胞,但事实上几乎所有的体细胞突变对于每个细胞来说都是独一无二的,因此正常组织中低丰度突变的定量分析仍是生物学上的一大挑战。单细胞方法可以对体细胞突变负荷进行全面基因组评估,但这种方法耗时长,且价格昂贵,限制了其广泛应用。双重测序法可以分离每条链进行独立测序,并比较两条链的序列以发现错误,但个别链有时会丢失,限制了可准确评估序列变异的DNA片段的数量。
为解决上述问题,美国Albert Einstein医学院Jan Vijg研究团队开发了一种新型双重测序技术——单分子突变测序(SMM-seq),用于检测细胞和组织中的超罕见突变。SMM-seq技术是双重测序的优化升级版本,可在PCR扩增和测序之前通过滚动循环扩增生成每条亲本DNA链的多个独立拷贝,进一步减少测序错误。该研究结果发表在Science Advances,文章题为“Single-molecule, quantitative detection of low-abundance somatic mutations by high-throughput sequencing”。
SMM-seq需经过两步文库制备(图1)。首先,将发夹状接头连接到双链DNA片段的两端,形成一个圆环。每个接头包含一个唯一分子标识符(UMI)和一个滚环引物结合位点。然后聚合酶可以在任一位点结合以环状方式复制两条链,从而形成一条线性扩增的链,每条链拷贝之间有一个共同的连接序列。在生成序列库时,可以在其接头处分离拷贝以进行单独的PCR扩增。由于这些拷贝来自同一个模板,在这个滚动循环扩增过程中产生的错误对每个拷贝来说都是独一无二的,这些伪影可以在下游分析中被过滤掉。
SMM-seq的准确性是基于每个独立的链拷贝中发生错误的概率。从本质上讲,一个真正的突变预计会出现在由亲本链产生的每个拷贝上。在评估SMM-seq的最佳分析参数时,研究团队比较了与使用不同数量滚环链拷贝过滤掉PCR和测序诱导的相关突变频率。结果显示,SMM-seq的准确性在7个拷贝之后就不再有明显的提高,仅使用2个拷贝就实现了双重测序。因此,可使用每个链家族7个reads的截止水平作为高精度变体调用的合格标准。
图1. SMM-seq 工作流程和变体调用算法概述。
研究人员利用正常人IMR90成纤维细胞中提取的DNA进行SMM-seq分析(图2),这些细胞在体外用两种不同剂量的点突变剂—— N-乙基-N-亚硝基脲(ENU)进行了处理。结果显示,每个样本基因组平均有2亿个位点适合进行变异调用,相当于基因组的7%。最低剂量的ENU(25 μg/ml)可使IMR90细胞的突变率显著增加,50 μg/ml 的ENU可导致突变频率增加两倍以上。此外,研究人员检测了对照组和ENU处理细胞的体细胞单核苷酸变异(SNV)突变谱,发现ENU处理后,细胞突变谱明显转移,TA/AT和TA/CG突变的相对表现比对照细胞大2倍以上。因此,SMM-seq可以准确跟踪暴露于低剂量诱变剂诱导的体细胞SNV。
研究团队利用SMM-seq识别了组织样本中与年龄相关的体细胞变异,并重新分析了近期发表的关于人类肝脏中年龄相关突变负荷的全基因组数据(图3)。从3名年轻人和3名老年人的肝组织提取DNA样本,制备SMM-seq文库。分析结果显示,平均每个样本基因组有大约 7.7 亿个位点符合变异调用,相当于样本基因组的26%。SMM-seq检测的突变频率在年轻组和老年组分别为0.34±0.09和0.96±0.16体细胞SNVs/1Mbp。体细胞SNV谱分析显示,老年人肝脏DNA中TA和CG突变约增加了两倍。此外,研究人员从六个分析样本的突变谱中提取了两个从头突变特征S1和S2,发现在老年组中S1显著增加,S2在年轻组中占主导地位,具有丰富的CG到TA转换和TA到AT转换。总的来说,通过SMM-seq发现的突变负荷与通过黄金标准单细胞方法获得的结果一致,且SMM-seq能够检测生理条件下正常人体组织中积累的体细胞SNV。
图3. 正常人肝脏体细胞SNVs的定量检测。
综上所述,SMM-seq作为一种实用性强的测序技术,有望用于大规模人类基因组完整性的全面评估。该研究团队目前已申请SMM-seq专利并计划将其商业化,并将针对双重测序和其他检测方法进行广泛验证,并检测更多已知的诱变剂。与此同时,研究团队与部分学术机构积极合作,包括与Rochester大学研究人员合作,使用SMM-seq比较不同寿命的啮齿动物物种(例如小鼠和裸鼹鼠)的DNA修复机制,以及它们如何受各种自发突变的影响。此外,研究团队还计划尝试使用SMM-seq来筛查人们对可能导致疾病的诱变因素的易感性,例如一些吸烟者如何患上肺癌而其他人却没有。
1. Maslov AY, Makhortov S, Sun S, Heid J, Dong X, Lee M, Vijg J. Single-molecule, quantitative detection of low-abundance somatic mutations by high-throughput sequencing. Sci Adv. 2022 Apr 8;8(14):eabm3259. doi: 10.1126/sciadv.abm3259. Epub 2022 Apr 8. PMID: 35394831; PMCID: PMC8993124.
2. https://www.genomeweb.com/sequencing/new-variation-duplex-sequencing-method-improves-low-frequency-somatic-mutation-detection
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!