为测量端粒长度,科研人员目前已开发出各种方法,包括末端限制性片段(TRF)分析、STELA、TeSLA、定量PCR、Q-FISH、Flow FISH以及基于新一代测序数据的端粒长度估计等。但由于端粒的重复性和长度等原因,这些传统方法无法解析染色体臂和单个端粒的等位基因特异性组成,因此在分辨率和准确性方面存在局限性。近年来,随着长读长测序技术的出现,使得对完整端粒的长度和组成进行解析成为可能。例如,PacBio HiFi和Oxford Nanopore(ONT)等长读长测序技术均可以以更高的分辨率对端粒进行测序和测量。
在题为“High resolution long-read telomere sequencing reveals dynamic mechanisms in aging and cancer”的文章中,索尔克生物研究所的研究团队开创性地发明了一种全新方法——Telo-seq,其使用纳米孔测序来有效地对人类端粒进行测序,能确定单个染色体上端粒的完整序列和精确长度,为端粒在健康和疾病中的动态变化提供了新见解。研究团队使用Telo-seq分析了整体、染色体臂特异性和等位基因特异性的端粒长度,并探究了五个群体倍增(PD)中端粒缩短的问题。
结果显示,同一样本内端粒长度是异质性的,其缩短率也存在较大差异;尽管存在异质性,但一些染色体臂的端粒相对于平均端粒长度始终偏长或者偏短,这些染色体臂特异性端粒长度差异在不同个体之间是保守的;相较于老年人,年轻人的端粒通常更长,表明随着年龄的增长端粒变短。综上,Telo-seq是一种高效且可重复的方法,能够揭示样本内、染色体臂特异性、等位基因特异性端粒长度的异质性。
图1. Telo-seq测量染色体臂特定端粒的长度
此外,研究团队对癌细胞的分析表明,Telo-seq可以有效地区分端粒酶阳性(TERT+)和端粒选择性延长(ALT+)阳性的癌细胞系;既可分析正常复制危机细胞中的短端粒,也可分析ALT+癌细胞系中的超长端粒。 ALT 阳性癌症通常更具侵袭性,需要与端粒酶阳性癌症采用不同的治疗方法;从这一意义上讲,Telo-seq 可以用作快速可靠的诊断工具,以识别癌症类型并指导更个性化的治疗计划。同时,结合全基因组测序,Telo-se还将有助于研究遗传性端粒综合征,并解决潜在的基因改变对端粒结构的影响。
图2. Telo-seq揭示TERT+和ALT+癌细胞端粒长度分布
另一篇题为“Digital telomere measurement by long-read sequencing distinguishes healthy aging from disease”的文章中,斯坦福大学的研究团队则开发了一种测序准备和生物信息学分析流程—Telometer,能够从全基因组或富集端粒的长读长测序数据重复测量端粒,即采用纳米孔测序进行数字端粒测量(DTM),以了解人类端粒长度的分布如何随着年龄和疾病的变化而变化。
通过将端粒重复序列与最近完成的T2T人类参考基因组的染色体末端对齐,研究团队可识别出含有端粒的reads;将每个端粒的范围定义为从染色体末端的末端重复序列到亚端粒序列前最后两个连续重复序列的距离,这个亚端粒序列将端粒区域锚定到其参考染色体上。经验证,通过长读长测序测量的平均端粒长度与现有的金标准、TRF和Flow-FISH高度相关。
图3. 纳米孔长读长测序用于高分辨率端粒测量
同时,随着额外端粒测量的增加,该方法测量的标准误差呈指数衰减,最终达到30-40个碱基对的最大精度。随后,研究团队以高达30 bp的分辨率测量了遗传定义的人类细胞群体、健康供者的血细胞和端粒维持遗传缺陷患者血细胞的端粒磨损和新生延长。结果显示,人类的衰老伴随着长端粒的逐渐丧失和短端粒的积累,而在端粒维持缺陷的患者中,短端粒的积累更为明显,并与表型严重程度相关。
此外,基于生成的高分辨率测量数据集合,研究团队应用机器学习训练了一个二元分类模型,该模型可以将健康个体与端粒生物学障碍(TBD)个体区分开;值得注意的是,DTM可高灵敏度区分无症状携带者与正常个体,有望作为评估 TBD 的诊断或预后工具。
图4. 基于端粒长度分布区分健康人的衰老和疾病
综上所述,研究团队使用DTM方法高精度地测量了三种TBD基因型在培养和体内观察到的端粒缩短;并发现端粒酶在人类中优先作用于最短的端粒。随着长读长基因组数据库的增长,从更大、更多样化和理想的纵向研究中分析端粒长度分布,将使端粒长度成为更强大、甚至可能是衰老和疾病的预测生物标志物。
本文由 SEQ.CN 作者:陈初夏 发表,转载请注明来源!