无需对家庭中任意一方进行检测,是定义致病变异PofO的主要临床效用。此外,建立染色体长度(chromosome-length)单倍型与精准的亲本基因组变异检测也具有广泛的应用前景。
文章发表在Cell Genomics
研究团队使用了NA12878、瓶中基因组联盟(GIAB)的HG002和HG005、人类基因组结构变异联盟(HGSVC)的HG00733以及千人基因组计划(1kGP)的NA19240进行了研究。对于所有样本,均使用纳米孔测序数据和Strand-seq库进行了分析;并从纳米孔测序中检测单核苷酸变异(SNV)和小片段插入/缺失(InDel)。
表1. 杂合变体的单倍体分型及与ground truth调用集的比较。
图1. 在HG002中,父本和母本iDMR上的CpG甲基化用于PofO分配。
接下来,研究团队检测了5例个体的220个常染色体同源物,并将推断的PofO与指定的PofO进行比较。结果显示,所有220个同源物都被正确地分配了PofO,即染色体长度单倍型被正确地识别为母系或父系,并且几乎没有相位误差(图2)。
图2. 杂合- SNV PofO的染色体分配结果。
为进一步确认PofO单倍体分型能够提取可靠的亲本信息,研究团队计算了每个孩子推断的父母单倍型与其父母ground-truth变异基因型之间的孟德尔错误率(图3)。结果显示,HG002的局部相位误差出现在8号染色体常见的倒位异构处,其孟德尔错误率升高。此外,HG002整体相位误差最大,其次是9号染色体着丝粒。孟德尔错误率分析结果显示,所有染色体的PofO分配都是正确的。
图3. 孟德尔错误率表明PofO单倍体分型正确地推断了亲本单倍型。
综上所述,当纳米孔甲基化、iDMR与Strand-seq染色体长度单倍型分析整合时,每个人常染色体全长上的等位基因可以被分配到母本或父本同源染色体上。该方法不需要父母的序列数据或SNV联合分析,仅依靠所有人类常染色体至少有一个已知父母来源的iDMR。通过对选定家庭成员的测序工作来追踪致病变异,该方法有助于改善级联基因检测及遗传疾病的筛查。
参考文献:
Vahid Akbari, Vincent C.T. Hanlon, Kieran O’Neill. et al. Parent-of-origin detection and chromosome-scale haplotyping using long-read DNA methylation sequencing and Strand-seqbackgrounds. Cell Genomics(2022).
https://www.cell.com/cell-genomics/fulltext/S2666-979X(22)00191-4
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!