背景介绍
体细胞突变,是指个体在受精后获得的突变,存在于个体中那些由原始突变细胞分化而来的细胞。这种突变可以是无意义的,也可以给受影响的细胞带来功能上的优势或劣势。前期的研究表明大脑中某些体细胞突变在揭示正常神经发育机制层面具有提示作用,另外一些突变也已经被认定在癌症和一些局灶性癫痫中发挥重要的作用。但体细胞突变是否会影响其它神经精神疾病,这个问题仍然有待进一步的研究。
自闭症是一种复杂的异质性神经发育疾病,其特征是患者存在沟通和社会互动障碍以及重复行为。几项大型的自闭症家系研究表明,体细胞单核苷酸变异 (sSNVs) 在自闭症的发病中发挥重要作用,其中5.4%—22%的sSNVs被认定为新型突变。
然而,由于样本缺乏以及测序深度的限制,前期研究都是在非常小的样本量下进行的,要么只基于外显子组,要么就是测序深度不够,而明确大脑中体细胞突变的全基因组信息,对于更好地理解突变如何塑造成人大脑发育、促进正常变异和引起疾病等问题至关重要。同时,自闭症患者大脑的全基因组深度测序信息仍然缺乏,因此,了解自闭症患者大脑中的体细胞突变能够为解析影响该疾病的风险因素提供重要信息。
近期,来自哈佛医学院等单位的研究团队在Nature Neuroscience杂志在线发表了题为“The landscape of somatic mutation in cerebral cortex of autistic and neurotypical individuals revealed by ultra-deep whole-genome sequencing”的研究性文章,发布了迄今为止最大的人脑体细胞突变概况,该研究通过全基因组深度测序,描述了人类大脑中受精后发生的体细胞突变的特征以及全基因组体细胞突变在自闭症发病机制中的重要意义。
文章发表在Nature Neuroscience
体细胞突变的鉴定和验证
该研究共纳入了59个自闭症患者和15个正常对照的脑组织,提取前额叶皮层的DNA进行平均深度约为250×的全基因组测序。之后使用一种名为MosaicForecast的基于机器学习的算法在所有样本中识别sSNVs、位点插入或缺失,该算法可在缺乏匹配参考组织的情况下检测体细胞突变。
图1. 整体研究及数据分析概况,来源:Nature Neuroscience
经过严格的过滤,研究人员在每个样本中鉴定出平均25.6±10.2 的sSNVs,检测到的sSNVs的变异等位基因分数在2%—39%之间。但是,总体结果表明,自闭症患者和对照组之间sSNV总数没有显著差异。接下来,他们对上述208个鉴定的sSNVs进行深度重测序,平均深度约为50,000×,以此证明突变鉴定算法的准确性,靶向重测序的变异等位基因分数与全基因组测序估算的一致。
图2. sSNVs的鉴定和验证,来源:Nature Neuroscience
体细胞突变富集于编码区和开放染色质区
很少有研究在如此大的样本基础上进行全基因组深度测序,并以此确定基因组的哪些区域存在早期发育的体细胞突变。研究人员通过分析发现,35个sSNVs存在于外显子区域(2.2%),大约是预期的两倍。这些数据表明,编码区域在发育过程中特别容易受到体细胞突变的影响。除了发现外显子中富集sSNVs外,研究人员还观察到开放染色质区域的体细胞突变较多。
图3. sSNVs存在的基因组区域,来源:Nature Neuroscience
克隆突变分析揭示了对早期胚胎发育的见解
接下来,研究人员使用最大似然估计法,通过将sSNVs分配到特定的细胞代系,根据它们的等位基因部分,探索了早期胚胎中的突变动力学。使用该算法分配的细胞代系与先前进行单细胞谱系分析的三个大脑的数据有很好的相关性,在校正检测灵敏度后,他们估算了每一代细胞的突变率。分析结果显示,在受孕后的第一次细胞分裂期间,突变率升高(每次分裂约3.4个突变),随后的细胞分裂中,每次分裂约2-3个突变。
每一项对体细胞突变的研究都固有地受到组织取样的限制,因为体细胞突变本质上只存在于特定器官的某些区域。因此,传统上很难估计全身甚至全器官范围内的体细胞突变负荷。在该研究中,他们利用细胞世代分配算法推算了大脑中的整体体细胞突变负荷。结果发现,大约50%的个体在2%的皮质细胞中具有潜在的破坏性外显子sSNVs的存在。重要的是,这种sSNVs即使是低变异等位基因分数也有可能导致疾病,因为等位基因比例低至1%且仅存在于大脑小区域的破坏性突变经常被报道通过局灶性皮质发育不良引起癫痫等神经性疾病。
图4. 克隆突变分析揭示了早期胚胎的突变动力学,来源:Nature Neuroscience
接下来,研究人员评估了sSNV数据集中的特定碱基变化。与其他关于人类克隆体细胞突变的报道一致,大多数sSNV是C > T转变(48%),其中约一半发生在超可变CpG二核苷酸的环境中。有趣的是,在前四次细胞分裂过程中,转变类型发生了变化:C > T转换增加,T > A转换减少。
图5. 碱基转换的分析,来源:Nature Neuroscience
自闭症患者的大脑包含影响大脑活跃增强因子的关键变异
与对照组相比,研究人员没有观察到自闭症患者在大脑活跃增强因子中整体sSNV的富集;然而,他们在评估大多数可用的大脑表观基因组中仅带有活性增强子标记的序列时发现,在自闭症患者组确实观察到显著富集,反映了那些最可能代表个体间共存的关键增强因子的区域。
此外,大脑活跃增强因子中整体sSNV中,在具有转录起始位点的基因表达丰富,暗示了增强子突变的直接功能相关性,而在其他关于外周血基因组的研究中,调节区域的非编码突变与自闭症谱系障碍有关。该研究的数据也表明通过调控区域的体细胞突变能够扰乱大脑必需基因的表达,也可能会潜在地增加自闭症的发病风险。
最后,为了研究假定的增强子突变的功能意义,他们设计了突变体结构,并通过标准荧光素酶活性测定在培养的神经嵴源性细胞中评估其对转录活性的影响。结果表明该突变对转录活性有重大影响,导致神经母细胞瘤细胞系的细胞活性降低,从而产生更分化的神经元状态。
图6. 自闭症患者大脑活跃增强因子体细胞突变的分析,来源:Nature Neuroscience
综上,在该研究中,研究人员对74个大脑进行超深度全基因组测序,包括59个自闭症患者的大脑。对高覆盖率的全基因组测序数据的分析揭示了大脑典型的和自闭症大脑中丰富的体细胞突变现象,概述了大脑中体细胞突变的比例和类型,并揭示了对早期胚胎体细胞突变积累的见解;该研究还表明,在自闭症的病因学中,发生在非编码调控区域的体细胞突变可能具有重要作用。
参考文献
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!