科研

首页 - 全部文章 - 科研 - Nat Med|源自中英芬三国队列的“衰老时钟”,利用204种血浆蛋白预测常见年龄相关疾病的死亡率及风险

Nat Med|源自中英芬三国队列的“衰老时钟”,利用204种血浆蛋白预测常见年龄相关疾病的死亡率及风险

年龄是大多数常见慢性病和死亡原因的主要决定因素,随着时间的推移,人体的生理完整性和功能性会逐渐丧失,最终导致重大疾病和死亡的发生。由于不同个体在年龄相关疾病的发病时间和严重程度上存在很大差异,实际年龄是衡量“生物”衰老的一种强有力但并不完美的预测指标,通过使用“组学”数据来捕捉个体的生物功能水平,并将其与特定生理年龄的预期功能水平进行比较,可以更准确地估算出生物的“衰老”。

个体衰老的速度不仅决定了其罹患重大慢性疾病和过早死亡的风险,而且还决定了人口的发病率和残疾程度,这对医疗保健系统产生了重大影响。蛋白质平衡的丧失是衰老的一个主要标志,人们发现蛋白质水平可更直接地从机理和功能角度揭示衰老生物学。先前研究已确定了与衰老相关的关键蛋白质(APs),并利用这些蛋白质开发了蛋白质组年龄时钟来预测某些疾病的风险和死亡率;但这些研究样本量较少,且未在不同祖先群体中进行独立验证。

近期,英国牛津大学的科研人员及合作者在Nature Medicine发表了题为“Proteomic aging clock predicts mortality and risk of common age-related diseases in diverse populations”的文章。研究团队使用包含2,897种血浆蛋白的蛋白组学平台,在英国生物样本数据库(UKB)中开发了蛋白质组衰老时钟(Proteomic Age Clock,ProtAge),探索了其在不同人群中预测主要疾病发病率和死亡率方面的性能。结果显示,共识别出204种可准确预测实际年龄的蛋白质,并发现蛋白组衰老与18种主要慢性疾病(包括14种非癌症疾病和4种常见癌症)的发病率,以及多重疾病和全因死亡风险相关

在中国和芬兰生物样本库的验证研究中,ProtAge显示出与UKB相似的年龄预测准确性。同时,研究团队将ProtAge进行了简化,得到了一个20种蛋白质的版本(ProtAge20),可实现与ProtAge几乎相同的预测性能。综上,该研究表明蛋白组衰老涉及多个功能类别的蛋白质,可用于预测不同地理和遗传背景人群的年龄相关功能状态、多重疾病和死亡风险。

文章发表在Nature Medicine

一般来说,使用蛋白质组时钟检测的年龄与实际年龄相似,但对于有的人来说,两者之间存在差距,这反映了蛋白质水平随着疾病的发展而变化的事实。蛋白质组衰老与年龄相关的生物、身体和认知功能指标有关,包括端粒长度、虚弱指数和反应时间。此外,对蛋白质组衰老时钟贡献最大的蛋白质参与了许多生物功能,包括细胞外基质相互作用、免疫反应和炎症、激素调节和繁殖、神经元结构和功能以及发育和分化。

1.构建蛋白质组衰老时钟

研究团队在UKB中随机选择了4,5441名参与者作为发现队列,并选择3,977名中国慢性病前瞻性研究数据库(CKB)中的缺血性心脏病(IHD)参与者和1,990名芬兰生物库(FinnGen)参与者作为验证队列;并收集了上述参与者的血浆蛋白质组数据。据悉,该研究样本量大约是先前蛋白质时钟研究的30倍。

图1. 研究设计和分析方法概览。

研究团队将UKB队列随机分为70%的训练组和30%的测试组,用于开发蛋白质组学衰老时钟。在训练阶段,比较了六种机器学习方法(LASSO、弹性网络、梯度提升和三种神经网络)训练的蛋白质组年龄时钟模型,利用Olink Explore 3072 panel中2,897个蛋白质的归一化表达来预测实际年龄。鉴于年龄预测准确性较高且具有卓越的泛化性,研究团队选择梯度提升(LightGBM)作为最终模型,并结合Boruta特征选择算法和SHAP值识别出204个AP,基于此成功开发了ProtAge

ProtAge模型在UKB测试集、CKB和FinnGen独立验证集中的R²值分别为0.88、0.82和0.87,其显示出与实际年龄高度相关的优秀预测能力以及良好的泛化能力。进一步,研究团队采用递归特征消除法进行特征选择,确定了一个由20个关键蛋白质组成的模型(ProtAge20),该模型的年龄预测性能达到204个蛋白质模型的95%

图2. 不同队列的蛋白质组衰老时钟性能。

2.蛋白质组学衰老可预测虚弱指数和衰老表型

为了解蛋白质组衰老如何影响衰老相关的生理和认知功能,研究团队在UKB队列中分析了蛋白组学年龄差异(ProtAgeGap,定义为蛋白质预测年龄与实际年龄之间的差异)与以下因素的关联:①综合虚弱指数;②16项个体体能(如慢走速度和握力)和认知功能;③10种生物衰老检测指标(如端粒长度和胰岛素样生长因子1(IGF-1)和临床血液生化检测指标(如白蛋白和肌酐)。在调整了实际年龄、性别和主要社会人口统计学和生活方式混杂因素后,除两个肝脏生物标志物(丙氨酸氨基转移酶(ALT)和总胆红素)外,ProtAgeGap与所有检测指标均有显著相关性

在生物学衰老机制中,ProtAgeGap增加与两种肾功能生物标志物(半胱氨酸C和肌酐)、两种肝酶(AST、GGT)和C反应蛋白水平的升高,以及白蛋白、IGF-1和端粒长度的降低有关。在身体检测指标中,ProtAgeGap增加与自评健康状况差、步行缓慢、每天感到疲劳和经常失眠等相关。此外,ProtAgeGap增加还与衰老指数、反应时间、动脉僵硬和体重指数(BMI)等升高相关,并与骨密度、肺功能和握力的降低有关。

除了舒张压之外,ProtAgeGap20与所有衰老功能表型都有关联。与204种蛋白模型相比,ProtAgeGap20预测与衰老相关的生物学指标(如端粒和白蛋白)更强,但在预测虚弱指数和生理/认知功能指标时较差

图3. ProtAgeGap与年龄相关的生物、身体和认知功能有关。

3.蛋白质组衰老是常见疾病的有力预测指标

研究团队使用ProtAge计算了UKB队列中所有参与者的ProtAgeGap。结果显示,ProtAgeGap前10%、中位数和后10%参与者在全因死亡率和14种常见非癌症疾病的年龄特异性发病率上存在差异;女性和男性的累积发病率轨迹相似。对于招募时年龄为65岁的人群,在11-16年的研究随访期内,ProtAgeGap前10%的人群中观察到累积发病率最高的疾病依次为骨关节炎(59.4%)、全因死亡(55.2%)、IHD(50.6%)、2型糖尿病(35.3%)和慢性肾病(CKD;33.6%)。神经退行性疾病(帕金森病、AD等)集中在ProtAgeGap后10%人群中,在所有招募年龄段的累积发病率均低于1%。

图4. ProtAgeGap将UKB和CKB中的个体分到不同年龄段的死亡和疾病风险轨迹。

研究团队进一步使用多变量Cox比例风险模型,分析了在调整了实际年龄、性别、吸烟、体育活动、社会人口因素和临床风险因素后,ProtAgeGap与全因死亡率和14种常见非癌症疾病的关联是否仍然存在(图5)。在UKB的所有模型中,ProtAgeGap与全因死亡率和除帕金森病外的所有非癌症事件疾病结果均存在显著相关性,尤其是AD、全因痴呆和CKD。ProtAgeGap20与所有调查的疾病均相关,包括帕金森病

特别地,随着多重疾病数量的增加,ProtAgeGap也随之增加。平均而言,在UKB队列招募年龄为40-50岁的参与者中,与0次疾病诊断的参与者相比,终生诊断4+次参与者的ProtAgeGap年数增加1.5年;在招募年龄为51-65岁的人群中,ProtAgeGap增加0.8年。

图5. ProtAgeGap与死亡率和常见疾病的关联效应大小在协变量调整后基本不变。

生物学功能和蛋白质相互作用网络

研究团队对构成ProtAge的204个APs进行功能富集分析,发现这些APs主要在解剖结构发育和发育过程中富集。蛋白质-蛋白质相互作用(PPI)网络分析显示,其中66个蛋白质形成了一个高度互联的子网络,每个蛋白质至少与两个节点连接。与其他蛋白质具有最多连接的个别蛋白质包括:EGFR、CXCL12、ITGAV、CXCL9和CD8A,涉及癌症、免疫反应和身体发育等生物过程。

研究团队还分析了构成ProtAge20的20种蛋白质的作用和功能,发现其主要参与细胞粘附和细胞外基质(ECM)相互作用、免疫应答、激素调控和繁殖、细胞信号转导、神经元结构和功能以及发育和分化等关键生物过程

综上所述,该研究表明血浆蛋白质组学是检测生物年龄的有力工具,可用于量化与成年人群中最常见的年龄相关疾病有关的生物衰老特征。蛋白质组衰老时钟可作为识别与多发疾病相关的生物学机制的可靠工具,并作为识别蛋白质靶点的有用工具,用于指导潜在的药物治疗或生活方式干预,从而帮助降低过早死亡,减少或延缓与年龄相关的主要和多种相关疾病发生。

论文原文:

Argentieri, M.A., Xiao, S., Bennett, D. et al. Proteomic aging clock predicts mortality and risk of common age-related diseases in diverse populations. Nat Med (2024).

https://doi.org/10.1038/s41591-024-03164-7

(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章