来自国内各大科研院所和产业界的专家齐聚一堂,聚焦于大人群队列研究的现状与未来、挑战与机遇,为线上、线下参会同道带来了精彩的学术分享与热烈深入的讨论。
杨爽 研究员
华大集团执行副总裁、东区首席代表
李斌
华大集团副总裁、《生物经济》主编
随后,华大集团副总裁、《生物经济》主编李斌作开场致辞。李斌指出,世界已经进入大科学时代,基础研究组织化程度越来越高。大人群、大队列研究就是迫切需要提高组织程度的基础研究领域。世界也已进入生物经济时代,我们必须深刻把握生命科学爆发式发展的历史契机,深刻把握生物经济发展规律,从基础研究、从大人群基因组研究这个源头出发寻求突破。
主旨演讲
杨焕明 院士
中国科学院院士、华大集团联合创始人
基因变成信息,就此改变了我们对生命的认识,而测序技术则是基础。杨焕明院士强调,基因测序技术面临三项挑战,即数据、智能化和人才的培养。目前,测序技术经历了自动化和规模化,经历了痕量核酸测序、生态/混合样品先测后“解”、液体活检的多股浪潮,探索不同层次的表现型和巨大数量样本的采集和分析是细胞/发育生物学的又一场革命。此外,杨焕明院士还提到人工智能的运用以及人才队伍对于测序技术的重要性。“只有大科学、大数据、大平台、大团队和大合作才能成就序列化、数字化、规模化、产业化以及全球化的技术突破。”他表示。
汪思佳 研究员
中国科学院上海营养与健康研究所副所长
在过去十年间,汪思佳研究员通过与多个人群队列的合作,采集了超过万余例的同时拥有人体外貌特征数据与多组学数据的样本。其中针对指纹花纹表型的研究发现肢体发育相关基因决定指纹花纹,该项成果于2022年发表在Cell杂志。而其针对皮肤生理表型在自然人群中个体差异的机理研究则获得了德国“CK皮肤生理学研究奖”。
汪思佳研究员作为核心骨干参与了国际人类表型组计划。项目通过系统的精密测量,包括分子表型测量系统、细胞表型测量子系统、影响表型测量子系统和功能表型测量子系统对人类表型测量数据标准体系进行跨尺度、跨时空、多维度的构建和测量。利用国际人类表型组计划产生的深度表型数据,汪思佳研究员将进一步对人体外貌特征与疾病和健康表型的一因多效进行解析。
徐书华 特聘教授
复旦大学
徐书华教授表示,精准医学精髓首先就是将病种细分,然后是在病种细分的基础上细分病人入组。我国人群多样性和大量人口基数支持细分病种和对病人精细分型,这是发展精准医学的优势之一。虽然基因分型不是达到精准的唯一途径,但提供了新的可能。基因信息最大的贡献就是对诊断、预后、治疗三阶段的分型。基因测序已经成为精准医学大多数情况下需要考虑的重要途径。
蒋慧 研究员
华大智造首席运营官
“十四五”期间,我国的大人群基因组研究也已进入新阶段。如何充分利用已有研究成果,解决数据产出等瓶颈问题,实现我国在该领域的前瞻布局与宏观规划?华大智造首席运营官蒋慧指出,在“精准医学研究”专项成果基础上,我们一方面需要进一步扩大队列规模,拓展专病、慢病和共病方向;与已建立的队列资源紧密衔接,最大程度释放已有数据价值。另一方面,需要进一步降低基因测序、影像检测、数据存储与管理的成本,解决基因数据产出与存储的瓶颈问题。同时,通过建立更标准化的质控、信息治理和脱敏数据共享,充分展示系列科研成果的示范与引领效应。
此外,针对大人群基因组研究的诸多痛点,蒋慧还介绍道,华大智造可提供全流程工具和系统性解决方案。华大智造DNBSEQ测序平台持续升级迭代,在全球已参与超过20个大人群基因组项目,这其中就包括了多项国家级基因组计划。2022年,已有超过60Pb群体基因组数据来自DNBSEQ测序平台。
作为华大智造最新推出的超级测序系统,DNBSEQ-T20×2拥有刷新全球通量纪录的超强生产力:单套系统一年可完成高达50000个高深度全基因组测序;同时,DNBSEQ-T20×2通过开放式的测序系统,可节省60%测序耗材,显著降低测序成本;此外 DNBSEQ-T20×2可实现从样本到报告的全流程自动化管控,支持快速部署与启用。
蒋慧指出,华大智造致力于提供超高通量、超低成本、“六化”完备的“存读算用”群体基因组平台方案,助力推进“人人基因组时代”。展望未来,华大智造还将根据实际应用需求,提供满足队列研究全景、全周期需求的智慧实验室。
Dr. Milana Frenkel-Morgenstern
Bar-Ilan University
Elected member of the Board of Directors,Data Science Institute (DSI)
“很大一部分药物响应差异可以通过基因融合(结构变异)和其他基因变异来解释,因此,此类检测在日常临床应用中的有效运用能提高总体成本效益比。”Milana Frenkel-Morgenstern博士表示,可作为药物靶点的基因融合这一概念将被成功阐述。然而,在可预见的未来,预测复杂的药物响应仍然是一个挑战。因此,大规模队列的全基因组关联研究除了常见的遗传变异类型,还应该包括基因融合,以提高预测能力和发现可作为药物的靶点。
赵兴明 特聘教授
复旦大学
赵兴明教授指出,在各国脑计划的支持下,建设了一批具有国际影响力的大型脑科学数据库。目前的脑科学数据库包括环境、行为、医学、神经和遗传的影响。我国脑科学大数据及算法中心至今待建,存在的问题包括:数据获取无统一质量标准,质量无保证;无共享机制,数据储存碎片化,数据资源无规模;分析算法、知识库依赖于国外,自主创新能力低。我国具有收集大规模全维度脑数据的基础,且亟需建立全维度脑数据库。在此背景下,全维度脑科学数据平台--张江国际脑库建立。
赵兴明教授介绍,张江国际脑库数据平台希望建立全维度、多模态、跨时空、多病种的平台,收集六个队列、1.5万例次病例;建立标准化、可比较、全维度、多模态的采集方案,进程血液样本采集、多模态脑影像采集、任务态功能影像采集,同时进行认知评估(Cantab)、心理量表/行为测试、环境评估、采集微生物样本。截止至2023年1月10日,六大队列共入组10796人,完成各模态采集35136例次。
沈侠 教授
复旦大学
“通过联盟合作的形式,我们可以进行几万人的大样本数据分析,其中很多著名的队列虽然参与的样本量不大,但覆盖的蛋白质种类非常的丰富。” 沈侠教授举例,对于冠状病毒受体ACE2蛋白,疫情期间有很多研究需求,而Olink平台上,部分队列在早前的心血管疾病相关蛋白组分析中已经囊括了ACE2蛋白,方便了我们之后对大数据的直接分析。我们期待更多队列,特别是亚洲祖源的队列,加入SCALLOP联盟,将极大助力我们对人类蛋白质遗传机制的探索以及复杂疾病重要靶点的发现。
邱琇 教授
广州市妇女儿童医疗中心主任医师
2012年-2022年,广州出生队列已经招募5.4万对母子,建立了国际标准的千万级生物样本库,在库标本超过280万人份。队列内的样本与临床信息紧密结合,同时还进行多维表型数据收集,包括孩子心肺功能,体成分、肌肉力量等,对后续研究提供关键表型数据。邱琇教授指出,其中儿童癌症的发病率、死亡率数据是最难收集的,但对更全面认识各种因素对健康的效应至关重要。
据介绍,母婴基因组测序研究方面,一期研究已经完成约2000对母婴的全基因组测序;首次从遗传学角度揭示中国汉语言的差异,开展了母婴多表型GWAS研究,建立跨代孟德尔随机工具变量,剥离宫内环境和遗传的效应。
二期研究正在进行中:将逐步累积约1万对母婴全基因组测序数据,聚焦妊娠疾病/健康结局,包括:死胎、妊娠糖尿病、妊娠高血压、早产和胎儿生长受限等。
曹亚南 研究员
上海交通大学医学院附属瑞金医院
曹亚南研究员介绍,中国代谢解析计划目前主要针对疾病的方向包括:流行病,遗传性疾病、核心的慢行疾病(包括2型糖尿病等)。曹亚南研究员举例了中国人群血液病组学的研究发现:1.指环病毒,在76.7%的个体中发现TTV(Torque teno virus)和TLMV(TTV-like mini virus)。30.3%的个体中检测到HHV-4(EBV),高于欧洲人群队列的报道(14%)。2.乙型疱疹病毒(Betaherpesvirus)广泛检出:其中HHV7为 13.2% , HHV6A为0.36%,HHV6B为1.09%,HHV5为1.03%。
曹亚南研究员提到,新发现的良好标志物或者靶点,仍需要进行生物学功能的验证,以确定其是否可以作为疾病诊断或者治疗的标志物。希望ChinaMAP研究能够通过功能验证体系,在中国人群中发现一些重要功能的通路,或者解释部分基因在中国人群或者东亚人群发生作用的功能。
金鑫 研究员
深圳华大生命科学研究院副院长
据悉,金鑫研究员目前正在进行的大规模中国人群单倍型参考序列库构建了迄今较高精度、较大规模的中国人群单倍型参考序列组(reference panel)。金鑫研究员简要介绍了该项目使用的研究方法:利用ref panel对基因芯片数据进行基因型填补(imputation),可显著提升芯片可检测位点数量与基因型质量;依托ref panel可以对中低深度测序数据进行基因型优化和定相,大幅提升基因型检测的准确性;结合自主可控测序技术的进步与成本降低,中低深度测序联合refence panel方案,将大幅替代基因芯片,为大人群研究带来新的机遇。
王爽 研究员
上海同济大学附属医院副教授、四川大学华西医院系统遗传研究院特聘研究员
王爽教授指出,通过隐私计算技术(结合联邦学习,可信计算环境、多方安全计算等多种底层技术)来保证数据检索、模型参数交互、模型推理等数据应用过程中数据和隐私的安全性,使数据使用过程可追溯的同时确保计算结果精度。
圆桌论坛
(从左至右)沈侠教授,徐书华教授,王爽研究员,马晓慧研究员,汪思佳研究员,曹亚南研究员
在圆桌讨论环节,各位嘉宾围绕“隐私计算技术在数据脱敏中的思考与应用”发表了独特的看法。针对隐私计算技术的应用,曹亚南研究员表示,目前隐私计算技术还未充分得到应用,希望可以从实际应用出发进行研究性的开发;汪思佳研究员指出,大规模基因组研究对于隐私计算技术的需求非常大,我们应该让技术帮助数据共享;徐书华教授表示,隐私计算技术在数据共享方面的运用,一方面是出于隐私权利等伦理方面的考虑,第二,是知识产权保护方面的考量;第三则是技术方面的突破促进了数据共享的可行性。
余德健 先生
华大智造总裁
余德健指出,在未来,华大智造将一如既往地全力探索人群基因组的奥秘,用最先进的工具加速科研成果落地与临床应用转化,助力提升国内外精准预防、诊断和治疗的能力,为精准医学与全民健康的发展贡献支撑性力量。
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!