科研

英国生物样本库(UKB)向全球开放50万人全基因组测序数据

近日,英国生物样本库(UKB)表示已经向全球经批准的研究人员开放了其50万参与者的全基因组测序(WGS)数据。这是有史以来最雄心勃勃的同类项目代表了迄今为止世界上最大的单一测序数据集。该数据集有潜力为主要常见病的病因提供新见解,并指导潜在治疗靶点的选择。

这一大规模的WGS数据,结合UKB现有数据和生物样本,将带来非凡的生物医学创新,包括更有针对性的药物发现和开发、发现数千种致病的非编码基因变异、加速精准医疗、理解疾病的生物学基础。

来源:UKB官网

此次WGS数据的发布UKB是向全球研究人员提供基因数据集的后续,可通过其研究分析平台提供给世界各地的研究人员。2017年,UKB完成了对所有50万参与者基因分型数据的发布,随后几年中又发布了整个队列的外显子组测序数据。大约一年前,UKB公布了首批20万名参与者的WGS数据。目前,这些数据现已更新为最新版本。
UKB的WGS项目于2018年开启先锋测序阶段,主要测序阶段于2019年9月开始,对所有UKB参与者的基因组测序在2022年完成。该项目由英国政府、Wellcome信托基金、安进、阿斯利康、GSK和强生公司共同资助,共涉及11个合作伙伴,耗资约2亿英镑(2.54亿美元)。其中,英国政府机构研究与创新中心(UKRI)和Wellcome信托基金支付了约一半的费用,上述四家制药公司各提供了2500万英镑,支付另一半费用。

该WGS项目的测序工作由安进子公司Decode Genetics和Sanger研究所完成,使用Illumina NovaSeq平台测序,deCODE Genetics提供额外的信息处理支持。该项目的平均测序深度为30X,测序总时长约35万小时,产生了27.5PB的基因数据在巅峰时期,每个月有超过2万个全基因组被测序,每个基因组约有30亿个DNA碱基对。

在Wellcome信托基金提供的资金中,2000万英镑用于为WGS数据开发一个基于云的分析平台。该工作由美国数据分析公司DNAnexus负责,并帮助开发了UKB研究分析平台,该平台由亚马逊网络服务公司(AWS)提供基于云的计算基础设施和数据存储。
UKB首席研究员Rory Collins表示:“之所以将云平台与WGS项目联系起来,是因为数据的规模。我们正在进行大规模测序,将其移交给研究人员是不可行的。UKB的WGS数据只能通过云平台提供给研究人员。同时,研究人员还可以访问之前从该数据库获得的其他数据类型。”

云分析平台的使用可以通过减轻研究人员的本地计算负担,帮助UKB的数据“民主化”。在这方面,AWS每年向希望使用该平台的职业早期或中低收入国家地区(LMIC)的研究人员提供价值50万美元的免费计算能力。

测序完成后,四家制药企业共同使用Illumina DRAGEN管道对基因组数据进行变异调用。其中两家公司计划公开分享其汇总统计分析,包括全基因组关联结果。此外,作为投资回报,这些公司还获得了9个月的新数据独家使用权。此前,各合作方已于2023年2月开始使用WGS数据进行研究。目前,这些数据可供全球经批准的研究人员使用。

据悉,GSK公司正在利用WGS数据确定新的治疗靶点。该公司发言人表示:“药物开发的一个主要挑战是,很大一部分明显有希望的药物设计最终不能成功地使患者受益。有了这些基因、生物学和临床数据的信息,我们可以集中精力开发最成功的治疗方法,更快地为患者提供更有效的药物。”
她补充道:“UKB数据的一个真正优势是将WGS数据、详细的健康记录和‘包括血液蛋白质组学在内的丰富的深层生物数据’相结合。这帮助我们预测了服用一种新药的后果,有助于及早识别患者对该药物的反应是否符合预期,并识别出哪些患者最有可能从一种特定的治疗中获益。”

强生公司负责创新药物研发的执行副总裁John Reed博士认为:“基于该数据集的发现可以为更有效的临床开发铺平道路,并推动精准医疗的发展。这个具有里程碑意义的数据集将使我们能够利用人工智能和机器学习快速识别新的疾病靶标,并帮助研究人员根据基因预测候选药物如何影响某些患者亚群。”

在更广泛的研究领域,WGS数据可以帮助人们理解疾病的生物学基础,有望带来更有针对性的药物发现以及精准药物的开发。目前,全球已有3万名研究人员注册使用UKB数据库。

那么如何访问UKB的数据库?

首先,研究人员将需要提交一份申请,以表明其研究兴趣,UKB将审查申请人的科学可信度。作为申请过程的一部分,研究机构还需要与UKB签署合同,同意数据使用和安全的条款和条件。一旦获得访问权,任何与UKB数据集相关的研究发现都有望被公开。此外,研究人员有义务向UKB提供年度报告,表明目前对这些数据研究的努力以及所发表的任何文章。值得注意的是,在项目结束时,用户必须删除这些数据。

Collins表示:“我们并不限制研究人员的工作方式或处理数据的方式,但我们确实希望得到保证数据将出于公共利益用于与健康相关的研究。”

UKB数据使用如何收费?

UKB目前向研究人员收取分级访问费。获得所有数据集,包括WGS数据,三年的费用约为9000英镑。同时,为了促进平等获取,该机构获得了捐款,以减少或免除早期专业研究人员或来自中低收入国家研究人员的费用。

Wellcome信托基金首席研究计划官Cheryl Moore表示:“从基因组测序到创新和安全的数据存储,这一丰富数据集的发布标志着科学研究中一个重大而令人印象深刻的时刻。这对于理解我们的基因、环境和健康之间的相互作用来说是真正令人大开眼界的领域。Wellcome的资金支持了一个新的定制数据平台,该平台将为获得批准的研究人员提供分析大量数据所需的工具。至关重要的是,这为早期专业研究人员和中低收入国家的研究人员带来了令人兴奋的机会,又提供了巨大的潜力来发掘新发现,并增强我们对健康的理解,以改善世界各地的生活。”

除了基因数据外,UKB还一直在收集有关参与者的生活方式、全身成像扫描、健康信息以及血液蛋白标记物的数据。例如,UKB正在进行10万名参与者的磁共振成像研究,以建立纵向成像数据集,该工作由英国医学研究委员会、Calico公司和陈-扎克伯格倡议资助。UKB同时希望继续扩大蛋白质组学数据分析,以覆盖所有50万名参与者。此外,表观遗传学也是该机构另一个正在考虑的领域。
与此同时,UKB与世界各地的大型人口研究“正在进行对话”,比如美国的“All of Us”项目,以促进跨队列分析和数据访问的方式。目前,这方面的努力仍受到后勤方面的限制,特别是涉及到跨境移动数据时。
Collins认为:“对于从事健康研究的科学家来说,这是一个名副其实的宝库,我希望它能为全球的诊断、治疗和治愈带来变革性的发展。但UKB显然并不是所有问题的答案,我们确实需要解决如何对不同人群中的大队列数据进行综合分析的技术问题。”

安进公司研发部执行副总裁David Rees博士表示:“这个开创性的数据集使科学家能够比以往任何时候都更密切地探索基因如何影响蛋白质、代谢物和其他生理因素的水平,有望加速我们对疾病遗传基础的理解。”

UKRI首席执行官Dame Ottoline Leyser教授指出:“研究人员现在可以申请访问来自50万参与者的去识别全基因组数据,以及来自志愿者的医学、生化、生活方式和环境数据的丰富组合。这标志着UKRI在实现遗传学在生物医学研究、创新和临床转化方面的潜力的一个重要里程碑。”

参考资料:
1.https://www.ukbiobank.ac.uk/learn-more-about-uk-biobank/news/world-s-largest-genetic-project-opens-the-door-to-new-era-for-treatments-and-cures-uk-biobank-s-major-milestone
2.https://www.insideprecisionmedicine.com/topics/translational-research/ground-breaking-release-of-worlds-largest-whole-genome-resource/?_ga=2.87298648.1779125913.1701667826-849232800.1681975868
3.https://www.genomeweb.com/sequencing/uk-biobank-releases-whole-genome-sequencing-data-all-500k-participants
(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

关键词:,

热评文章