资讯

首页 - 全部文章 - 资讯 - 精华回顾丨“云计算推动精准医学全球协同创新”线下沙龙成功举办

精华回顾丨“云计算推动精准医学全球协同创新”线下沙龙成功举办

随着以高通量测序为代表的实验技术的迅猛发展,海量数据的产生,生命科学及医疗健康行业的发展迎来了全新的发展机遇。但与此同时,如何存储、分析、挖掘和共享海量数据,如何整合不同维度的数据产生新的见解并应用于现实生活,为我们提出了新的挑战。云计算和人工智能凭借其在处理大规模数据中的优势,成为应对这些挑战的关键,并为领域内的企业实现数字化转型、实现全球化运营提供了有力的工具。

2023年3月18日,由亚马逊云科技与测序中国联合举办的“云计算推动精准医学全球协同创新”线下沙龙,邀请到亚马逊云科技公共事业部解决方案架构师张强,亚马逊云科技基因生命科学行业解决方案架构师方康,费城儿童医院朱元坤,百奥智汇高级技术支持李晓敏带来精彩报告分享;并邀请中科院计算所副研究员卜德超,亚马逊云科技基因生命科学行业总监余昶,吉因加副总裁李清林,聚道科技CEO李厦戎,百世诺首席医学官侯青等嘉宾围绕“精准医疗和大数据——通过全球合作促进医疗改变”进行了深入的讨论。

Amazon Omics推动精准医学全球协同创新

张强 

亚马逊云科技公共事业部 

解决方案架构师

张强先生指出,亚马逊云科技致力为中国本地企业打造全球化发展的技术桥梁。通过Amazon Omics加速出海业务落地,将多组学数据转化为见解。张强先生提出,基因组和生物数据有着极高的价值,但其规模复杂且管理成本高昂。Amazon Omics针对组学分析场景定制,可以用于基因组学、转录组学和其他组学数据的存储、查询和分析。张强先生介绍了Amazon Omics的工作原理及其特点,包括多组学和多模态分析、大规模分析与扩展、完全托管的生物信息学计算平台、内置安全、隐私和法规遵从性在医疗健康AI服务领域,除了Amazon Omics,亚马逊云科技还提供Amazon HealthLake、Amazon Comprehend Medical和Amazon Transcribe Medical等一系列平台和工具,助力数据的存储、共享和分析,自然语言处理等。张强先生介绍了Amazon Omics定价与免费套餐的情况,帮助用户快速、便捷地上手使用。

基于Amazon Neptune和Open Data实现多组学数据云上创新

方康 

亚马逊云科技基因生命科学行业 

解决方案架构师

方康先生提出,基因组学的应用已经扩展到医疗和生命科学的各个领域,包括学术研究、临床基因组学、新药研发、农业育种,私人公司等,而访问大规模数据集对基因组科学至关重要。Amazon能够在5个关键领域为基因组学客户提供支持,包括数据传输和存储、二级分析自动化、数据聚合和管理、解读&深度学习,以及安全。随后,方康先生分享了一些应用案例,包括基于Amazon Athena构建多模态群体,例如以TCGA和TCIA数据库为数据源,实现基因组数据和影像数据的整合分析;利用Amazon Neptune构建多组学知识图谱,通过多维度数据的聚合,能够赋能生命科学全生命周期,涵盖基因组学、药物发现、生产制造、医患画像、(药物)精准营销等。方康先生分享了通过Neptune服务实现了在基因-代谢物图谱上的复杂查询和基因种类预测的案例,体现了人工智能及大数据赋能合成生物学研究的能力。

全球儿童脑癌联盟科研及精准医疗的亚马逊云科技应用

朱元坤 教授 

费城儿童医院

全球儿童脑癌联盟(CBTN)致力于联合全球研究人员、医生、患者和基金为脑癌的研究和治疗提供帮助。通过联盟成员之间的合作,积累了大量的生物样本和数据,支撑了85余个生物样本驱动的研究和140余个数据驱动的研究。朱元坤教授指出,费城儿童医院的D3b中心目前已经积累了30500个参与者和28000个家系,并尝试用数据来驱动儿童疾病和出生缺陷的研究和治疗。随着时间的推移,数据量越来越大,数据种类愈发丰富,对数据传输、数据模型和访问控制管理提出了越来越高的要求。朱元坤教授介绍,CBTN基于GDC(Genomic Data Commons) Data Dictionary作为测序数据模型,电子健康数据传输的国际标准HL7以及电子医疗记录传输API标准的FHIR搭建了临床数据的模型,通过GEN3数据访问标准,将数据部署在Amazon S3上,助力临床科研。CAVATICA是一个与Seven Bridges Genomics合作开发的云计算平台,基于亚马逊云服务搭建,能够帮助研究者高效地分析多组学数据,支撑各类临床研究与临床应用,朱元坤教授对此进行了详细的介绍。目前CAVATICA的用户可以在一周内完成500个全基因组分析或1200以上的RNA-seq分析,并能生成分子诊断报告。朱元坤教授分享了Multi-Cloud方案(“将计算带给数据”),影像数据处理中亚马逊云计算方案的应用,这些方案最终帮助医生为患者提供更高质量的精准医疗服务,改善患者的生活。

单细胞及空间多组学赋能精准医疗

李晓敏 

百奥智汇 高级技术支持

单细胞及空间多组学在生命科学研究中有着广泛的应用,但同时也存在着一些挑战:测序数据量大、分析周期长、对生物信息学能力要求高。李晓敏女士对百奥智汇的一站式单细胞测序实验、数据分析与挖掘服务进行了细致深入的介绍。在测序实验方面,针对不同类型的样本(新鲜样本、FFPE样本)都能够提供包括单细胞转录组、空间转录组、蛋白质检测及DNA检测在内的精准检测;在数据分析方面,百奥智汇推出了单细胞数据分析软件OmniAnalyzer Pro,实现单细胞多组学数据分析,并具备批次效应校正、多样本比较分析等特色功能;单细胞大数据挖掘&分析平台OmniBrowser收录了1880项单细胞前沿研究,3729个数据集,有力支撑单细胞相关研究的开展。李晓敏女士最后介绍了单细胞大数据在靶点毒性评估、药物适应症拓展、多数据集整合挖掘乳腺癌数据等方向的应用案例。

圆桌讨论:精准医疗和大数据——通过全球合作促进医疗改变

在方康先生的主持下,参与圆桌讨论的五位嘉宾就下方话题进行了深入的讨论。

话题一:精准医疗在大数据方向如何实现个性化医疗进而为行业带来改变?

李厦戎:通过大规模基因测序及数据分析能够帮助医生进行早期的诊断和治疗,提升出生缺陷的防治及妇儿领域医疗健康服务能力。
余昶:借助AI和机器学习能够更好地找到变异与疾病之间的联系,从而提升疾病的诊疗。
卜德超:大数据的采集对于实现个性化、智能化医疗起着重要作用;通过算力的整合,从生物信息分析过渡到“学习”的模式,能够帮助我们更好地理解数据,理解生命现象。总而言之,数据+算力可能会是未来精准医学的关键。
侯青:大数据帮助我们真正地“理解一个人”,完成个体的精准画像。随着算力、数据量的门槛逐步突破,大数据将为整个领域带来一场思想的革命,极大地改变临床上疾病预防和治疗的方式。

李清林:单细胞测序及随时而来的巨大数据量会给疾病治疗方式带来巨大的改变;健康人器官损伤的数字化和相关研究将会成为一个重要的方向。

话题二:如何解决数据隐私问题以保障全球业务合作?

余昶:传统的同态加密、拆分隐私等方法可以为数据隐私保护提供帮助,此外联邦学习的方法能够帮助不同参与者在不用分享原始数据的前提下共同训练模型,保护数据的隐私。
李厦戎:将数据de-identified之后采用混合云的方案能够在一定程度上解决算力的问题。反过来思考“数据-信息-知识-医疗实践”的流程,先从医疗实践层面开展合作,进而一步步反推到知识层面,信息层面,数据层面。
卜德超:“把方法带给数据,而不是把数据带给方法”非常重要。未来可能会有很多大的数据中心,这些数据中心之间采用联邦学习的框架统筹起来,在保证数据安全的前提下实现有效的协作。
侯青:个人的基因组数据及对应的疾病风险信息,针对个体的精准画像如何在充分保障隐私的前提下应用到现实生活中,值得每位从业者深入思考。

李清林:在具体业务的落地中,数据本地化会给数据库更新、算法更新带来很多麻烦,AWS的云计算服务可能会为我们带来解决的方案。

话题三:机器学习和人工智能赋能下的精准医疗有哪些新方向?最近备受关注的ChatGPT能给我们带来哪些启发?

卜德超:ChatGPT这样的大模型对于算力的要求很高,在医疗健康领域,随着BT技术的不断发展,数据的积累与算力的提升,一定会诞生出ChatGPT这样的预训练大模型,通过对具体问题的反复学习,最终实现人工智能对精准医疗的赋能。
侯青:在个体化用药中,人工智能模型能够非常快速地找到基因组数据与用药安全之间的联系,相比于传统的大规模临床研究能够极大提升效率,加速药物基因组学的发展。
李清林:AI可能会在精准用药人群的获得和精准用药选择的问题上为我们提供高效的解决方案。传统的新药研发中,寻找合适的受试者需要花费大量的精力和成本,随着个人基因组的普及和大数据应用逐步打通,有望为新药研发开辟全新的路径,并改变疾病治疗的方式。
李厦戎:首先,借助通用大模型纳入人和其他更多物种的数据,有望为疾病的研究和治疗提供新的范式。其次,ChatGPT一个很重要的特征是它使用能够被人理解的方式去表达学到的知识,这一点为传统的医疗AI应用中“结果不可解释”的问题提供了全新的视角。
余昶:个体的数据有着非常丰富的维度,DNA、RNA、蛋白、表型等一系列数据,构成了一个复杂的网络,为大模型提供了很好的应用空间。此外,目前用于机器学习的数据大多数是DNA、RNA层面的数据,表型数据、药物分子数据、相互作用的数据并没有整合,这可能是未来大模型构建时需要关注的方向。

会议现场

(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章