△本期嘉宾:赵南博士
水母基因联合创始人兼CTO
2007年,我于美国密苏里-哥伦比亚大学攻读生物信息学博士学位,开始从事基于机器学习等计算技术的NGS数据分析建模研究。最早接触到二代测序数据是在位于密苏里大学的美国大豆国家实验室,针对大豆、玉米等农作物进行全基因组测序并建立大尺度基因型-表型数据相关性预测模型。
在当时,二代测序的各种技术平台还处于较早时期,BitTorrent、454、Solexa等测序平台处在测出Reads短、成本极高的阶段,生物信息分析工具也不成熟。记得第一次处理的Solexa下机数据,每个Read只有60bp,测序深度也只有10folds的pair-end全基因组。由于当时植物全基因组数据库的缺乏,光组装一项工作就用了一个月时间,并且耗费了大量的超算资源。
从那之后,随着二代测序的不断发展,我逐渐接触到了各种二代测序的应用,包括从转录、表达到功能分析的多组学研究,与多物种样本的分类进化研究等。近10年间,二代测序技术取得了突破性的进展,其应用领域也从纯粹的科研项目进入工业生产,我本人也投身到了消费者基因组产品领域。
NGS技术无疑造就了生物信息学科,将生物学研究带入了数据时代。从简单的序列比对到现在无处不在的各种机器学习算法的应用,分子级别数据的分析与最终研究结论的获得都无法脱离生物计算技术。
我作为一个工科计算背景的学生,有幸成为美国最早的生物信息学科博士生之一,亲身经历了传统数据技术从图像、信号处理等领域走向各种分子生物数据的建模分析的过程。从最早开始构建各种NGS平台产生的结果数据库和分析工具网站,到后来直接利用各种机器学习、数据挖掘模型得到大尺度的生物数据分析结果,我逐渐成为了一个计算生物领域的践行者。
在学术界的10年,从一个博士研究生到大学的助理教授,我也经历了整个NGS技术的发展和对生物信息领域革命性的影响。我在学术界最大的贡献在于引入NGS数据与结构生物学数据的整合分析,把一维的序列信息关联到了三维的大分子结构仿真与建模应用。
然而,整个生物信息学的产业应用与转化医学的结合长期处于发展缓慢的状况。精准医疗的落实、技术实现、产品化都处在概念阶段。尤其对于普通大众的个人基因组产品还处于早期阶段。
2015年,我和妻子在美国学习和工作的时间算起来已有九年,期间我们生育了双胞胎儿子,孩子们也已经上了幼儿园,一切似乎已尘埃落定,生活看起来亦不会有大的波澜。
一天,水母基因CEO王小康通过朋友联系我,探讨共同创业的可能,邀请我回国创业,而创业的方向,瞄准的正是消费级基因领域。接到他的电话,我的第一感受是兴奋,同时也有犹豫。兴奋的是,我近两年其实也在找寻创业机会,这无疑正中下怀;犹豫的是,这是一份来自大洋彼岸的邀约,如果决定干,那么我的家庭和生活将会迎来巨大的转变。
对我个人来说,这无疑是艰难的决定。随后,我与小康就各种问题多次沟通,更多的时候,我们围绕这件事情(创业)本身的价值进行了反复探讨与论证。2015年底,处理好美国的事务之后,我正式回国。
关于公司的名字,很多人会问这其中的含义,在公司创立之初其实颇费心思。水母基因的定位是消费级基因领域的互联网高科技公司,其面向的是大众消费人群,因此我们希望公司的名字亲切、好记且能给人留下深刻的印象,并与生命相关。我们最终确定了“水母基因”这一名称:其取自“灯塔水母”,“灯塔水母”是科学家目前发现的唯一能够从性成熟阶段回复到的幼虫阶段的生物,被称为“不死之躯”;而基因(DNA)是生命传递的遗传物质。
公司成立之初,我们在产品开发和市场推广上做了大胆的创新,短时间内积累了近万例样本。之后,大家逐渐认识到,基因检测想要在大众普及,一是其价值要能被人们熟悉并认可,二是产品本身能给人们带来实际价值。对于基因数据的价值,我们通常会联想到GPS及其应用,当GPS软件获取一个人的经度和纬度之后,如果没有服务商根据他的地理位置进行服务,如导航、送餐、滴滴打车等,那么这份数据的价值并没有被发挥。基因数据也是类似,比如,我们知道基因在疾病预防领域的价值被世界认可,那么基于它已知的价值,我们关心的是有多少服务商需要和能够使用这些数据,使其产生价值。
在这个思路指导之下,我们对公司产品方向及商业模式进行了战略调整,确定了两个目标:一是加紧速度研发出极具市场竞争力的有价值的产品,二是找寻服务商,将基因数据与他们的产品深度整合,共同为终端消费者提供具有创新性、科技感和实际应用价值的产品和服务。
确立目标后,我们与安诺优达建立了针对消费级个人基因组检测的战略合作关系,保障了公司在基因测序方面的基础优势。同时,大力投入力量,组建了由人工智能、大数据、生物工程、生物信息、医学、遗传咨询等方向的博士为核心的产品研发团队,以及来自一线互联网公司的IT开发团队和医疗行业经验丰富的销售团队。
凭借强大的团队,水母基因将基因检测与生物信息分析、大数据、人工智能技术融合,自主研发了精准健康管理SaaS服务系统,该系统能够整合用户的健康档案、临床数据、生物信息数据以及疾病数据,囊括了由遗传到后天的生物医学数据,从而形成完整的健康数据画像,为实现用户健康的精准评估提供数据基础。该系统为智能评估系统,通过整合海量的生物医学数据,进行数据挖掘和建模分析,可自动评估出疾病的患病风险值,进而智能化的推荐健康干预方案。2016年10月,“水母基因智能精准健康管理SaaS系统”被中国科学技术协会推荐为全国重点项目,亮相深圳“双创周”主会场,李克强总理实地参观考察,我们的项目也被新华社、腾讯网等多家权威媒体采访报道。
一年来,公司在样本的积累、业务的发展方面都取得了较大的突破和增长,这一方面得益于我们自身的努力,另一方面也有赖于基因检测市场的良好发展态势和行业内同行的共同努力。
我们相信,随着检测成本的不断降低和科研成果的不断发现,生物数据在大众生活场景中的转化应用将越来越多,随之而来的是,生物医学大数据的存储、分析、解读和咨询服务在未来将迎来大幅地增长。并且,在国家大的“健康中国”战略指导下,“治未病”观念将更深入人心,以基因检测为入口的疾病预防需求将日益增加。
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!