科技对抗瘟疫10讲 2020 / 2 / 15

与时间赛跑!AI是疾病基因分析和诊断的加速器

文/任新勃
最快速的了解新的病毒带来的病例成因早日实现对症下药,成为打赢“抗疫”的关键。今天AI等新技术在积极发挥着作用。

在科技领域,跨界、融合带来的新生事物具备的颠覆性竞争,而只是技术和经济层面的竞争。

而在病毒领域,跨界、融合产生的新病毒往往意味着灾难。一个天上飞的鸟落下的粪便不小心与地上某个禽类的食物结合被这个禽类所食,那么其上可能带来的病毒与禽类体内病毒进行杂交进化一个新的病毒。而这个病毒获得跨界传播的能力,将对整个人类造成大的灾难。最快速的了解新的病毒带来的病例成因早日实现对症下药,成为打赢“抗疫”的关键。今天AI等新技术在积极发挥着作用。

目前新型冠状病毒疫情进入了攻坚战阶段。除了一线医务人员前赴后继的战斗之外,对于新冠病毒的疫苗研发和药物筛中也在争分夺秒的进行中。此次“抗疫”战争中,AI等科技技术在默默贡献中。关注抗击疫情中的科技公司的动向,就会发现包括阿里云、华为云、中科曙光、腾讯云、上海超算中心等积极主动并免费提供超算能力,AI算法来助力开展抗新冠病毒的疫苗研发和药物筛选中。

要最快解决此次新型冠状病毒疫情,目前来看除了全国动员在家“闷”死病毒之外,对于从早期对病毒基因组的数据分析及AI建模到如何对疑似患者的快速、精准临床诊断,以及抗新冠病毒的疫苗研发和药物筛选中也需要和时间赛跑。在其中AI正在发挥其作用。

AI技术能够加速“疫情”中数据分析

AI作为一种工具,有三要素在支撑,算力、算法和数据。基于三个特点,目前AI等科技公司都是提供具备高性能、高可靠性、高性价比的计算、存储、分析和AI能力支持的,能够让科研过程固化可执行,提高效率的工具。

而让AI在疾病基因的分析和诊断中发挥。首先要依靠医学界的专家发现病毒。就像上海华山医院张文宏就谈到医疗专家要“要非常准确的知道现在搜索的病毒是什么,才能相应的病毒做相应的抗病毒治疗。”

我们应让人工智能与病理学家形成互补,提高人工诊断的效率与可靠度。依靠科技手段 “面对未知的病毒的时候,通过把其基因序列全部打碎,通过深度测序的平台,把所有的序列全部恢复,然后通大数据开始拼接,通过组装序列,经过大数据分析,分析出其演化关系,通过数据库记录分析获得遗传标志,来最终告诉你这是什么病毒。” 张文宏站在医生的角度言简意赅的阐述了AI的作用。

比如针对此次新冠病毒,AI等新技术的应用一个核心的作用就是让医学专家们不用把大量的时间放在海量的数据分析上,而是能够将自己的时间、精力以及医学经验投入到应对传染病风险之上。把数据分析、重复的信息的收集等任务,交给AI来处理。

目前集成了AI功能的基因组测序平台能够提供从基因组数据管理、生物信息分析流程、科研分析管理到知识图谱整个流程的服务,快速实现基因组数据分析及AI建模,让基因组分析更便捷。

比如将深度学习算法及药物分析服务融入药物研发过程,令药企能更快速高效地完成药物研发,节约研发成本,让研发更快速。

具备医疗影像标注、影像分析服务及AI模型预测服务,全方位满足医疗影像研发需求,让影像分析更方便。很大程度上帮助了医生提高阅片效率、减少漏诊误诊的情况。一个医生可能一天看一百个病人,一个月看了两千个病人,一年可能看几万个病人,他通过这样的方式去累计经验。一个15年经验的医生,和一个刚出来做3个月的医生,他们两个的经验不同,在对一些影像图片上面的判断就不是一样的级别。

深度学习会提取图像特征。然后影像专家先把上面做一个标注,等到标注有更大的样本的时候,就可以做到辅助医学诊断。比如通过AI对疑似患者肺部CT影像进行病灶的自动检出、定位、弥漫性程度的多维分析并生成自动报告,帮助医护人员快速筛查疑似新冠病例并进行隔离与进一步确诊,从而减少交叉感染的风险,同时产品的随访功能还可帮助医生对患者的治疗效果进行精准量化评估,用AI为一线医务工作者提供有迹可循、有据可依的智能辅助。

联合科研成为AI技术应用在疾病领域的主要形式

在整个“抗疫”过程中,包括分离毒株、药物筛选、意思病例检测、新药研发等需要基于AI技术进行大量的数据分析。目前科技公司在病毒基因组计算分析、抗病毒药物研发和抗疫医疗影像分析领域,将提供海量AI算力和算法的强有力支持。这就需要具有强大的CPU及GPU算力调度能力,能够为基因测序、医疗工程提供稳定高效的算力支持的平台。

最近关于“抗疫”的战役中,我们看到科技公司联合医疗机构、科研机构成为最高效的一种模式。比如华中科技大学同济医学院基础医学院、华中科技大学同济医学院附属武汉儿童医院、西安交通大学第一附属医院、中科院北京基因组研究所、华为云联合科研团队宣布,筛选出五种可能对2019新型冠状病毒(2019-nCoV)有效的抗病毒药物。

其中华为云EI医疗智能体平台(EIHealth)集成了医药领域众多算法、工具、AI模型和自动化流水线提供大规模计算机辅助。

在几位教授的指导下,针对数十个靶向蛋白和上亿小分子化合物,通过医疗智能体平台完成了蛋白质同源模建,分子动力学模拟计算,和大规模虚拟药物筛选,短时间内完成了上千万次的模拟计算,让以往耗时数月的计算机辅助药物筛选在数小时内完成。

比如在新冠肺炎疫情上,疑似患者的快速、精准临床诊断仍是挑战。2月1日,由浙江省疾控中心、阿里达摩院和杰毅生物联合研发上线的自动化全基因组检测分析平台,让原来数小时的疑似病例基因分析缩短至半小时。重点在“全基因组”这几个字,全基因组以为着海量的基因数据,需要对平台的算力、AI算法、数据处理和分更高的要求。阿里达摩院创新的采用分布式设计的分析算法,并基于蛋白质数据库(PDB)等公共数据集的数据进行算法的优化训练。这样的AI突破,对于有效提升疑似病例确诊效率,及时阻断病毒的传播,必然会有极大助益。

我们也看到为助力研究机构加速新药筛查和疫苗研发,腾讯云组建了应急工作小组,免费开放云超算等能力。目前,已向中山大学药学院罗海彬教授团队提供了批量GPU云服务器免费使用权,帮助该团队推进病毒药物的筛选工作;向北京生命科学研究所/清华大学生物医学交叉研究院的黄牛教授实验室提供了大量标准的CPU算力以及对象储存能力,帮助他们进行基于结构的药物分子设计的离线计算任务。

与此同时,基于新型冠状病毒靶标结构的化合物虚拟筛选工作正在北京生命科学研究所/清华大学生物医学交叉研究院黄牛教授实验室推进。从原理上讲,药物通过与体内的生物靶标相互作用而发挥药效,若能够根据药物靶标结构来计算筛选和设计小分子配体,将可大大降低创新药前期研发的成本与周期。针对新型冠状病毒的多个靶点,黄牛教授实验室通过腾讯云秒级交付的海量高性能计算、存储资源,快速计算筛选数亿级别的化合物数据库,结合实验验证,来寻找新型结构类型的先导化合物,为下一步新药研发工作提供依据。

总结,AI对于基因组的分析和诊断,有几个关键点。首先数据库的检索功能,在获取到病毒基因信息后,通常需要与已知数据库的基因组匹配来找出可能存在的突变。而突变与疾病的对应关系的判断大部分依靠海量的数据库资源,因此如果人工来完成这些工作是不现实的,这个时候便体现出了人工智能的价值。

其次算法的优化,我们看到包括华为云、阿里达摩院都是采用了最新的AI算法和分布式数据库,来优化人工智能的技术路径,能够更有效的对大量非结构化数据进行学习和整合,挖掘并计算其中的关联。缩短人工智能可以持续不断的挖掘并更新突变位点和疾病的潜在联系。

再次海量的数据喂养,与在Google AI实践中曾有关于诊断乳腺癌的人工智能的报道。它只需几秒钟,就能取得比人类医生花上几十个小时还要准确的诊断。在基于医学图像的诊断上,结合人工智能的效率可以说是大大增加了癌病的诊断。这需要基于大量患者的成百上千张医疗影像,基于深度学习算法的训练。经历了大量迭代训练后,实现算法的精准度越来越高,实现在疾病分析丰富临床经验的专家的诊断结果与AI工具的诊断结果是否一致来判断AI分析的价值。

除此之外,业内专家对至顶网表示目前基于“深度学习”的AI技术要发挥作用,一个好的云数据库其实是非常关键的一个点,因为如果医院里面每个科室的数字是零散的,那么很难做这个工作。基于云数据库,不管是从公有云还是从私有云,帮助医院把这些数据规范起来。从数据的采集,到它的存储,到预处理,形成一套规范的AI服务。这样的话,数据即使在有些单位是分散的,需要的时候还是可以复合起来使用。

同时在深度学习的技术上面,对这些数据做训练的时候,不仅仅是把数据丢到深度学习里面去训练就好了,而且我们还要对这些数据做一些特征提取。我们把数据的维度降低了以后,再去训练就可以得到一个相对比较好的效果。当然,这个数据积累以后,越来越多的数据积累以后,准确率会越来越高。

最后,医疗过程是一个复杂,周期长的过程,AI辅助只是其中一个环节,我们希望能够通过AI等科技技术帮助到医药领域的专家,加速疾病基因检测和相关药物研发过程。

本文章选自《数字化转型方略》杂志,阅读更多杂志内容,请扫描下方二维码

《数字化转型方略》杂志