2018第一个工作日,打起精神哟 :)

来源:Towards Data Science

编译:Kathy

越来越多的研究人员将深度学习应用到了特定领域的医疗诊断,而且常常会获得比医生更为优秀的结果。其中的大部分项目主要集中与医学影像的识别和检测,那么我们就一起来看看深度学习在医学图像诊断中进行了哪些努力呢?

目前深度学习对于医学图像的处理,经过了大量的实验和临床测试后,科学家们已经归纳总结出机器学习处理医学问题的适用范围和具体方法。大体上来说:如果某些疾病的症状可以按照生理数据归纳分类时,就可以进行基于深度学习的诊断了。我们目前主要依靠临床医生的临床经验和感官判断来识别病症的存在,或者对疾病的类型做出诊断。

通常来说,如果某一疾病的诊断满足一下的标准,那么很大程度上意味着它可以通过深度学习来进行诊断。

分类:由于医学诊断领域的研究方法可以被归纳为一系列分类问题,例如是否患病的二分类问题和患病种类的多分类问题。给出一些数据,诊断过程可以被归结为把这个数据和N种不同的输出进行对比。在一些病例中,N=2,要做的任务只是鉴定数据(例如,X光、核磁共振或者切片图样的结果)是否有病症。同时还可以利用图像分割等深度学习的方法来实现患病区域突出和显示等辅助诊断手段。

生理数据:基于深度学习的诊断方法倾向于利用医学影像数据或者来自于其他传感器的数据。近年来这些领域的成果呈爆炸性增长在很大程度上是归因于大规模数据集的创建,这些数据集远比以往可以获得的数据要庞大的多。而大量准确的标注才是赋予数据集真正价值的地方。通常对数据集的标注方式(例如,标注x光的结果是否有肿瘤)是让一组临床医生对看到了影响活着其他数据结果进行判断并标记下每一组数据对应的结果。

诊断依赖基于特定视觉识别模式:自动化诊断系统代替的是让专家和临床医生查看数据(可能与一些专家讨论)来判断患者的病情。深度学习之所以可以在这方面取得成功的原因在于它可以通过识别出隐含在这种“非结构化”数据中的模式以及模式之间的相对关系来判断病情诊断疾病,从而使诊断过程自动化。相似的技术在非医学领域(例如,面部识别)的运用中已经相当成熟,人们可以直接在这些工具与的基础上构建出高效准确的医学AI。实际上,利用医学影像进行识别的深度学习模型现在已经拥有很多的开源资源了。

目前应用于医学领域的AI主要有以上三个方面的特点。这也意味着未来随着数据和诊断模式的程序化,还会有很多疾病的诊断方式将会被AI介入。但任何技术都有其存在适用的范围内,在考察了AI用于医学检测的技术之后我们同时找出了不适合于AI解决的方面。这种诊断模式意味着这类方法在一些疾病诊断中不起作用。而且,深度学习不会告诉我们病人要怎么治疗以及接受治疗时进展如何。其局限性体现在以下几点:

非分类问题:如果我们对疾病了解的不透彻,我们无法创建数据训练任何算法。例如,有的疾病的病情发展还没有被完全弄明白,其病情发展还不能被归类为一系列的阶段。对于这些疾病,我们无法利用二分类或者多分类的数学手段建立可靠的模型,告诉我们病人的病情发展到哪个阶段,或者到底是什么疾病。因为医生自己也不知道这个阶段是什么。

缺少数据:深度学习是数据驱动的研究方法,如果数据很少或者没有数据,就不能训练模型。但目前研究人员们正致力于改进这一方法——已有深度学习实验展示了利用非常小的数据集进行有效的学习。另外一种情况是可以收集到数据,但是数据和(或者)数据模式是主观的无法量化的感受型数据(如,疼痛和压力的瞬间体验),深度学习的方法就不适用于这类疾病进行诊断。

无法通过医疗设备采集大量的有效数据:同样还是数据的问题,有些数据不能够从医疗器械中获取,或者不能够从医疗设备中获取单一的样品数据(例如,需要长期追踪的病情并利用排除诊断法获得的数据)。这是因为(a)我们没有开发出好的方法来检查病情(这需要更多基础的科研工作的投入);或者(2)我们没有开发出合适的产品,可以用来长期非入侵式的监测病情收集可用于机器学习的数据.

在研究了深度学习应用于医学的适用条件之后,我们便可以展开研究了。如果某一病症能够满足先前提出的这一系列标准,即意味着它可以利用深度学习来进行诊断了。

接下来我们选取了一些目前利用深度学习诊断取得良好结果的疾病,他们大多都发布了自己的数据集或者有相应的科研成果发表,同时也来自于科研机构的研究进展报道和博客,让我们一起来感受一下深度学习在医疗诊断领域所取得的杰出成绩,那些疾病已经可以通过AI进行准确快速的诊断了。

阿尔兹海默症

阿尔兹海默是长期性神经退行性疾病,症状出现缓慢,随着时间推移逐渐恶化。伦敦的科研工作者发表文章报道了利用ADNI(阿尔兹海默神经影像学倡议联盟)数据来训练的算法,研究人员构建了具有一层卷积的三层神经网络,它可以根据核磁共振扫描的大脑数据,诊断大脑是健康的,有轻度认真障碍,还是患有阿尔兹海默症。

心率不齐

心率不齐是一类心跳不规则的疾病。斯坦福的研究人员发表了文章,报道了他们开发的一种34层的卷积神经网络,利用单导联可穿戴式监护仪记录的心电图数据,来诊断各种心律失调。该算法表现出色,超过了经过认证的心脏病专家。

自闭症

自闭症是一种神经发育障碍疾病,特征为社交互动障碍。一个科研小组报道了一个深度学习算法,该算法通过对自闭症高风险家庭儿童6个月和12月时的核磁共振大脑皮层表面信息进行分析,预测了24个月时的自闭症发生状况。

乳腺癌

乳腺癌是乳腺组织的癌症。DeepMind Health 发表了一篇博文宣布,他们与英国癌症研究会合作,将机器学习用于分析来自于7500名女性的不具名乳房X光图像。

蛀牙

蛀牙是由于细菌分泌酸性物质造成的牙齿损伤。ParalleIDots的研究人员发文报道了一种100+层级的卷积神经网络,对牙齿X光片(有龋齿和没有龋齿的)进行像素级二进制分类。

糖尿病性视网膜病变

这是由糖尿病引发的视网膜损伤。两年多前,在kaggle竞赛(Kaggle是一个数据分析的竞赛平台)的一个比赛项目中,要求对眼底的图像进行识别,并归到五种类别之一(无糖尿病性视网膜病变,轻度,中度,严重,血管增生)。获胜者的方案是将稀疏卷积网络和随机森林结合起来,对一双眼睛的图像(左眼和右眼)进行预测。

肺癌

肺癌是肺组织细胞不受控增殖形成的恶性肿瘤。2017年的kaggle竞赛,有个参赛题目是根据一年内诊断为癌症的人的胸部CT图像来进行预测肺癌。这个比赛有一些很有意思的挑战,例如提供的扫描数据是3D形式的。获胜者的解决方案也很有趣。从临床医生的角度来看,这个比赛有一些局限性。另外, Enlitic(Enlitic成立于2014年1月,是一家致力于运用人工智能及机器学习等前沿技术来辅助医疗诊断的科技公司)也在研究肺癌筛查解决方案。

肺炎

肺炎是肺部的一种炎症性疾病,主要受到影响的是肺泡。斯坦福的研究者发表文章报道了一种121层的卷积神经网络,它可以根据胸部X光图片检测肺炎,而且其表现超过执业放射科医生。

相信随着深度学习的发展和应用范围的扩大,新的一年里可以利用机器学习进行诊断的疾病会变得越来越多,AI也将造福越来越多的人。