独乐乐不如众乐乐,今天您分享了吗?
欣姐碎碎念
大家好,欢迎关注欣姐医话人工智能专栏——欣姐和外援雷哥继续为大家挖掘人工智能在对抗新冠方面的应用。第一期,我们介绍了通过知识图谱技术,人工智能为我们找到了一个可能对抗新冠的候选药物。本期,我们来看看人工智能是如何帮助医生筛选疑似病人的吧!
02
CT读片太费力?人工智能可代替!
核心问题:据不完全估计,核酸检测的假阴率可能在30%-50%之间,由试剂质量、操作流程、取样处病毒浓度等多方面因素决定。临床上比较普遍的方式是多次取样降低假阴。不过,在新冠最初爆发的武汉,肺部CT也被引入作为辅助确诊工具。CT的优势在于可以及时发现肺部病变,防漏诊,但缺点是缺乏特异性(不易区分新冠肺炎和其他肺炎),成本高,扫描和读片耗时长。为了提高读片效率,放射科医生请来了人工智能帮帮忙。
2015年初,时年只有27岁的陈宽,放弃了芝加哥大学的博士学位,回到北京创办推想科技。彼时,健康中国云服务计划刚刚被提出,BAT巨头都跃跃欲试。陈宽凭借深入调研和敏锐的洞察力,发现了医学影像这一市场痛点。当年,中国医学影像的年增长率在30%,但放射科医师的增长率不及4%,这意味着读片压力巨大,很多放射科医师每周需要工作80小时以上。陈宽意识到,读片是人工智能可以起重要作用的领域。
成立四年多,推想科技快速发展,目前已有AI-DR和AI-CT两款主打产品,分别用于X光拍片和CT扫描的辅助诊断。此次新冠疫情中,推想科技与南开大学合作,在全国40多家医院部署了新冠肺炎快速诊断、程度评估、病程动态监测等工作。累计筛查8万余病例,协助医生确诊新冠肺炎6000余例,敏感度(正确确诊率)98.3%,特异度(正确排除率)81.7%。一个300张CT影像的病例,人工读图需要15-30分钟,而AI-CT只需10秒左右。
除了在国内的成功,推想科技也得到了世界其他国家的关注,海外疫情爆发后,包括美国托马斯杰斐逊医院,德国耶拿医院,日本横滨医院,及意大利几家医院都安装了推想AI产品协助读片。在大环境不友好的情况下,各国媒体却纷纷对推想科技做出了正面评价,甚至一向强硬的CNN也邀请了陈宽本人连线采访。推想科技此次引起关注,可谓为中国医疗AI企业打响了出海的第一炮。
那么,独树一帜的推想科技,采用的是什么技术来实现CT辅助读片的呢?答案就是卷积神经网络(Convolutional Neural Network)。这个技术有点复杂,欣姐尽量由浅入深来解释。
首先,我们先了解一下更基本的神经网络计算机领域的神经网络,是以模拟人脑的神经网络来实现人工智能的机器学习技术生理上,人脑的神经网络非常复杂,成人的大脑拥有1000亿个神经元,星罗棋布,大概像下面这个样子。
现代计算机的运算能力飞速扩张,但跟人的大脑还有很大差距。为方便理解,计算领域的神经网络可以简化成下图的模式:
输入层(向量、矩阵)经过一些加权函数操作,通过隐藏层传递,得到输出层。
神经网络算法的实质,是通过迭代来寻找传递函数的形式和参数
。两层神经网络虽然是
线性运算
,但可以非常好的
模拟非线性问题
,得到了广泛的运用。但随着计算科学尤其是数据量的增大,上面这种基本的两层神经网络,已经不能满足一些复杂问题的需求,因而产生了
多层神经网络,也就是深度学习
的概念。

原则上说,层数越多,越能精确模拟真实世界的复杂问题,但相应的运算量会几何增长。尤其是
涉及到图像的问题时,运算量太大而变得不切实际
。于是,从多层神经网络中,延伸出了
卷积神经网路算法,特别适合处理图像问题。
接下来的部分可能更难理解一些,为了帮助完全不熟悉的朋友,我们把问题逐个分开:
01
为什么图像问题更复杂?
在上面的神经网络示意图中,输入层只是三个点。但实际上,每一幅图像都是矩阵。比如下图,三只可爱的狗狗,计算机看来就是一串毫无情感的数据矩阵,其中每个点称为一个像素。对于彩色图像,每个像素又由RGB(红绿蓝)三个参数共同构成的。所以,一幅1000x1000像素的彩色图像,对计算的要求就是1000x1000x3=3M数据。
02
什么是卷积?
以下动画显示了卷积的过程。直观的看,就是用一个小模版(黄色)跟大矩阵,也就是待处理图片(绿色)的各部分依次进行比对,运算结果送入到新的粉色矩阵中。粉色矩阵中数字越大,说明待处理图片中对应的那个部分,跟小模版的形状越相似。利用不同形状的小模版去做多次运算,我们可以提取出待处理图片中具有代表性的特征。
换一种方式讲:想象您有各种形状的小物品,可以是一个勾,一个叉,或一个圆圈,每个小物品的尺寸都比待处理图片小很多。把一个小物品拿到待处理图片的附近,从上到下,从左到右的移动,每次移动一个像素。在这个过程中,记录待处理图片中当前的区域,和小物品的相似度。如果相似记录1,不相似记录0。用不同的小物品去重复这个过程,直到把待处理图片的各种特征都找出来。这就是卷积神经网络寻找图片特征的基本原理。
03
无监督学习和有监督学习
在推想科技的例子里,人工智能起初并不知道什么样的CT图像有肺炎的特征,这就需要训练它。训练的方法,是选取大量医生鉴定过的有肺炎特征的图片,利用上述卷积神经网络的原理,提取并记录肺炎的影像特征,比如斑片状病变,磨玻璃样病变等。这个过程算法在没有辅助的情况下提取特征,是无监督学习
当人工智能找到病变的影像特征后,就可以把这些特征作为标签,与新的肺部CT图像作对比。如果新图像出现了类似的病变特征,人工智能就可以判断,病人可能感染了肺炎,并及时对医生做出提示。这个过程算法在已经提取的特征辅助下进行对比预测,是有监督学习
04
下采样
卷积神经网络中还有一步比较重要的下采样过程。前面说过,处理图片的计算量非常大,下采样的主要作用就是对图片进行降维,减小计算量,同时保证结果的准确率。此外,值得一提的是,肺部CT图像是三维而非二维(上面的例子均为二维),计算量更大算法也更复杂。
卷积神经网络的全过程概括如下:
总结:卷积神经网络是多层神经网络(深度学习)的一种变化形式,特别适用于处理高维图像。推想科技利用这项技术,帮助放射科医生快速筛选肺部CT图像,发现病变,成为临床诊断新冠肺炎的一项利器。该技术的敏感度和特异性分别达到98.3%和81.7%,不仅在中国对抗新冠病毒的战疫中做出了贡献,也得到了世界上多个国家的肯定。除了推想科技,还有很多其他公司也在进行人工智能读各类医学影像的创新性工作,比如IBM Watson,Butterfly Network,深睿医疗等等。相信未来的人工智能必定是医生临床诊断的好帮手。
【对抗新冠新利器】人工智能来啦(一)
【展望】疫情过后,医疗行业会有什么变化(三)
【展望】疫情过后,医疗行业会有什么变化(二)
【展望】疫情过后,医疗行业会有什么变化(一)
欣姐原是工科出身的PhD一枚,误打误撞进入了医疗行业,从此发现了新的人生意义。海漂十余年,曾游学于欧洲大陆几十个国家,近年定居于美利坚博士屯。混过医疗仪器,生物制药,现栖身于数字医疗领域,闲暇时顺便在查尔斯河畔的某不知名小学校修读医疗管理MBA。
有收获的话就点下“在看/WOW”呗
继续阅读
阅读原文