【对抗新冠新利器】人工智能来啦（二）

独乐乐不如众乐乐，今天您分享了吗？

欣姐碎碎念

大家好，欢迎关注欣姐医话人工智能专栏——欣姐和外援雷哥继续为大家挖掘人工智能在对抗新冠方面的应用。第一期，我们介绍了通过知识图谱技术，人工智能为我们找到了一个可能对抗新冠的候选药物。本期，我们来看看人工智能是如何帮助医生筛选疑似病人的吧！

CT读片太费力？人工智能可代替！

核心问题：据不完全估计，核酸检测的假阴率可能在30%-50%之间，由试剂质量、操作流程、取样处病毒浓度等多方面因素决定。临床上比较普遍的方式是多次取样降低假阴。不过，在新冠最初爆发的武汉，肺部CT也被引入作为辅助确诊工具。CT的优势在于可以及时发现肺部病变，防漏诊，但缺点是缺乏特异性（不易区分新冠肺炎和其他肺炎），成本高，扫描和读片耗时长。为了提高读片效率，放射科医生请来了人工智能帮帮忙。

2015年初，时年只有27岁的陈宽，放弃了芝加哥大学的博士学位，回到北京创办推想科技。彼时，健康中国云服务计划刚刚被提出，BAT巨头都跃跃欲试。陈宽凭借深入调研和敏锐的洞察力，发现了医学影像这一市场痛点。当年，中国医学影像的年增长率在30%，但放射科医师的增长率不及4%，这意味着读片压力巨大，很多放射科医师每周需要工作80小时以上。陈宽意识到，读片是人工智能可以起重要作用的领域。

成立四年多，推想科技快速发展，目前已有AI-DR和AI-CT两款主打产品，分别用于X光拍片和CT扫描的辅助诊断。此次新冠疫情中，推想科技与南开大学合作，在全国40多家医院部署了新冠肺炎快速诊断、程度评估、病程动态监测等工作。累计筛查8万余病例，协助医生确诊新冠肺炎6000余例，敏感度（正确确诊率）98.3%，特异度（正确排除率）81.7%。一个300张CT影像的病例，人工读图需要15-30分钟，而AI-CT只需10秒左右。

除了在国内的成功，推想科技也得到了世界其他国家的关注，海外疫情爆发后，包括美国托马斯杰斐逊医院，德国耶拿医院，日本横滨医院，及意大利几家医院都安装了推想AI产品协助读片。在大环境不友好的情况下，各国媒体却纷纷对推想科技做出了正面评价，甚至一向强硬的CNN也邀请了陈宽本人连线采访。推想科技此次引起关注，可谓为中国医疗AI企业打响了出海的第一炮。

那么，独树一帜的推想科技，采用的是什么技术来实现CT辅助读片的呢？答案就是卷积神经网络（Convolutional Neural Network）。这个技术有点复杂，欣姐尽量由浅入深来解释。

首先，我们先了解一下更基本的神经网络。计算机领域的神经网络，是以模拟人脑的神经网络来实现人工智能的机器学习技术。生理上，人脑的神经网络非常复杂，成人的大脑拥有1000亿个神经元，星罗棋布，大概像下面这个样子。

现代计算机的运算能力飞速扩张，但跟人的大脑还有很大差距。为方便理解，计算领域的神经网络可以简化成下图的模式：

输入层（向量、矩阵）经过一些加权函数操作，通过隐藏层传递，得到输出层。

神经网络算法的实质，是通过迭代来寻找传递函数的形式和参数

。两层神经网络虽然是

线性运算

，但可以非常好的

模拟非线性问题

，得到了广泛的运用。但随着计算科学尤其是数据量的增大，上面这种基本的两层神经网络，已经不能满足一些复杂问题的需求，因而产生了

多层神经网络，也就是深度学习

的概念。

原则上说，层数越多，越能精确模拟真实世界的复杂问题，但相应的运算量会几何增长。尤其是

涉及到图像的问题时，运算量太大而变得不切实际

。于是，从多层神经网络中，延伸出了

卷积神经网路算法，特别适合处理图像问题。

接下来的部分可能更难理解一些，为了帮助完全不熟悉的朋友，我们把问题逐个分开：

为什么图像问题更复杂？

在上面的神经网络示意图中，输入层只是三个点。但实际上，每一幅图像都是矩阵。比如下图，三只可爱的狗狗，计算机看来就是一串毫无情感的数据矩阵，其中每个点称为一个像素。对于彩色图像，每个像素又由RGB（红绿蓝）三个参数共同构成的。所以，一幅1000x1000像素的彩色图像，对计算的要求就是1000x1000x3=3M数据。

什么是卷积？

以下动画显示了卷积的过程。直观的看，就是用一个小模版（黄色）跟大矩阵，也就是待处理图片（绿色）的各部分依次进行比对，运算结果送入到新的粉色矩阵中。粉色矩阵中数字越大，说明待处理图片中对应的那个部分，跟小模版的形状越相似。利用不同形状的小模版去做多次运算，我们可以提取出待处理图片中具有代表性的特征。

换一种方式讲：想象您有各种形状的小物品，可以是一个勾，一个叉，或一个圆圈，每个小物品的尺寸都比待处理图片小很多。把一个小物品拿到待处理图片的附近，从上到下，从左到右的移动，每次移动一个像素。在这个过程中，记录待处理图片中当前的区域，和小物品的相似度。如果相似记录1，不相似记录0。用不同的小物品去重复这个过程，直到把待处理图片的各种特征都找出来。这就是卷积神经网络寻找图片特征的基本原理。

无监督学习和有监督学习

在推想科技的例子里，人工智能起初并不知道什么样的CT图像有肺炎的特征，这就需要训练它。训练的方法，是选取大量医生鉴定过的有肺炎特征的图片，利用上述卷积神经网络的原理，提取并记录肺炎的影像特征，比如斑片状病变，磨玻璃样病变等。这个过程算法在没有辅助的情况下提取特征，是无监督学习。

当人工智能找到病变的影像特征后，就可以把这些特征作为标签，与新的肺部CT图像作对比。如果新图像出现了类似的病变特征，人工智能就可以判断，病人可能感染了肺炎，并及时对医生做出提示。这个过程算法在已经提取的特征辅助下进行对比预测，是有监督学习。

下采样

卷积神经网络中还有一步比较重要的下采样过程。前面说过，处理图片的计算量非常大，下采样的主要作用就是对图片进行降维，减小计算量，同时保证结果的准确率。此外，值得一提的是，肺部CT图像是三维而非二维（上面的例子均为二维），计算量更大算法也更复杂。

卷积神经网络的全过程概括如下：

总结：卷积神经网络是多层神经网络（深度学习）的一种变化形式，特别适用于处理高维图像。推想科技利用这项技术，帮助放射科医生快速筛选肺部CT图像，发现病变，成为临床诊断新冠肺炎的一项利器。该技术的敏感度和特异性分别达到98.3%和81.7%，不仅在中国对抗新冠病毒的战疫中做出了贡献，也得到了世界上多个国家的肯定。除了推想科技，还有很多其他公司也在进行人工智能读各类医学影像的创新性工作，比如IBM Watson，Butterfly Network，深睿医疗等等。相信未来的人工智能必定是医生临床诊断的好帮手。

【对抗新冠新利器】人工智能来啦（一）

【展望】疫情过后，医疗行业会有什么变化（三）

【展望】疫情过后，医疗行业会有什么变化（二）

【展望】疫情过后，医疗行业会有什么变化（一）

欣姐原是工科出身的PhD一枚，误打误撞进入了医疗行业，从此发现了新的人生意义。海漂十余年，曾游学于欧洲大陆几十个国家，近年定居于美利坚博士屯。混过医疗仪器，生物制药，现栖身于数字医疗领域，闲暇时顺便在查尔斯河畔的某不知名小学校修读医疗管理MBA。

有收获的话就点下“在看/WOW”呗

继续阅读

阅读原文

关键词

医生

医院

技术

推想科技

新冠肺炎