整体感知 

1.题目要素拆解

1)预测变量:CT影像组学
2)结局:肺部磨玻璃影(GGO)
3)研究对象:患有或不患COVID-19
2.文章基本信息
杂志
European Journal of Radiology Open
分区
未收录
发表时间
2020.9.16
3.核心要素
研究对象(P): 共有301例患者(平均年龄±SD: 64±15岁;男性占52.8%),病例组为33例COVID-19患者,对照组为268例恶性肿瘤或其他病因导致的肺炎患者。
与我们平时见到的套路不同,本文建立的预测模型作者设置了对照组。这样做的目的是什么?让我们拭目以待。
预后模型(I/C): 利用PyRadiomics提取GGOs的影像组学特征。采用最小绝对收缩和选择算子法(LASSO)建立影像组学模型,使用受试者工作特征曲线(ROC)曲线下面积(AUC)来评估性能。
结局指标(O):患COVID-19 、不患COVID-19(恶性肿瘤或其他病因导致的肺炎)
研究类型(S):回顾性病例对照研究,诊断预测类型 
研究目的:开发一种基于GGO病变诊断COVID-19的无创CT影像组学模型,用于提高GGO诊断COVID-19的特异性。

4.变量分析

预测变量(X:CT影像组学特征
结局变量(Y: 患或不患COVID-19
协变量(Z):无

5.研究背景

临床问题:对于COVID-19,通常采用下一代测序或实时逆转录聚合酶链反应(RT-PCR)作为诊断的“金标准”,但也有研究证明CT影像在早期发现COVID-19是有效的[2]
COVID-19肺炎的主要影像学表现为在CT上肺外周见磨玻璃影(GGO,其定义为在CT上肺部透亮度降低的模糊区域,同时保留支气管和血管结构)。
GGO潜在的病理机制可能是肺泡内空气部分位移、间质增厚、肺毛细血管系统血容量增加、部分肺泡塌陷,或这些原因的综合叠加。
GGO在COVID-19早期即可见,且在肺炎症状发作后为主要表现。有研究证明在COVID-19确诊病例中77%-100%可观察到完全型GGO[3-6]
尽管CT对COVID-19的检测具有较高的敏感性,但特异性较低,尤其是在发病率较低的地区。
对于CT图像中主要表现为完全型GGO的患者,COVID-19的识别可能与恶性肿瘤或其他肺部感染相混淆,临床上需要将其区分。
目前方法不足/其他研究:最近一项Meta分析显示,胸部CT对COVID-19检测的特异性仅有37%[7]
科学假设:定量成像可能有助于提高COVID-19肺炎引起的GGO的特异性。
本文解决方式:基于此,作者假设CT影像组学特征可以提高COVID-19检测的特异性,并可以区分COVID-19与非COVID-19患者的GGO。
模型构建 
1.workflow展示
我们先来看一下流程图:
①病例信息收集(病例组33例,对照组268例)
②勾画ROI
③特征提取(一阶特征统计、2D形态特征、二阶统计特征)
④特征选择(单因素分析、LASSO)
⑤模型构建与评价(支持向量机)

2.纳入排除标准建立

eFigure1:H1为玛丽医院,H2为东区尤德夫人那打素医院,H3 为香港大学PET CT组。 
  • 第一部分:文章方法部分解读
  • 纳入标准
①病例组:2020年1月24日至2020年3月31日,在玛丽医院和东区尤德夫人那打素医院经PCR确诊的新冠肺炎患者。
②对照组:2012年2月04日至2020年3月31日,在香港大学PET CT组中,影像学报告中有GGOs的患者(由一名具有10年经验的放射科医生审查并纳入有类似磨玻璃影外观的病例)。
③2019年12月后纳入对照组的患者,在进入病房前进行严格的临床和/或实验室评估,以排除潜在的COVID-19感染。
  • 排除标准
排除影像资料不完整的患者。
  • 第二部分:PICOS原则梳理
P:
年龄:不限制,本文中平均年龄64 ± 15岁,病例组50 ± 22,对照组65 ± 13
性别:不限制,男:女病例组18:15,对照组141:127
疾病状态:病例组:确诊COVID-19的患者,对照组:CT影像上有GGO的其他疾病患者
诊断标准:病例组:经PCR检测确诊为COVID-19阳性的患者;对照组:病史和临床评估等临床细节是诊断的标准,如果有组织学和实验室检查,则结合这些检查进行诊断
I/C
影像设备:CT平扫
扫描参数
影像检查时间点:未提及
靶区:符合GGO定义的病灶[在肺窗(-600Hu窗位,1500Hu窗宽)勾画,排除大血管、动脉,以及GGO表现为结节]
O:患COVID-19 、不患COVID-19(恶性肿瘤或其他病因导致的肺炎)
  • 第三部分:纳排及分组结果
最终纳入301名患者,其中病例组33名,对照组268名。将COVID-19患者均衡分布,采用分层随机化方法,将招募的患者按3:1的比例分为训练集(225例,病例组:对照组=27:198)和测试集(76例,病例组:对照组=6:70)。

3.图像分割+图像预处理

GGO病灶的勾画由两名分别具有2年、10年经验的放射科医生独立完成,不知临床信息以避免偏倚。
使用ITK-SNAP软件在CT平扫图像(肺窗:-600Hu窗位,1500Hu窗宽)中具有代表性的层面上手工勾画。
GGOs(定义源自Fleischner学会胸腔影像学术语表),排除了大血管、动脉及GGOs表现为结节
小注:
ITK-SNAP是一款可应用于分割3D医学图像的软件,是来自于宾夕法尼亚大学图像计算与科学实验室(PICSL)和犹他大学成像研究所(SCI)长达十年的合作成果。其可使用主动轮廓方法以及手动描绘和图像导航提供半自动分割。
  • 图像预处理
重新采样的体素大小设置为1 × 1 mm2像素进行标准化。

4.特征提取+图像预处理

  • 特征提取
工具:使用PyRadiomics提取影像组学特征。
特征提取方法:从原始图像和处理后得到的小波滤波图像中提取影像组学特征。首先,选取与单变量分析结果相关的前100个特征;其次,应用LASSO(通过最优λ,选择系数大于0的特征)和正则化多重逻辑回归。
提取结果:共提取474个影像组学特征,包括102个原始特征和372个小波滤波特征。
  • 图像预处理
工具:PyRadiomics
处理方法:
①获取小波滤波图像(wavelet filtered images):小波滤波(高通滤波和低通滤波)分别从x和y两个方向对原始图像进行滤波,得到4种分解组合(过滤后的图像可以呈现来自不同方向的图像的更详细的信息)。
②不同医院采集的CT图像采用不同的采集和重建参数,故采用ComBat方法对提取后得到的影像组学特征首先进行调整,以减少批量效应(batch effect)。
小注:
批量效应,表示样品在不同批次中处理和测量产生的与试验期间记录的任何与生物变异无关的技术差异。合并分析不同批次的数据时,平常的标准化方法不足以调整批次之间的差异。批次效应不能被消除,只有尽可能的降低。
ComBat方法是一种基于经验贝叶斯方法去除批量效应的方法, 尤其对小样本数据更加有效。(Ref. http://maleskine-production:30000/p/99b3411ad6ad. )

5.特征选择

  • 特征的一致性评价
两名放射科医生从训练集中选取30例ROI进行再测信度实验(test-retest experiment),以确定特征的鲁棒性(robustness)。
纳入组内相关系数(ICC)高于0.80的特征作进一步分析。总共获得474个特征,其中有417个特征ICC值大于0.80。应用LASSO后,特征数量减少到13个,如下图所示。
小注:
再测信度:又称稳定性系数,反映测验跨越时间的稳定性和一致性。即应用同一测验方法,对同一组被试者先后两次进行测查,然后计算两次测查所得分数的关系系数。
该信度能表示两次测试结果有无变动,反映了测验分数的稳定程度。相关程度高,表示前后测量一致性高,稳定性好。
再测信度评价方法:
(1)Bland-Altman分析:计算出两种测量结果的一致性界限,并用图形直观地反映一致性界限和两种方法测量差距的分布情况,最后结合临床实际经验,分析两种测量方法是否具有一致性;
(2)组内相关系数(ICC):ICC等于个体的变异度除以总的变异度,故其值介于0~1之间。0表示不可信,1表示完全可信。一般认为信度系数低于0.4表示信度较差,大于0.75表示信度良好,对于定量资料常常需要更高的ICC值。;
(3)标准测量误差:是2014年公布的心理学名词,同一测验在同一被试上重复施测所得分数服从正态分布,其分布标准差的估计值。(Ref.https://blog.csdn.net/lihe4151021/article/details/121530067)

6.模型建立

①在训练过程中采用重采样技术:由于不同医疗中心获取患COVID-19患者的数据有限,且在疾病暴发的早期,标记为阳性的病例不足,可能会导致数据失衡,即正、负情况的不均匀分布可能导致预测向负类倾斜。
故采用一种自动计算不同重采样技术的开源方案,即自适应综合过采样技术(Adaptive Synthetic oversampling technique),以解决这一问题。
②应用LASSO进行影像组学特征提取,最终保留13个特征。
③对被选取的特征使用径向基函数核(RBF核)支持向量机(SVM),以此计算每个患者的影像组学评分(Rad-score)。
④根据在训练集中影像组学模型获得的最优预测阈值,根据诊断可能性将每个患者分为不同的风险组(患COVID-19组和非患COVID-19组)。
模型评价 

1.预测模型的评价

表2和图2展示了影像组学模型在训练集和测试集上的预测性能。
结果显示:由13个被选取的特征组成的线性回归影像组学模型在测试集中的AUC为0.905,准确率为89.5%,敏感性为83.3%,特异性为90.0%,展现了模型较好的预测性能。
补充图2展示了影像组学模型的校准曲线
结果显示:校准曲线显示新冠病毒的实际感染率与预测感染率较符合。
补充图3展示了影像组学模型的决策曲线
结果显示:决策曲线分析显示此影像组学模型具有临床应用价值。
图3展示了Rads -score影像组学模型对每个患者进行风险分层[根据诊断的可能性将患者分为低风险组(预测为非患COVID-19)和高风险组(预测为患COVID-19)],以及一些在CT图像上以GGO为主要表现的典型图例。
全文总结 
本文开发了一种基于CT成像上GGO病变的无创影像组学模型以诊断是否患有COVID-19。该模型在未来可能成为一种有希望的临床辅助工具,其可区分因其他病因而导致的GGO,以提高检出COVID-19的特异性。
这是一篇于2020年发表于European Journal of Radiology Open上的文章。虽然这本期刊还很年轻,尚未被JCR收录,但其作为European Journal of Radiology(Q2,IF4.53)的姊妹期刊,其文章的严谨性和专业性还是有保证的。
这本期刊值得关注,其文章也值得我们思考和借鉴。在COVID-19全球流行的2020年,香港地区的病例相对其他地区较少的情况下,是什么让这篇文章获得编辑的青睐呢?我觉得可能包括以下几点:
①这是第一篇基于CT图像上GGO建立的分类模型来诊断是否患COVID-19的文章。在之前的其他研究中,诊断模型的建立更多集中在临床症状和体征;基于医学影像的研究更多注重纹理特征(结合机器学习和深度学习技术对影像进行定量分析)[8],影像组学研究较少;
②运用影像组学:影像组学研究所需的样本量小于基于深度学习的研究,且计算量少、计算复杂度低、训练样本量小,开发速度快,更适用于疾病爆发的早期。
③提取影像组学2D特征:有研究证明影像组学2D特征优于3D特征,部分原因是不同医院的医学影像空间分辨率往往不一致。本研究采用二维ROI进行特征提取,是全方位考虑到模型对多中心的泛化性、人工消耗和计算成本。
④多中心研究:纳入3个医院的病例,提高了模型的泛化性。
当然文章也存在一定的局限性。
①对照组中的很大一部分病例并没有活检或实验室检查结果。对于2019年9月前的病例可以默认为COVID-19阴性,对于这之后纳入对照组的病例的标准仅是PCR检测为阴性,且在临床上不怀疑患有COVID-19。
②没有将临床病史、危险因素或人口统计学资料纳入预测模型。这在临床应用中是本是非常重要的,但因为本研究的目的是确定基于GGO建立的影像组学模型对COVID-19具有可鉴别性,故没有纳入。
③本研究为回顾性研究,因此可能存在选择偏倚。COVID-19病例的获取渠道有限,病例组和对照组的患者来自不同的机构,本研究已使用特征协调来最大限度地减少批量效应。本研究的结果还需之后的前瞻性研究进行验证。
本研究跳出了影像组学研究集中的热点——肿瘤,而是聚焦于全球流行的COVID-19,通过新兴的影像组学分析方法,为早期诊断是否感染COVID-19提供了临床辅助工具,即抓住了热点,又极具临床意义。
虽然国内COVID-19的病例数量远不如国外(希望疫情早日结束!),但在COVID-19这个大前提下,本文选题的切入角度新颖且科学,同时提供了病例样本量较少时的解决方法,这样的独特的选题和科学的处理方法非常值得我们思考、学习和借鉴!
好啦,本期的文献分享就到这里啦,对于刚刚接触影像组学、以为其只能运用于肿瘤影像的小伙伴是不是拓宽了眼界和思路?继续跟紧君莲数据库的平鑫而论专栏,我们下期见吧~~
参考文献
[1] Xie C, Ng MY, Ding J, Leung ST, Lo CSY, Wong HYF, Vardhanabhuti V. Discrimination of pulmonary ground-glass opacity changes in COVID-19 and non-COVID-19 patients using CT radiomics analysis. Eur J Radiol Open. 2020;7:100271. doi: 10.1016/j.ejro.2020.100271. Epub 2020 Sep 16. PMID: 32959017; PMCID: PMC7494331.
[2] T. Ai, Z. Yang, H. Hou, C. Zhan, C. Chen, W. Lv, Q. Tao, Z. Sun, L. Xia, Correlation of chest CT and RT-PCR testing in coronavirus disease 2019 (COVID-19) in China: a report of 1014 cases, Radiology 296 (2) (2020) 200642.
[3] D. DeCaprio, J. Gartner, T. Burgess, S. Kothari, S. Sayed, Building a COVID-19 Vulnerability Index, arXiv e-prints [Preprint], 2020.
[4] D. Caruso, M. Zerunian, M. Polici, F. Pucciarelli, T. Polidori, C. Rucci, G. Guido, B. Bracci, Cd. Dominicis, P.A. Laghi, Chest CT features of COVID-19 in Rome, Italy, Radiology 296 (2) (2020) 201237.
[5] F. Song, N. Shi, F. Shan, Z. Zhang, J. Shen, H. Lu, Y. Ling, Y. Jiang, Y. Shi, Emerging 2019 novel coronavirus (2019-nCoV) pneumonia, Radiology 295 (1) (2020) 210–217.
[6] L. Basler, H.S. Gabry´s, S.A. Hogan, M. Pavic, M. Bogowicz, D. Vuong, S. Tanadini- Lang, R. F¨orster, K. Kudura, M.W. Huellner, R. Dummer, M. Guckenberger, M. P. Levesque, Radiomics, tumor volume, and blood biomarkers for early prediction of pseudoprogression in patients with metastatic melanoma treated with immune checkpoint inhibition, Clin. Cancer Res. 26 (16) (2020) 4414–4425.
[7] S. Lee, K.W. Kim, W.K. Jeong, M.J. Kim, G.H. Choi, J.S. Choi, G.W. Song, S.G. Lee, Gadoxetic acid-enhanced MRI as a predictor of recurrence of HCC after liver transplantation, Eur. Radiol. 30 (2) (2020) 987–995.
[8] M. Barstugan, U. Ozkaya, S. Ozturk, Coronavirus (COVID-19) Classification Using
CT Images by Machine Learning Methods, arXiv e-prints [Preprint], 2020.
END
撰文丨小      戴
审核丨鑫      仔
责编丨小张老师
往期推荐
继续阅读
阅读原文