一、
整体感知

1.题目要素拆解

文章题目提供了三条信息:
1) 预测变量:病理组学、影像组学signature及其关联性
2) 结局:鉴别亚型
3) 研究对象:非小细胞肺癌(NSCLC)

2.文章基本信息

3.核心要素

研究对象(P):非小细胞肺癌(NSCLC)患者(TCGA,n = 117;CPTAC,n = 54;NSCLC-R,n = 101)
CPTAC(Clinical Proteomic Tumor Analysis Consortium)是一项由美国国家癌症研究所在2011年发起的旨在利用大规模蛋白组和基因组分析,系统地鉴别源自癌症基因组改变和相关生物过程的蛋白质,加速对癌症分子机制研究,提升人们诊断,治疗和预防癌症水平的项目。CPTAC数据库纳入多种癌症的蛋白组学、基因组及图像数据,其中包含了影像和病理图像,并托管至TCIA网站以供公众下载及使用。
预后模型(I/C):SVM模型分别构建病理组学、影像组学signature
结局指标(O):鉴别腺癌(ADC)和鳞癌(SCC)
研究类型(S):回顾性队列研究,诊断模型
研究目的:分别开发基于WSI的病理组学及基于CT的影像组学模型,用于鉴别诊断腺癌(ADC)和鳞癌(SCC),并初步探索它们之间跨尺度的相关性

4.变量分析

预测变量(X):病理组学signature、影像组学signature
结局变量(Y:  鉴别诊断腺癌(ADC)和鳞癌(SCC)
协变量(Z):无

5.研究背景

临床问题:肺癌是 2018 年全球诊断出的最常见的癌症,80% 到 85% 的肺癌是非小细胞肺癌 (NSCLC),最常见的亚型是腺癌 (ADC) 和鳞状细胞癌 (SCC)。
这两种肺癌类型在临床病理学表现出一定的差异。可用的治疗选择包括常规化疗和靶向治疗。
因此,肺癌亚型的早期识别与治疗方案的制定(治愈性或姑息性)高度相关。
目前方法不足:肺癌临床方案中的关键依据仍然是标准的计算机断层扫描 (CT) 成像(在诊断时获得)以及组织活检标本(为疾病确诊而获得),两者通常在临床工作流程中都需要进行主观专家评估;
目前影像组学和病理组学的策略分别被用于捕获表征肺癌不同病理亚型的复杂模式,而影像组学和病理组学特征是否具有相关性亟待探索。
研究GAP:既往研究探索了乳腺癌、前列腺和肺腺癌等不同肿瘤的影像组学和病理组学之间的跨尺度关联,目前在鉴别诊断ADC和SCC方面仍缺乏相关的研究。
本文解决方式:作者基于WSI和CT分别建立病理组学及影像组学的诊断模型,并研究放射学和组织病理学之间的跨尺度关联,以期进一步吸纳提高模型鉴别诊断的能力。
二、
模型构建

1.纳入排除标准建立

第一部分文章方法部分解读
纳入标准
① ADC或SCC患者
② 可供分析的病理全切片扫描图像(WSI)或CT影像
③ 临床数据完整
排除标准:无
第二部分PICOS原则梳理
P:
年龄:不限制;
性别:不限制;
疾病状态:首诊初治;
疾病分期:不限制;
治疗方案:未具体提及;
诊断标准:病理诊断;
I/C
影像设备:CT(CMS、Siemens、GE Medical Systems、Philips) ;
病理切片染色:H&E染色;
影像及病理检查时间点:初诊;
O:
鉴别诊断:ADC和SCC
第三部分纳排及分组结果
病理组学分析纳入171名患者,包括CPTAC(117例,训练集)和TCGA(54例,验证集);
影像组学分析纳入146名患者,包括NSCLC-R(101例,用于鉴别诊断模型建立)和TCGA(45例,同时具有影像和病理图像信息,用于建立两者之间的相关性)。
2.病理组学——图像分割、预处理、特征提取及特征选择
图像分割、预处理
首先,每个WSI分割为1mm2 的patch(相当于放大20 倍的2000×2000像素),然后再将其划分为50µm2的tile。
WSI(Whole Slide Images)是指H&E染色的全切片扫描图像,通常分辨率非常大(几万×几万像素),受到内存等因素的限制,常规的深度学习是无法直接将WSI 整体作为输入进行端对端的的训练。
目前主要是将WSI通过非重叠的方式切分出大小相等的图片小块即patch(一般是256×256像素或512×512像素),在英文文献中也有用tile替代patch作为术语。
而在本文中,作者将WSI先分割成1mm2 patch再继续分割成50µm2的tile,tile与patch不是等同的,代表了比patch更小的图片小块。
随后,通过分割细胞核估计每个tile中细胞核的数量,并根据细胞核数目为每个tile分配灰度级,最终生成组织病理学上细胞密度的空间图,称为细胞密度图,展示在Figure 2中,并展示了同一病人相应肿瘤部位的CT patch图。
Figure 1
作者进一步将细胞密度图转换为灰度共生矩阵(GLCM),以期望通过研究灰度的空间相关特性来描述病理图像的纹理特征,从而达到可以与CT的灰度图像进行相关性比较的目的。
另外,作者还将灰度共生矩阵可视化为热图,其中红色对应于更高的共现可能性。
结果显示ADC(Figure 4a,b)相邻tiles之间的细胞密度值共现分布的更高和更集中。
在 SCC 中观察到相反的趋势(Figure 4c,d),即共现分布更广更分散,相邻tiles之间的细胞密度值变化更平缓。
Figure 4
数据预处理
处理方法:①归一化,通过减去平均值并除以标准差的方法,以确保所有提取的特征都在相同的值范围内;
②使用显著性和相关性测试的组合选择特征,以确保特征相关性,同时删除潜在的冗余和非信息性特征。
特征提取
工具:本文特征提取过程基于灰度共生矩阵(GLCM)进行Haralick特征提取。
特征类型+提取结果:最终包括了72个来自共现矩阵的Haralick病理特征(每个patch,3个尺度,2个共生矩阵(水平-垂直和对角线方向),各12个Haralick纹理特征);
另外,考虑到每个 WSI 由不同数量的patch表示,在整个patch和 72 个特征上计算5个统计量(均值、中位值、方差、峰度和偏度),共得到360个病理组学特征。
Figure 2
特征选择
使用线性SVM算法模型,通过随机 10折交叉验证筛选和评估特征。
目的是通过分类任务分别评估来自共现矩阵的Haralick病理特征和基于统计量的病理特征(分别定义为FPHFPS排名靠前的特征,以区分 ADC 和 SCC。
模型性能评价根据ROC曲线下面积 (AUC) 以及置信区间进行量化。
结果显示,使用FPH中排名靠前的6个病理组学特征,训练集的AUC为0.72±0.02(CPTAC,95% 置信区间:0.65-0.77),验证集中AUC为0.77(TCGA)。
相对应,训练集中模型的准确度为0.69±0.03(95% 置信区间:0.62–0.74),验证集中准确度为0.74(敏感度0.72,特异度 0.76)。
相比之下,在考虑FPS时,训练集的AUC显著降低,为0.62±0.02(95% 置信区间:0.55-0.68),验证集的AUC 为0.34。
特征评估
最后,评估病理组学特征的稳健性,通过Wilcoxon 秩和检验比较6个排名靠前的病理特征分别在CPTAC 和TCGA 数据集中ADC(蓝色)和SCC(黄色)之间的差异。
Figure 5
如Figure 5所示,FPH排名靠前的6个Haralick病理特征在不同队列之间无显著差异,在ADC和SCC之间表现出较大的差异。
Figure S1
如Figure S1所示,绘制了CPTAC数据库中的箱线图,FPH排名靠前的6个Haralick病理特征在不同tiles尺寸之间无显著差异。

3. 影像组学——图像分割、预处理、特征提取及特征选择

图像分割
针对CT图像,感兴趣区域 (ROI) 被定义为最大注释 的2D 肿瘤切片以及两个相邻切片(总共 3 个连续 2D 切片)的子体积,如图 3 所示。
这是始终适用于所有患者的最小子体积。将CT 图像强度值转为归一化的共现矩阵。
数据预处理
处理方法:①归一化,通过减去平均值并除以标准差的方法,以确保所有提取的特征都在相同的值范围内;
②使用显著性和相关性测试的组合选择特征,以确保特征相关性,同时删除潜在的冗余和非信息性特征。
特征提取
工具:本文特征提取过程同样基于灰度共生矩阵(GLCM)进行Haralick特征提取。
特征类型+提取结果:最终包括了24个来自共现矩阵的Haralick影像特征(每个ROI,2个共生矩阵(水平-垂直和对角线方向),各12个Haralick纹理特征);
另,每个Haralick特征计算5个统计量(均值、中位值、方差、峰度和偏度),共得到120个影像组学特征。
Figure 3
特征选择
同样使用线性SVM算法模型,通过随机 10折交叉验证筛选和评估特征。
目的是通过分类任务分别评估在NSCLC-R队列中来自共现矩阵的Haralick影像特征和基于统计量的影像特征(分别定义为FRHFRS排名靠前的特征,以区分 ADC 和 SCC。
模型性能评价根据ROC曲线下面积 (AUC) 以及置信区间进行量化。
结果显示,使用FRH中排名靠前的6个影像组学特征,NSCLC-R队列中SVM 模型交叉验证得到的AUC为0.72±0.01(95% 置信区间:0.65-0.77)。
相对应,准确度为0.69±0.01(95% 置信区间:0.61–0.74),敏感度为0.67±0.01(95% 置信区间:0.59–0.73),特异度为0.71±0.02(95% 置信区间:0.63–0.76)。
相比之下,FPS的AUC 显著降低,为 0.51±0.04(95% 置信区间:0.43–0.58)。
特征评估
最后,评估影像组学特征的稳健性,通过Wilcoxon 秩和检验比较FRH6个排名靠前的影像特征在NSCLC-R队列中在 ADC(蓝色)和 SCC(黄色)之间的差异。
Figure 6
如Figure 6所示,FRH排名靠前的6个Haralick影像特征在ADC(蓝色)和SCC(黄色)之间表现出较大的差异。
Figure S2
如Figure S2所示,FRH排名靠前的6个Haralick影像特征在不同制造商之间(Siemens 和 CMS )没有显著差异。

4. 探索跨尺度病理-影像关联性

探索1
目的:评估病理图像细胞密度值和CT图像强度值之间的相关性,即FPS 和FRS 之间的相关性。
对象:TCGA 队列(影像学和组织病理学图像均可用)
处理方法:(i) 使用 Spearman 秩相关检验计算每对 FPS 和FRS特征的相关系数和P 值(以确保对异常值的稳健性);
(ii) 使用多重假设检验的错误发现率 (False Discovery Rate,FDR) 校正来识别显著相关性,当 FDR≤0.01时具有统计学意义。
FDR 的含义是错误拒绝(拒绝真的(原)假设)的个数占所有被拒绝的原假设个数的比例的期望值,利用多次检验对传统的P值进行校正。
FDR 具有以下优点:(1)可以灵活调整其取值,作为假设检验错误率的控制指标, 其控制值可以根据需要灵活选取;
(2)FDR 的意义明确,可以作为组学海量数据中筛选出的差异变量的评价指标。
结果:将FPS 和FRS 之间的相关系数以及FDR值可视化为热图,分别用于 ADC 和 SCC。
Figure 7a、c 分别展示了ADC和SCC中病理组学特征FPS(横轴,包含均值、中位值、方差、峰度和偏度)与影像组学特征FRS(纵轴,包含均值、中位值、方差、峰度和偏度)两两之间的相关系数,蓝色代表了正相关,红色代表了负相关,带有*标志表明其相关系数对应的FDR值≤0.01,Figure 7b、d 则展示了Figure 7a、c相对应的FDR值。
我们发现Figure 7a的左上4个方块中相关性具有统计学意义,其相关系数分别是0.59、0.57、0.61和0.59。
Figure 7c的中上2个方块中相关性具有统计学意义,其相关系数分别是0.51和0.54。
总结一下,FPSFRS的相关性热图分析,共有6对特征之间显示出具有显著统计学意义的跨尺度关联,相关系数在 0.51 和 0.61 之间()。
为了进一步评估,Figure 8 分别具体显示了这6对特征(X 轴上是病理组学特征,Y 轴上是影像组学特征)相关性趋势的散点图,每个图的边界都有相应的直方图,图中具体展示其相关系数及校正后P值(即FDR值)。
Figure 7
Figure 8
评估:由于每个 WSI 可用的patch数量因数据集而异(6-67 个patch/数据集),病理-影像特征之间的Spearman 秩相关检验趋势在 2 个子集中重新评估:
① <15 个patch/study的患者;
② ≥15 个patch/study的患者。
如Figure S3所示,ADC 在7a和S3a、b之间显示出相似的相关系数趋势,在相关性热图的左上4个方块中均表现为正相关,其相关系数也比较接近;
而SCC的相关性趋势仅在7c 和 S3d 之间基本一致,表现为在相关性热图的中上2个方块中表现为正相关,相关系数也比较接近,但S3c 略有不同(可能是由于该子集中可用的病例数较少,因此影响相关性的判断)。
Figure S3
探索2
目的:评估基于 Haralick 的FPH 和FRH 之间的关联。
对象:NSCLC-R队列
处理方法:(i) 在SVM模型10 倍交叉验证方案下筛选出的特征;
(ii) 将FRH限制在病理学尺度下确定的特征类型FPH(事实上就是将FRHFPH取交集),评估该子集在放射学尺度上区分 ADC 和 SCC的性能。
结果:当将 FRH限制在确定的病理组学特征类型FPH时,与单纯FRH模型相比,NSCLC-R队列中分类性能显著提高到 AUC 为0.78±0.01(95%置信区间:0.70-0.82)。
Figure 9显示,将基于病理-影像学关联评估的排名靠前的代表性特征,可视化为热图(其中红色对应于过度表达),分别对应为ADC (上行)和 SCC(下行)的肿瘤CT图像(a,d),Haralick 相关性(b,e)和Haralick同质性(c,f)。
Figure 9
三、
全文总结
本文分别开发基于WSI和CT图像的病理组学及影像组学特征,用于鉴别诊断非小细胞肺癌中的腺癌(ADC)和鳞癌(SCC),并对病理-影像组学的跨尺度关联性进行初步探索。
这篇20年发表的文章建立诊断模型的套路非常简单,那么文章让人青睐的亮点究竟在哪里呢?我认为原因在以下几点:
1️⃣作者的论述思路比较完整,其中诊断模型的建立和验证比较容易上手;
2️⃣病理-影像组学关联具有创新性,分别通过两种方法探索两者之间的关联性,并且这种关联能显著提高影像学特征的鉴别性能;
3️⃣通过将病理图像转换为细胞密度图,从而实现病理图像细胞密度值和CT图像强度值之间的可比性,这种方法可以建立病理图像到医学影像的桥梁,值得大家学习;
4️⃣实现完全的白嫖数据,所有数据均利用在线数据集进行挖掘,且每个模型均有两个队列。

局限性

1️⃣作者对病理图像和CT图像分割、数据处理、特征提取等方法描述得比较简单,新手理解有点困难;

2️⃣虽然使用了大型公共数据库进行挖掘,但最终队列规模仍然有限(n = 171 个病理学标本,n = 146 个影像学标本);

3️⃣本研究中评估的放射学-病理学关联仅利用了TCGA队列的一部分(n = 45),数据量较小,关联性结论有必要在更大的数据集中进行验证;

4️⃣为了实现病理图像和CT图像之间的可比性,本研究中提取的是基于共现(co-occurrence)的特征而不是更复杂的特征(例如,病理学中的拓扑结构;影像学的小波特征等)。

本研究均使用在线的数据集进行挖掘,发到Cancers这本杂志,着实让人羡慕不已;
由于影像组学与病理组学本质上是互补,作者仅将两者之间的关联性应用于肺癌亚型的鉴别,如何推广至其他肿瘤的鉴别,或者能否基于关联建立预后模型,仍然还有很多值得挖掘的地方,跟不上影像组学前期潮流的小伙伴们可以尝试弯道超车;
当然,如果能建立自己的临床队列,同时收集完整的病理图像和影像图像,研究的可靠性将大大提升,使此类文章发生质的飞跃! 
好啦,本期的文献分享到这里,对于追求2区的小伙伴是不是又一次的冲击呢?继续跟紧君莲数据库的平鑫而论专栏,我们下期见吧~~
参考文献
[1] Alvarez-Jimenez C, Sandino AA, Prasanna P, Gupta A, Viswanath SE, Romero E. Identifying Cross-Scale Associations between Radiomic and Pathomic Signatures of Non-Small Cell Lung Cancer Subtypes: Preliminary Results. Cancers (Basel). 2020;12(12):3663. Published 2020 Dec 7. doi:10.3390/cancers12123663
[2] 颜锐,梁智勇,李锦涛,任菲.基于深度学习和H&E染色病理图像的肿瘤相关指标预测研究综述[J].计算机科学,2022,49(02):69-82.
通知通知,针对临床小白的21天理论与实操集训来啦!教你用超快速度复现3-5分临床SCI,分分钟秒杀同组师兄师姐~就在10月10日下午3点,满满干货,抓紧上车咯~
END
撰文丨珺      珺
审核丨鑫仔老师
责编丨小张老师
往期推荐
继续阅读
阅读原文