别和我说影像组学卷不动了，搞懂这个还愁发不到一区？

楔子1

最终目的

大家好，我是鑫仔。我们将用三期推文，讨论一个大家比较感兴趣问题：影像组学研究的最终目的是什么？

构想一：我们希望构建分类器或者预测模型，能够帮助我们辅助诊断、评估疗效、预测预后；

（这个时候我们建立的科学假设往往是影像组学特征可以反应xxx患者的结局信息）

构想二：我们希望影像组学可以为我们提供一种易于获得、非侵入、低消费、3D的方式获得客观测量和评估的特征（定量），作为正常生物过程、致病过程或对治疗干预的反应的指标。

这个时候我们建立的科学假设往往是影像组学特征可以反映病理生理异质性（或者是可以反映表型或基因型信息）

例如，利用不同的患者影像所提取的影像组学特征分析肿瘤间的生物学差异，从而辅助治疗方案的制定

影像组学特征在图中的角色是不是就类似于一个更易于获得的分子生物标志物？

我们把它称作影像生物标志物（Image Biomarker）

楔子2

从影像组学特征到影像生物标志物

影像生物标志物潜力巨大，但大多数生物标志物未能改变临床实践。

影像科学、放射学、癌症生物学和肿瘤学界越来越认识到，影像生物标志物如果要改变临床决策，必须经过更严格的技术验证、生物/临床验证和鉴定。

那么，如何将影像组学特征转化为可供临床实践的生物标志物呢？

（PMID:27725679）

从图中我们可以看出：影像生物标志物必须跨越Translational gap1（体外，体内，临床）才能成为鲁棒性强的的医学研究工具，而Translational gap2则必须整合到常规患者护理中。

此目标是通过技术（化验）验证、生物和临床验证以及成本效益三个平行轨道实现的。

而我们能做的，主要就是生物和临床验证这一块。

那么，我们今天就来讨论一下，影像组学特征的生物学意义，主要分析探讨这篇综述：

（Robert J.Gillies教授，名字我们应该比较熟悉，其它两篇影像组学发展极为重要的综述也是出自他之手）

根据他的个人网站（https://labpages2.moffitt.org/gillies/），简单整理了一下他的资料：

为了方便叙述，我们后面就叫教授老G。

Background

在第二天为大家讲解了如何去阅读一篇ResearchArticle，而阅读综述的Background部分与阅读ResearchArticle的Introduction部分类似，都是寻找作者的BIGQUESTION和SPECIFICQUESTION，并用3-5句话总结。

我主要提取总结了3条最有价值的信息：

❶ 影像组学以医学影像反应潜在病理生理学特征为科学假设，基于数据驱动提取大量成像特征，为疾病诊断、预后、治疗应答提供间接的观察，如我前面所说；

❷ 影像组学提供的数据可以反应不同空间尺度（宏观、微观）的生物学过程变化；

❸ 数据驱动的影像组学组学研究具有科学假设的事后生成的特性因此无法直接得知研究结果的生物学意义，指出外部生物学验证的必要性；

这是比较有意思的点，作为一个特殊的存在，医学影像既能反应解剖、功能、分子水平

影像组学还可以定量的提供从病理切片到基因组的信息，这种跨越空间尺度的优势，是很多方法很难办到的

至此，Background部分分析完毕，进入下一阶段，Importance of Validation。

Importance of Validation

这一部分主要回答了两个问题：为什么要做生物学验证？怎么做生物学验证？

1.为什么要做生物学验证？

虽然我也在今天的最开始，跟大家探讨了为什么要做生物学验证这个话题，不过我们还是来看看专业人士的分析，老G提出了以下三个观点：

❶单单由数据驱动的影像组学具有局限性

容易产生过拟合 & 过度解释

不能证明因果关系（没法干预影像组学特征）

❷目前的影像组学的规范化指南，

RQS（PMID: 28975929）：基于不同的评估指标构建影像组学模型

IBSI（PMID: 32154773）：特征提取和统计方法的标准化

Radiomic Ontology project（PMID: 31580484）：为临床提供全面的分析平台

都没能解决影像组学生物学意义的问题。

❸同样是数据驱动，人家基因组学可以弄个GO（Gene Ontology）结合生物学功能，影像组学就不能弄个IO嘛？（其实结合TCGA和TCIA也是能部分实现的）

2. 如何做生物学验证？

那么如何做生物学验证呢？也是本文主要要解答的问题

老G提出了以下这5种方法：

❶语义分析；

❷影像基因组学；

❸组织病理学和蛋白表达层面(IHC)；

❹病理相关性局部分析(也就是病理组学研究）；

❺生境成像；

大家可以把这5种方法看成5个等级，下面鑫仔带大家逐层打怪升级~

我们进入第一模块，语义分析！

Semantic Analysis

读文献过程中要时刻与作者对话，如果我说第一个模块：语义分析，如果你的反应是[哦，是语义分析啊]，[随便啦，一种分析方法而已]都说明，现阶段阅读能力还需要加强。

在不假思索想这些之前，我们首先应该反应出，语义分析是什么？第一讲有提到过，可以翻看笔记回忆一下。

再者，老G为什么说语义分析能为影像组学提供生物学验证？

最后，他提供的证据最后能让我信服这个观点嘛？

影像组学中的语义特征概念我们在第一讲已经有明确交代，简单说一下，例如大小、形状、血管分布、坏死、毛刺和其他影像征象，都可以称为“语义特征”，通常由放射科医生描述。

我们再来看下老G的逻辑，为什么语义分析能为影像组学提供一些生物学验证信息？

证据一：早期影像学预测模型的玩法，就是通过语义特征构建，可以结合多种语义特征完成较为复杂的预测（如基因表达预测）。

证据二：所考虑的特征都是可以直接看到的，即使不能完全达到与生物过程相关，也可以与物理过程相关。

证据三：最近研究表明，语义特征的各种征象与视觉表型是有一定关联的。

通过以上证据我们可以得出，语义特征与患者的疾病或者生物学过程是有一些关联的，如果能构建影像组学与语义特征的关联，就有可能进一步挖掘影像组学的生物学意义。

实例1 直接探索相关性

特征（滤波/非滤波）相关性（PMID: 28615677）

看图，我们得到以下2条结论：

❶影像组学特征与语义特征存在相关性；

❷ 相关性从弱到中度不等（不强就是了）；

带来两种思考：

思考1：影像组学特征和语义特征关联性具有统计学意义，那么能不能进一步用影像组学特征代替语义特征？

思考2：两者相关性仅从弱到中度不等，表明这两种类型的特征都可能提供不同的肿瘤表型信息。由于语义和影像组学特征在识别侵袭性肿瘤方面都显示出了前景，因此它们在预后预测中的互补作用需要进一步研究。

实例2 利用经过变换的影像提取影像组学特征

径向梯度 (RG)/径向偏差 (RD)图提取的影像组学特征与语义特征相关性（PMID: 29221183）

从表中我们可以看出，RD/RG 影像组学特征与三个语义特征在统计学上显著相关：分叶、胸膜附着和边界定义，展现出潜在的生物学基础。

实例3 利用经过变换的影像提取影像组学特征

有了影像组学特征和语义特征是有一定关联的这一铺垫，进一步，可以利用语义特征和影像组学特征结合构建决策树模型预测EGFR突变状态，发现预测效果是不错的(AUC=0.88529)。

不过这篇文章的作者同时也表示，Cohen κ系数低（提示提取语义特征的组间一致性差），后三项的κ系数明显都是不及格的，结节衰减Cohen κ系数甚至仅为0.16。就像我考的分数高不一定是我学的好，也可能是从平时习题到考试题本身就都有问题。

实例4 自创一个可理解的定量视觉方法建立生物学关联

为了解决提取语义特征一致性差的问题，研究者将聚焦于特征的自动定量提取，并将语义特征概念扩大为视觉特征（PMID: 30082477）

自创定量影像组学方法与临床/病理指标相关联（高Δ vs 低Δ）

比较每个区域内的HU分布的平均值，将正常组织和肿瘤组织HU分布的差异称为Δ

研究结果发现，局部和转移性PDAC（胰腺导管腺癌）中肿瘤与实质（Δ）交界CT变化增强（高Δ）表明患者肿瘤基质明显减少，存在多种常见突变的可能性更高，与增强不明显（低Δ）的肿瘤相比，间质化特征更明显，早期远处转移的可能性更高，存活时间更短。

结果显示，视觉上明确且可量化的CT成像特征反映了PDAC的分子和病理异质性，并且可用于将患者分层为不同的亚型。

简单来讲，我们肉眼可见并能理解的视觉特征可以反应肿瘤的异质性，视觉特征与生物学特征也有很强的关联。

而本文的模型1)定量提取特征，2)模型本身与影像组学的一阶灰度直方图特征相近，都可以像影像组学的生物学意义引申。

此外，老G还列举了很多研究说明定量视觉特征和肿瘤异质性的相关性，这些结果都说明，我们在建立影像组学模型时，虽然很多特征会与语义特征重合，但是探讨两者之间的相关性还是有生物学和临床意义的。

好啦，本期的影像组学生物学意义分享就到这里，我们下一期的推文将分享如何利用影像基因组学、组织病理学和蛋白表达层面(IHC)等方法来进一步探讨影像组学的生物学意义。我们下期见啦~

—

END

—

撰文丨鑫仔

审核丨小张老师

责编丨小张老师

往期推荐

继续阅读

阅读原文

关键词

组学

模型

影像组学

信息

方法