分子分型套路
大家好,我是风风。前面的推文我们已经一起探讨过如何使用无监督聚类的方法对疾病进行分子分型,但是分子分型到底该怎么运用我们还需要来学习下范文。根据分子表达量对疾病区分分子亚型,临床上较常见也是转化比较成功的案例之一是乳腺癌的分子亚型了,通过分子亚型区分疾病,从而辅助临床诊疗,是精准医疗的运用之一。既然乳腺癌也有这么成功的案例,其他疾病是不是也可以呢?答案是肯定的,但是怎么找到一种稳定可靠的分型方法又是我们需要去不断探索的内容。
今天我们抛开难以理解的top级别期刊文章,回到接地气的领域,一起来拆解一篇来自International Immunopharmacology的分子分型文章,题目为:“Autophagy-related gene expression classification defines three molecular subtypes with distinct clinical and microenvironment cell infiltration characteristics in colon cancer”。
期刊信息
影响因子虽然不高,只有4.932分,但是属于2区杂志,而且文章内容做得不少,作为我们学习分子分型思路的模板文章绰绰有余了。
题目拆解
Autophagy-related gene expression classification defines three molecular subtypes with distinct clinical and microenvironment cell infiltration characteristics in colon cancer,翻译成中文就是:自噬相关基因表达分类定义了三种具有不同临床和微环境细胞浸润特征的分子亚型。
题目稍显啰嗦,可以进行简写,写成Autophagy-related gene expression predict microenvironment subtypes in colon cancer或者Autophagy-associated molecular classification of colon cancer都可以,适当长度且直击主题的题目更容易吸引编辑和审稿人,也更容易吸引人阅读进而增加引用。题目给我们提供了几个关键信息:
疾病:结肠癌;
方法:分子分型;
目的:定义亚型并阐述特征;
数据类型:未知;
题目已经把文章的主体脉络介绍得比较清楚了,如果读完题目后还觉得比较模糊,我们可以再通过摘要来补充文章的整体思路。
摘要
摘要中的关键部分已经帮大家highlight出来了,简单总结一下,作者利用7个数据集总共1580样本进行分析,使用无监督聚类进行分子分型,得到了结肠癌的3种亚型,使用ssGSEA量化结肠癌每一个样本的免疫浸润情况,并结合分子分型探讨不同亚型的免疫微环境特征,最后使用LASSO回归构建模型得到APCS作为全新的signature。接下来我们看看本文的结果。
结果
Fig 1. 结肠癌中自噬相关基因的分子特征。
作者从Human Autophagy Database (HADb: http://www.autophagy.lu/)数据库中提取了232个自噬相关基因,匹配6个数据集后,最后得到了210个自噬相关基因进行分析。首先进行差异表达分析,得到在正常组织和肿瘤组织中的表达差异有统计学意义的自噬相关基因,PCA分析显示肿瘤和正常样本可以被这些差异的自噬基因完全分离 (Fig 1A)。Fig 1B是对这些差异自噬相关基因进行富集分析,发现富集结果与免疫和自噬显著相关。然后,对结肠癌自噬相关基因的突变情况进行整体分析。结果表明,TP53与MTOR突变频率最高Fig 1C展示了20个突变率大于4%的自噬基因的突变瀑布图。在这些高度突变的自噬基因中,作者分析了它们的突变共生关系(Fig 1D)。同时,作者分析了这些高频率突变基因的预后情况,结果如Fig 1E的森林图所示。
Fig 2. 无监督聚类识别结肠癌自噬亚型。
作者合并了6个数据集,并去除了批间差。采用无监督聚类方法识别结肠癌自噬相关亚型。根据210个自噬相关基因的表达,所有肿瘤被分为三个不同的亚型,PCA结果显示这三种亚型可以被明显区分开(Fig 2A)。通过对3个不同的自噬亚型进行预后分析,发现在3个亚型中,亚型2的无复发生存(RFS)具有显著优势(Fig 2b),接着作者集中于临床注释最全面、患者数量最多的GSE39582队列,以进一步探讨这些自噬亚型在不同生物学行为和临床因素下的特点。类似于对所有患者的聚类,无监督聚类一样在GSE39582队列中发现了三个完全不同的自噬亚型 (Fig 2C)。在三个亚型中观察到自噬基因表达谱的显著差异,证实在结肠癌中确实存在三种不同的自噬亚型(Fig 2D-E)。生存分析还显示,在集群2亚型中有显著的生存优势(Fig 2F)。进一步的研究表明,突变频率高的自噬相关基因在这三种自噬亚型之间的表达存在显著差异(Fig 2G)。
Fig 3. 不同自噬亚型的免疫微环境特征。
使用ssGSEA算法对免疫微环境中24种免疫浸润细胞相对丰度进行定量。TME细胞浸润分析表明,除静息NK细胞外,亚型1的免疫细胞浸润显著丰富;亚型2的TME细胞浸润相对较低;亚型3的静息型NK细胞、幼稚CD4+ T细胞和调节性T细胞的浸润程度最高(Fig 3A-B)。然而,亚型1和亚型2的患者没有表现出与TME细胞浸润特征相匹配的存活率(Fig 2F)。考虑到亚型1中内皮细胞和成纤维细胞的浸润较多,作者推测亚型1中激活的间质细胞可能介导了较差的预后。而尽管亚型1肿瘤的免疫浸润水平较高,但其微环境的TME间质活性(包括上皮-间充质转化(EMT)、泛成纤维细胞转化生长因子β(Pan-F-TBRs)和血管生成途径)明显高于其他两种亚型(Fig 3C)。免疫检查点通路在亚型1中被显著激活,而亚型2的特征是DNA修复通路的激活(Fig 3C)。使用ESTIMATE算法进一步研究了三个亚型之间的总体间质活性的差异,并证实了亚型1的TME间质活性显著高于其他两个亚型(Fig 3d)。
Fig 4. 三个自噬亚型的功能注释。
使用GSVA富集分析确定不同自噬亚型之间的生物学行为。如Fig 4A-B所示,亚型1呈现与基质激活通路相关的丰富通路,如ECM受体相互作用、VEGF信号通路和TGFβ信号通路。亚型2的修复激活途径明显富集,如碱基切除修复、错配修复和核苷酸切除修复。而亚型3与免疫抑制生物学过程密切相关。通过表征三种亚型,作者分析了细胞因子和趋化因子在三个亚型中的表达差异,以进一步探讨肿瘤自噬亚型在TME间质调控中的作用。趋化因子和细胞因子来源于早期发表的文献,这些文献认为TGFb/EMT途径的转录产物与VIM、ZEBI、COL4A1、ACTA2、TGFRB2、CLDN3、Twist1、SMAD9和TGRB1有关,免疫检查点则是TNFRSF9、TIGIT、CD86、CD80、PD-L2、PD-1、HAVCR2、LAG3、IDO1、CTLA-4和PD-L1。在亚型1中,与TGFb/EMT通路相关的mRNA显著上调,说明该亚型的基质呈激活态(Fig 4C)。与免疫检查点分子相关的mRNAs在亚型2中也有较高的表达,这表明免疫检查点分子的上调表达可能导致这一亚型的免疫逃逸(Fig 4D)。最后,使用limma包分析这三个亚型之间的转录组差异,总共得到3738个与表型相关的差异基因。使用clusterProfiler软件包对这些差异基因进行GO富集分析。这些差异基因在自噬相关的生物学过程中显著富集(Fig 4e)。
Fig 5. 构建自噬相关signature。
为了评价每个患者的肿瘤自噬特征,作者使用LASSO-Cox回归模型构建了自噬特征评分(APCS) (Fig 5A)。APCS由23个自噬相关基因的表达决定。患者被分成高APCS组和低APCS组,截断值为15.77。低APCS的患者 与较好的预后明显相关(Fig 5B - C)。接着作者研究了APCS在预测结肠癌患者辅助化疗疗效中的作用。未接受辅助化疗的患者在APCS低的情况下显示出较高的治疗优势(Fig 5D)。APCS在先前发现的6种分子亚型也表现出显著的差异(Fig 5E)。Kruskal-Wallis检验显示APCS在三种自噬亚型之间有显著性差异。亚型2的APCS中位数较低,而亚型1和亚型3的APCS中位数较高(Fig 5F)。为了更好地确定APCS的特征,对APCS与已知signature之间的相关性进行了检验。APCS与间质活性呈显著正相关,与损伤修复途径活性呈负相关。APCS高的肿瘤间质活性增强,成纤维细胞和内皮细胞浸润增多(Fig 5G - H)。
Fig 6. APCS的预后价值
冲积图显示了结肠癌患者亚型的变化(Fig 6A)。在评估患者预后时,多变量Cox回归显示APCS可能是一个独立的预后生物标记物(Fig 6B)。然后,作者研究了APCS在所有结肠癌队列和TCGA-COAD队列中预测患者预后的作用。在所有GEO队列中,与APCS高的患者相比,低APCS患者的生存期显著延长,包括无复发生存期和总体生存期(Fig 6C-D)。TCGA-COAD队列也证实了低APCS患者和高APCS患者之间的生存差异(Fig 6E)。ROC曲线证实了APCS对所有结肠癌患者预后的预测价值(Fig 6F)。但是,不同微卫星状态之间APCS没有明显差异(Fig 6G)。而侵袭性亚型表现出较低的APCS(Fig 6H)。此外,免疫检查点的表达与APCS呈高度正相关(Fig 6I)。
Fig 7. 自噬相关信号在免疫治疗反应中的作用。
作者接着以TCGA-COAD队列为基础,分析APCS高、低两组的体细胞突变分布差异。高APCS组和低APCS组在突变负荷和突变类型上没有明显差异(Fig 7A-B)。随后,基于两个免疫治疗队列,研究了APCS信号在预测患者对抗PD-1/PD-L1免疫治疗应答中的价值。在抗PD-L1免疫治疗队列中,作者发现与APCS高的患者相比,低APCS患者的临床反应显著增强(26%比16%),生存时间延长(Fig 7C-D)。在低APCS组中,在抗PD-1免疫治疗队列中观察到生存受益趋势(Fig 7E)。低APCS组对抗PD-1免疫治疗的临床反应率显著高于高APCS组(63.6%比40.0%,Fig 7F)。
总结
本文到此全部结束,我们简单总结一下,本文揭示了三种与自噬相关的分子亚型,它们在结肠癌中具有不同的临床结果。作者证明了结肠癌自噬基因可以驱动个体间TME免疫细胞浸润特征的异质性。最后构建了APCS可作为预测患者预后和免疫治疗反应的独立生物标志物。
其实如果你看的文章比较多的话,你会发现这篇文章还有两篇进阶版本,分别是来自Cancer Immunology Research 的“Tumor Microenvironment Characterization in Gastric Cancer Identifies Prognostic and
Immunotherapeutically Relevant Gene Signatures”和来自Molecular Cancer的“m6A regulator-mediated methylation modification patterns and tumor microenvironment infiltration characterization in gastric cancer”,整体思路基本一致。
那为什么后面这两篇能够发到top期刊呢?我的观点是:今天解读的这篇文章的写作如果写得更好一些的话,这篇文章的影响因子可以再往上一个层次。其实这可能也是大家经常忽略的一点,有了分析结果之后,怎么编排结果,让结果形成一个有意思的故事?好马配好鞍,好文就要配好故事嘛。大家不放对比下今天这篇文章和后面这两篇的写作部分,尤其是在各部分结果的衔接上面,尤其是Molecular Cancer这篇文章,写作技巧值得我们学习。
好了,让我们最后回顾一下作者做了什么事,来总结一下这一类文章的主体思路:
1:作者找到了一个特定表型相关的基因集,并阐述了这个基因集的分子特征;
2:利用基因集进行分子分型,得到疾病多个亚型;
3:免疫微环境分析和功能富集分析阐述各个亚型潜在生物学特征,定义各个亚型的整体特征;
4:构建分子标志物;
5:评价新型分子标志物的价值。
好了,本篇文章的拆解到此结束!在本期中,我们一起拆解了一篇分子分型的文章,并且提供了两篇进阶版的范文,同时也对这一类型文章的主干套路进行总结。
后台回复“feng 59”获取代码和数据,我们下期见!
单细胞分析专栏传送门
碎碎念专栏传送门(完结)
风之美图系列传送门(完结)
END

撰文丨风   风
排版丨四金兄
主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~

继续阅读
阅读原文