分分钟搞定6分+单基因联合免疫浸润的预后套路生信文章
小伙伴们大家好,我是菠小萝。今天为大家复现一篇2020年10月发表在《Front Oncol》(影响因子:4.848)上的单基因联合免疫浸润的预后套路生信文章。题目是“HTRA3 Is a Prognostic Biomarker and Associated With Immune Infiltrates in Gastric Cancer”。感谢作者为我们提供了很好的学习典范!
期刊简介
“挑圈联靠”题目要素拆解
疾病胃癌;
目的基因HTRA3;
数据来源TCGA;
研究目的(文章类型单基因联合免疫浸润的预后套路生信文章。
知识背景
本篇范文涉及到的是胃癌,由于胃癌是一种异质性恶性肿瘤,尽管在治疗上通过手术、化疗、放疗和免疫治疗可以有治愈的可能,但二期和IIIA期胃癌患者的五年生存率分别约为34%和20%。关于胃癌分子靶向治疗的研究还有很大的挖掘空间,作者也是由此出发,分析可能涉及到的发病机制,以及有助于改善胃癌患者预后的因素。作者发现HtrA丝氨酸肽酶3 (HTRA3)在先前的研究中证实,该基因可能通过降解细胞外基质蛋白多糖,间接抑制TGF-β家族蛋白介导的信号传导。另有研究表明HTRA3可能作为肿瘤抑制因子,促进肺癌细胞中药物诱导的细胞毒性效应的促凋亡蛋白酶表达。以及其他一些研究报道过表达的HTRA3抑制TGFb1的致癌作用,从而抑制非小细胞肺癌早期的转移。如此种种,作者就利用从TCGA数据库检索的RNA测序数据,通过差异分析、富集分析、免疫浸润等分析来逐步挖掘HTRA3在胃癌中的作用的意义。
数据来源 & 思路框架
HtrA丝氨酸肽酶3 (HTRA3)参与多种信号通路,在多种恶性肿瘤中发挥重要的调节作用。然而,其在胃癌预后和免疫浸润中的作用仍不清楚。范文即分析了HTRA3在肿瘤组织中的表达及其与免疫浸润的关系,其在胃癌患者中的预后作用。胃癌患者是从癌症基因组图谱(TCGA)中收集的,先是差异分析比较胃癌组织和正常胃粘膜组织中HTRA3的表达,Cox回归分析HTRA3与临床病理特征的关系。富集分析包括GO/KEGG/GSEA富集,并量化HTRA3的免疫细胞浸润程度。Kaplan-Meier分析和Cox回归用于评估HTRA3和生存率之间的相关性。接下来是基于Cox多变量分析的列线图用于预测HTRA3对预后的影响。随后HTRA3的表达与适应性免疫细胞(T辅助细胞17细胞)的丰度呈负相关,与先天免疫细胞(自然杀伤细胞,巨噬细胞等。).HTRA3在胃癌进展和预后中起着至关重要的作用,可能是预测胃切除术后生存率的中度生物标志物。
复现任务
▲ 图1. HTRA3在泛癌中的表达差异及共表达差异表达基因。
▲ 图2. HTRA3相关基因的富集分析。
▲ 图3. HTRA3的表达水平与肿瘤微环境中的免疫浸润的相关性。
▲ 图4. HTRA3表达的临床相关性分析。
▲ 图5. Kaplan-Meier法分析HTRA3高表达和低表达组间的生存差异。
▲ 图6. 预测胃癌患者1、3、5年预后生存的模型构建。
▲ 表1. HTRA3高表达和低表达组间的基线资料差异分析。
▲ 表2. HTRA3表达与临床病理特征的关系(Logistics回归)
▲ 表3. 单变量及多变量Cox回归分析影响胃癌患者总生存的预后因素。
复现工具
仙桃学术工具
https://www.xiantao.love/products
GEPIA数据库(彩蛋)
http://gepia.cancer-pku.cn/
数据精析
一、“”——表达差异
1

HTRA3在泛癌中的表达差异
首先,在图1A中作者展示了HTRA3在TCGA数据库泛癌中的表达差异。我们可以通过仙桃学术工具中“表达差异(挑)-非配对样本”模块进行复现。
选择“疾病-泛癌”。
因为有的癌种的正常样本数不够,用GTEx数据库的正常样本补足,将TCGA与GTEx数据库联合分析。如果大家选择XENA-TCGA-GTEx泛癌数据。参数部分的类型选择-箱图/柱状图,输入目的基因HTRA3。点击确认。
随后,我们可以下载结果图片。
2

HTRA3在胃癌与正常组织间的表达差异
随后,作者在图1B-C中展示了TCGA-STAD数据集和GTEx数据库中比较了32个癌旁样本和375个癌旁样本中HTRA3的表达差异。并且还包括非配对样本和配对样本。这一部分可以通过仙桃学术生信工具中“表达差异”模块轻松复现。
首先,在“非配对样本”分析模块中,由“选择数据集-输入目的基因-调节分析/图片参数-分析结果”的步骤进行分析。
(1)选择数据集
(2)选择“组合图”
(3)输入目的基因
(4)调整颜色
(5)分析结果
随后,在“配对样本”分析模块中,由“选择数据集-输入目的基因-调节分析/图片参数-分析结果”的步骤进行分析。
(1)选择数据集:前面我们也有介绍过因为有的癌种的正常样本数不够而GTEx数据库的正常样本可以弥补这一方面的不足,将TCGA与GTEx数据库联合分析。在数据格式的选择上一般建议用TPM格式。我们处理TCGA基因表达谱数据最常用的方法,就是是将FPKM (Fregments Per Kilobase per Million) 格式的RNAseq数据转换成了TPM (transcripts per million reads) 格式,并进行log2转化后进行样本间的表达比较。TCGA数据库中基于不同的平台有不同的格式,RNAseq平台有FPKM和TPM格式;miRNA平台有RPM格式。
(2)输入目的基因
(3)调整颜色
(4)分析结果
3

差异分析
在图1E中展示了差异分析的火山图,用于可视化差异结果。
根据基因表达中位值分组的差异基因分析需要在仙桃学术“差异分析-[云] 单基因差异分析”模块进行。依次“选择数据集-输入目的基因-规定分组方式-调整参数-分析结果”
(1)选择数据集
(2)输入目的基因
(3)分组方式:分组方式一般就以中位值分组就可以了
(4)数据信息:一般默认即可。
(5)分析结果
然后,我们可以前往“历史结果”中下载分析列表。
 火山图绘制 
(1)选择数据:首先选中“云端数据”,这里有我们刚刚分析过的差异结果,选中即可。
(2)阈值设置:差异变化倍数可以根据自己的数据结果来进行调整,一般1-2均可。显著性阈值一般为0.05,严格的话可以到0.01/0.001。还可以选择标注哪些比较重要的基因,或是相关性强的基因。
(3)颜色设置
(4)点的设置
(5)分析结果
另外,作者还收集了自己的临床数据,是44对人胃癌样本和距肿瘤样本至少5厘米的癌旁胃组织。所有病例均经病理证实。以及五种人胃癌细胞系(SGC7901、BGC823、MGC803、HGC27和MKN45)和一种永生化正常胃细胞系(GES1)。从这些标本中获得总RNA和蛋白质做了PCR和Western。
二、“”——富集分析
接下来,作者对差异基因进行了富集分析。我们可以利用仙桃学术“圈”这一大分析模块进行复现。
1
GO/KEGG富集分析
首先是GO/KEGG富集分析,需要准备如下格式的文件,就是一列差异基因。
(1)输入文件准备
下图是我们差异分析的结果列表,从“历史结果”中可以下载。我们将第一列提取出来整理成一个新的文件。
(2)输入整理好的文件
(3)分子列表:上传数据后自动识别到其中。
(4)类别
(5)分析内容设置
(6)分析结果:这里我们还需要保存结果,后面才可以进行可视化。
接下来是结果可视化
进入分析模块后勾选刚刚的富集分析结果
可视化的样式及颜色等都可以通过参数设置。
分析出结果,可视化结果如下,虽然不太与原文一致,但生信分析由于都诸多因素,并不能完全的
2

GSEA富集分析
然后是GSEA富集分析,首先看一下示例数据,第一列是基因名,第二列是差异倍数。我们需要把之前的差异分析结果列表整理为如下格式,并且注意是所有基因的差异分析结果,不需要进行阈值筛选的。
(1)上传数据
(2)选择富集数据集:GSEA分析包含了众多数据集,分析工具中包含的就是来自于MSigDB Collections数据库中的参考基因集合,从基因功能、位置,表达量变化趋势等多重角度进行富集分析。基于人类基因,从位置,功能,代谢途径,靶标结合等多种角度出发构建出的不同基因集合,划分为H和C1-C7八个Cluster。C2类别数据库收录了已经确定的具有重要生物学和临床状态特征的基因集信息。并且包含BioCarta、KEGG、Matrisome Project、Reactome等在内的Pathway数据集。因此,我们推荐选择默认的包含2232个子数据集的“c2.cp.v7.2.symbols.gmt”集和进行富集分析。
(3)高级参数:一般默认即可。
(4)分析结果
接下来就是分析结果的可视化,我们选择下图中的模块,选中后会自动读入刚刚的分析结果。
在选择展示哪个富集结果时,我们可以自行输入富集的ID,下图中红框中圈出的都是富集ID的名称。
输入到下图中ID列表中即可进行结果展示。
如果输入单个ID即展示1条曲线,如果想要展示多条富集结果,可以获得多条富集结果的联合GSEA富集结果,最多可以展示5条。
三、“”——分子交互及相关性分析
1

免疫浸润分析
图3A作者展示了24种免疫细胞相对丰度与HTRA3表达水平的相关性。这里我们可以通过仙桃学术“免疫浸润”模块分析。
(1)选择棒棒糖图
(2)选择数据集、输入目的基因
(3)选择算法参数:我们这里一般选择所有的免疫细胞即可,方法即ssGSEA。
(4)分析结果
2

分子表达高、低分组与免疫细胞的差异性
范文图3B-D展示了以HTRA3表达中位值分为高、低表达组,组间免疫细胞的差异性。我们以NK细胞为例进行复现展示。
需要用到的是“免疫浸润-[云] 分组比较图”这个模块。
(1)选择数据集、输入目的基因
(2)选择图片样式
(3)参数设置
(4)分析结果
3

分子表达高、低分组与免疫细胞的相关性
范文图3E-G展示了以HTRA3表达中位值分为高、低表达组,组间免疫细胞的相关性。我们以NK细胞为例进行复现展示。
需要用到的是“免疫浸润-[云] 散点图”这个模块。
选择数据集、输入目的基因、参数设置等方式与前一致,我们可以个性化设置图片风格,就是范文展示的散点图为例。
(1)描边色
(2)填充色
(3)拟合线
(4)CI展示
(5)分析结果
四、“”——生存意义
1

ROC曲线预测HTRA3对于胃癌诊断/预后的预测性能
图1D 是以HTRA3表达中位值分为高、低表达组,使用接收机工作特性(ROC)曲线来估计组间差异性能。由“选择数据集-输入目的基因-调整图片风格等参数”的操作顺序进行。
(1)选择数据集
(2)输入目的基因
(3)设置曲线颜色
(4)展示曲线下面积
(5)分析结果
2

临床相关性分析
作者在图4中以箱式图展示了HTRA3表达和临床病理特征的相关性,包括组织学类型,组织学分级,病理分期,TNM分期,TP53状态,残余肿瘤和治疗结果。我们可以利用仙桃学术“[云] 临床相关性”模块进行复现。我们这里以T分期为例展示复现方式。
(1)选择数据集
(2)选择展示形式
(3)输入分子
(4)选择临床变量:纳入需要分析的临床变量及需要展示的亚组。
(5)调整参数:可以设置点、箱的大小、颜色、透明度等。
(5)分析结果
3

基线资料表
作者在表1中展示了基线资料表,是以HTRA3中位值分组进行的列联表分析。我们可以通过仙桃学术“基线资料表”来进行复现。
我们需要依次选择数据集-输入目的基因-选择“列联表”分析-纳入分析的临床变量-调节参数的步骤进行分析。
最后可以得到如下结果,下载即可。
4

存分析
作者在图5中展示了Kaplan-Meier生存曲线,比较HTRA3高表达和低表达的生存差异。图5A–C展示了高HTRA3和低HTRA3胃癌患者的OS、DSS和PFI生存曲线。我们可以利用仙桃学术“[云] KM曲线图”模块进行分析。我们以总生存OS为例演示复现方法。
(1)选择数据集-输入分子-调整参数
(2)预后参数:选择分析的预后类型,这里以OS为例,我们还可以分别进行分析,展示结果,如同范文。
(3)分析结果
(5)预后模型构建和评估
作者在表3中展示了通过多变量Cox逻辑回归分析临床病理特征与HTRA3的关系。需要用到仙桃学术“[云] 单因素|多因素Cox回归”模块。
多变量Cox分析比较了HTRA3表达对生存率的影响以及其他临床特征(分期、肌层浸润、淋巴结状态、远处转移状态、组织学分级和亚型)。我们依次选定数据集、预后参数、纳入临床变量及需要分析的亚组。
分析结果如下图所示,整理成三线表即可。
接下来,作者在图6中展示了基于Cox回归模型,从多变量分析中获得的独立预后因素用于建立列线图和校准图,对1年、3年和5年的预测生存概率进行个体化。可以通过仙桃学术的“[云] 预后Nomogram图”和“[云] Calibration分析”模块进行复现。
 Nomogram图 
首先,在选定数据集后,设置预测年限为1、3、5年。然后是临床变量及亚组的选择。
大家可以根据自身情况调节其他参数,然后点击确定,分析结果如下。
 Calibration图 
同样,选定数据集后,设置预测年限。
接下来选择预后变量。
分析结果。
然后选择可视化模块。
可视化如下图所示。
5
Logistics回归分析
作者在表2中展示了HTRA3表达与临床病理特征的关系,运用的是Logistics回归分析。我们可以通过仙桃学术“”模块进行复现。logistic 回归也称为 logit 模型,是对分类变量进行回归分析时最为常用的一种方法。总的来说,是以目的基因中位值分为高、低表达组,分析多个临床分类变量对结局的影响。
点击“确认”进行分析,随后我们可以下载结果列表如下,整理成三线表即可。
分析结果包括了Characteristics;Odds Ratio in gene expression;Odds Ratio(OR);P-value。logistic回归结果解读中最重要的部分就是OR值,也就是通过优势比(odds ratio,OR)这一广为人知的指标,使得疾病发生危险不再仅是一个理论层面的概念,而是一个可以理解的危险程度。
本篇范文通过差异分析、富集分析、免疫浸润等分析来逐步挖掘HTRA3在胃癌中的作用的意义。我们利用仙桃学术的各种分析模块及网络平台复现了全文的生信相关的数据及可视化。感兴趣的小伙伴可以多多关注仙桃学术,挖掘更多的分析方法呢!
后台回复“210602”获取范文全文吧~我们下期再见啦!拜拜!
参考文献
[1] Ji C, Sun LS, Xing F, Niu N, Gao HL, Dai JW, Zhou N, Jiang BC. HTRA3 Is a Prognostic Biomarker and Associated With Immune Infiltrates in Gastric Cancer. Front Oncol. 2020 Dec 23;10:603480. doi: 10.3389/fonc.2020.603480. PMID: 33425760; PMCID: PMC7786138.
往期传送门
重磅最新消息!DeepMind首次突破蛋白折叠的历史难题,这项AI技术能否成为生信领域的下一匹黑马?
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END

撰文丨菠小萝
排版丨四金兄
主编丨小雪球
继续阅读
阅读原文