领略高端套路,发表高分文章!
小伙伴们大家好,我是菠小萝。这里是菠小萝的高分生信SCI解读专栏。感谢作者为我们提供了很好的学习典范!今天带给大家的是一篇套路,于2021年1月发表在《Genomics》上,题目是“Identification of an immune-related RNA-binding protein signature to predict survival and targeted therapy responses in liver cancer”。最新影响因子:6.205。
本篇文章的两位通讯作者分别是西安交通大学第二附属医院肿瘤外科主任医师康华峰,和浙江大学医学院附属第一医院乳腺外科主任医师代志军,同为博士生导师。康华峰主任还任中华医学会临床流行病学与循证医学分会循证医学学组委员、中国研究性医院学会乳腺癌专委会委员、陕西省抗癌协会外科肿瘤专委会副主委等,主持多项科研项目,发表科研论文数十篇。代志军主任担任中华预防医学会循证医学分会方法学组副组长,生物大数据专委会副主任委员以及多个学会常委或委员,同时担任Cancer Medicine、World J Gastroenterol等SCI期刊编委,国际知名期刊Cancer research、Breast Cancer Res Treat、Cancer letters等10余种SCI杂志审稿人,主持多项国家级及省部级重点项目。
我们今天就来学习一下这样重量级的科研团队是如何研究生信的。
期刊简介
“挑圈联靠”题目要素拆解
疾病肝癌(liver cancer,LC);
目的基因:“An immune-related RNA-binding protein signature”——一个基因签名;
数据来源文章题目中未提及;
机制未涉及;
研究目的文章类型):“predict survival and targeted therapy responses”——构建预测模型的预后型生信文章。
知识背景
肝癌(LC)包含多种抑癌基因(TSGs)和致癌基因的遗传和表观遗传改变,以及编码或非编码基因的失调。本篇生信文章的研究目的就是分析出能进一步探究LC肿瘤发生、发展的分子机制,以及改善预后和治疗方法的Biomarker,或者说是一组基因签名。文章中涉及到RNA结合蛋白(RBPs),其特征是能够与RNA相互作用,目前已有1900多种人类RBPs被识别。RBPs可以调节转录后基因表达的调控,如RNA编辑、剪接和稳定性。因此,RBP的失调极大可能影响肿瘤的发生与发展。由于RNA结合蛋白(RBPs)显著的生物学功能,它们的表达情况和活性状态能否提供细胞系统的诸多信息。已经有许多方法用于研究mRNA相互作用蛋白,或者全基因组矩阵和荧光RNA探针对酵母RBPs进行系统的鉴定。并且,采用固定化的RNA探针作为诱饵,在体外捕获特定的RBPs,再质谱检测也是可以的。一些研究表明,RBP IGF2BP1结合并稳定c-MYC和MKI67,并在LC的癌变过程中发挥重要作用。RBP RBM38可引起LC细胞凋亡,并通过稳定p53-mdm2环功能抑制增殖、迁移和侵袭。并且RBPs被认为是免疫系统中重要的调节因子,可能参与肿瘤微环境(TME)中的免疫调节。此外,RBPRBPs已被报道在许多疾病的发展中发挥关键作用,包括癌症。其异常表达与癌症患者的预后密切相关。并且本篇范文除了常规生信分析中的“挑、圈、联、靠”,其研究重点放在了细胞层面以及靶向治疗反应上,还分析了活细胞中发生的RBPs和非生理状态下的RNA-蛋白结合体。由此,鉴定出一种免疫相关RNA结合蛋白特征,为预测肝癌的生存期和靶向治疗反应提供新思路。
数据来源 & 思路框架
本文总共收集了600例LC患者的记录,其数据来源包括TCGA-LIHC数据集的371例LC患者以及ICGC数据库的229例LC患者的转录组数据和临床信息,用于外部验证。作者从中提取了1869个RBPs和1294个IGs,利用可用的mRNA表达谱进行后续分析。
除了基因表达谱和临床数据,当然还要更加丰富一点,作者选择了细胞层面的研究。生信分析几乎无所不能,即便是细胞层面,同样有大数据支持。作者就是通过CCLE数据库获取了25种不同类型的LC细胞株的基因表达数据,以探究LC细胞中RBPs的基因表达水平在374份LC样本和50份正常样本中,通过差异分析筛选了可能导致LC发生的差异表达RBPs。然后就是大家非常熟悉的肿瘤浸润性免疫细胞的估计和富集分析。当前正是分子靶向药物飞速发展的时代,如果加上靶向治疗疗效的预测,那岂不是审稿人最爱的地方!就如同本篇范文中比较了包括接受抗PD-1或抗CTLA4治疗患者在内的高风险和低风险组的表达谱,由此获得预测靶向治疗疗效的相关基因签名。
数据精析
一、“”——差异分析
第一步:鉴定肝癌患者免疫相关的RBPs
本项研究总共收集了600例LC患者的临床信息和转录组数据,以371例TCGA- LIHC数据集作为训练集,以229例ICGC-LIRI-JP数据集作为验证集。从中提取了1869个RBPs和1294个免疫相关基因(IGs)。在374个LC样本和50个正常样本之间进行差异分析,以|log2FC| > 1,adj.P<0.05为阈值,共鉴定出627个可能导致LC发展的差异表达RBPs(上调的RBP 618个,下调的RBP 9个)(图1)。通过Pearson相关性分析,以P<0.01,|R| > 0.5为阈值,从627个差异表达的RBP中鉴定出559个免疫相关的RBP。在这里作者给出了一个热图。
第二步:构建和评估免疫相关的RBPs特征
接下来,就是进一步缩小差异基因的范围。作者是通过单因素分析筛选376例具有预后价值的免疫相关RBPs 559例(P<0.05)。通过LASSO回归分析,筛选出19个rbp(图2a)。最后,通过多因素分析确定出8个免疫相关的RBPs来构建预后特征(图2b)。
(图2a-b)
二、“”——构建分子共表达网络
为探讨8个RBP基因潜在的免疫功能,探讨其调控机制。作者分析了包含8个rbp和217个IGs之间的343对相互作用,构建共表达网络。并计算风险评分,以TCGA队列患者根据中位风险评分分为高危组和低危组。
三、“”——生存分析及临床相关性
第一步:高、低风险组间生存分析
作者根据上述得到的风险评分,以中位值将患者分为高、低风险组。高危组患者的总生存期(OS)较差(P < 0.0001;图2 c)。1年OS的AUC为0.795,3年为0.727(图2d)。随后,作者在ICGC验证队列评估其性能得到同样的结果,高危组患者的生存率低于低危组(P = 0.0008;图2e)。ICGC队列中,1年和3年的AUC分别为0.751和0.693(图2f)。此外,为了验证基因签名诊断性能,作者对TCGA和ICGC的合并数据集进行了验证。结果显示合并的数据集中,高危组患者的生存率低于低危组(P<0.0001;合并数据集1年和3年的A分别为0.775和0.707。
(图2c-f)
此外,作者还分析了TCGA队列中高危组8种免疫相关RBPs的表达水平,结果显示显著高于低危组(图3,P<0.001)。作者还从Cancer cell Line Encyclopedia (CCLE) 数据库中提取了25个不同类型的LC细胞株的基因表达数据,进一步分析了这8种RBPs在25株不同类型的CCLE LC细胞系中的mRNA表达情况。
(图3)
第二步:临床相关性
接下来,就是分析几种临床病理特征的预后价值。作者通过单因素及多因素回归分析表明,风险评分是TCGA队列中OS和PFS的独立预后指标(P<0.001);此外,ROC分析显示,免疫相关RBP特征的敏感性和特异性高于其他临床病理特征(图4a)。这些结果表明,该特征可以作为预测LC患者生存的预后指标。
并且作者通过构建列线图来预测LC患者的OS和PFS。预测OS的指标为风险评分、肿瘤分期、T分期、M分期(图4b),预测PFS的指标为风险评分、肿瘤分期、T分期(图4c)。TCGA队列中1年OS、3年OS、1年PFS和3年PFS率的校正曲线显示,预测结果与实际结果之间具有良好的一致性。两个列线图预测OS和PFS的auc分别为0.806和0.766,C-指数分别为0.750和0.714,具有可接受的判别性。这些结果表明我们的列线图是稳定的,适合临床应用。
(图4)
四、“”——肿瘤微环境免疫浸润分析及富集分析
第一步:免疫浸润分析
接下来就是大家期待的免疫浸润分析,首先,作者计算了免疫评分,结果显示高危组和低危组的TME低危组显著高于高危组,而高危组与低危组间基质评分和估计评分差异无统计学意义(P>0.05;图5)。随后,作者通过比较高危组和低危组间肿瘤微环境(TME)中的免疫细胞浸润,以表征高危和低危人群的免疫环境(图5b)。结果显示,B细胞、CD8+T细胞、细胞毒细胞、Treg细胞、树突状细胞、肥大细胞、嗜酸性粒细胞、中性粒细胞、NK细胞丰度显著高于低危组(P<0.05;图5c)。
(图5)
第二步:高危和低危人群的富集分析和基因组突变
GSEA显示KRAS、E2F靶点和G2M检查点信号通路(调整p值<0.01,图6a)在高危组中高度富集。并且发现E2F靶点和G2M检查点在高危人群中高度富集。而有研究报道E2F靶点和G2M检查点通路是细胞周期过程中重要的信号通路,对癌症的进展至关重要。总之,来自TCGA的高、低风险LC患者在生物过程、TME和基因组变化方面存在显著差异。
高危组和低危组突变频率最高的前30个基因如图6b和c所示,高危组和低危组的突变基因和突变频率不同。高危组的总突变频率高于低危组(93% vs. 86%)。高危组的TP53 (TSG位于P53通路)突变频率明显高于低危组(46% vs. 14%)。高危组中Wnt通路癌基因CTNNB1的突变频率低于低危组。RB1(细胞周期通路中的TSG)在高危组中发生突变,而在低危组中未发生突变。
(图6)
第三步:高危和低危患者的靶向治疗和免疫治疗反应
这一部分为药物敏感性分析,是文章中比较出彩的地方,非常值得我们学习。作者研究了高、低风险患者对靶向治疗的反应。结果表明,36种靶向治疗药物的估计IC50在高危和低危患者之间存在显著差异。提示高危患者对36种靶向治疗药物的敏感性高于低风险患者。不幸的是,没有观察到高危和低风险患者与抗PD-1或抗CTLA4免疫治疗应答的显著相关性(P>0.05)。
全文总结
本篇范文目的是探究分析出一个创新的与免疫相关的RBPs特征基因签名。通过“挑、圈、联、靠”分析出LC亚群的差异基因,进一步筛选免疫相关的基因集和确定签名;富集分析其生物学过程、TME、基因组改变和治疗反应,来确定预测LC患者对靶向治疗更敏感的RBPs特征基因签名。思路非常清晰,从“挑、圈、联、靠”四个层面分析问题,一步步筛选出RBPs特征基因签名。最终获得8个与免疫相关和预后相关的RBPs (FBLL1、EIF2B4、MAP2、KHDRBS3、EZH2、LGALS3、NDRG1和MEX3A),通过构建这样一组基因签名,能够预测LC患者预后的风险信号。这8种RBPs在LC中较正常组织表达上调,在高危组中表达水平较高。其中EZH2、LGALS3和NDRG1已被报道有促进LC发展的功能。并且在作者的研究中,同时发现NDRG1与一些免疫相关基因共表达。而FBLL1、EIF2B4、MAP2、KHDRBS3和MEX3A在LC中的生物学功能和机制尚未被研究,也是这篇范文的创新性所在。
本篇范文中必要的分析全部都包含在内,都是我们平时推文中讲到的素材。并且还涉及到了药物敏感性分析,以及患者对靶向治疗的反应,这里大家也可以学习,找到一些治疗相关的数据集,把临床信息挖出来分析一下就可以了呢。这一部分如果想要进一步学习,可以在文末留言哦~
好啦,菠小萝今天的分享就到这里了~我们下周再见啦,拜拜!
通讯作者简介:
康华峰,西安交通大学第二附属医院肿瘤外科主任医师,博士生导师。中华医学会临床流行病学与循证医学分会循证医学学组委员、中国研究性医院学会乳腺癌专委会委员、陕西省抗癌协会外科肿瘤专委会副主委、陕西省抗癌协会肿瘤综合治疗专委会副主委、陕西省抗癌协会肿瘤热疗专委会副主委、陕西省保健学会乳腺疾病专委会副主委、陕西省医学会临床流行病学与循证医学分会常委兼秘书、陕西省预防医学会肿瘤防治专委会常委、陕西省老年学会肿瘤专委会常委、陕西省抗癌协会乳腺癌专委会常委、陕西省医师协会甲乳医师专委会常委、陕西省医师协会结直肠医师专委会常委、陕西省医学会肿瘤学分会委员、陕西省医学会临床免疫学分会委员等。主持科研项目6项,获得陕西省科学技术奖4项,发表科研论文50余篇。
代志军,浙江大学医学院附属第一医院乳腺外科主任医师,博士生导师,博士后合作导师,浙江大学临床名师。担任中华预防医学会循证医学分会方法学组副组长,浙江省数理医学会循证医学专委会主任委员,生物大数据专委会副主任委员以及多个学会常委或委员,Cancer Medicine、World J Gastroenterol等SCI期刊编委,国际知名期刊Cancer research、Breast Cancer Res Treat、Cancer letters等10余种SCI杂志审稿人。在国内外知名期刊发表论文120余篇,其中SCI收录80余篇。目前主持国家自然科学基金2项、省重点项目2项及多项省市课题。获国家发明专利授权5项。荣获省级青年科技奖、青年科技标兵等殊荣。获省高校科学技术一、二等奖6项,省科学技术奖4项。
参考文献
[1] Yang S, Lin S, Liu K, Liu Y, Xu P, Zheng Y, Deng Y, Zhang D, Zhai Z, Li N, Ren X, Dai Z, Kang H. Identification of an immune-related RNA-binding protein signature to predict survival and targeted therapy responses in liver cancer. Genomics. 2021 Jan 29;113(2):795-804. doi: 10.1016/j.ygeno.2021.01.021. Epub ahead of print. PMID: 33524497.
往期传送门
重磅最新消息!DeepMind首次突破蛋白折叠的历史难题,这项AI技术能否成为生信领域的下一匹黑马?
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END

撰文丨菠小萝
排版丨四金兄
值班 | 弘   毅

主编丨小雪球
长按识别二维码免费包邮领取!

继续阅读
阅读原文