单基因预后生信分析无代码复现!
HELLO,大家好,我是夺命小书生,今天给大家带来的是一篇单基因生信分析的文章,文章的题目是‘Exonuclease 1 is a Potential Diagnostic and Prognostic Biomarker in Hepatocellular Carcinoma’发表于 ‘frontiers in Molecular Biosciences’杂志,2022年最新的影响因子是6.113分

0.期刊信息
1.全文总览
本文涉及10张图片,4张表格。
Figure1 EXO1在包括肝癌的多种肿瘤中显著上调
Figure2 HCC中基于EXO1的差异表达基因进行富集分析
Figure3 HCC中免疫细胞浸润与EXO1表达的相关性分析
Figure4 HCC中EXO1、CTLA-4、PDCD-1、TP53表达水平的相关性分析
Figure5 EXO1基因的DNA甲基化水平与HCC患者的预后相关。
Figure6 EXO1基因的改变与HCC的生存结果无关。
Figure7 EXO1的表达水平与HCC患者的多种临床病理特征相关
Figure8 EXO1对HCC患者具有较高的预后预测价值。
Figure9 使用EXO1的列线图模型在HCC中具有优越的诊断和预后性能。
Figure10不同HCC患者亚组中EXO1表达的预后表现。
Table1 EXO1基因CpG位点甲基化水平对HCC患者预后的影响。
Table2 EXO1基因高、低表达水平的HCC患者的临床病理特征。
Table3 HCC患者临床病理特征与EXO1表达水平关系的逻辑回归分析。
Table4 基于Cox回归分析,EXO1对HCC患者亚组临床结局的预后表现。
2.复现工具
仙桃学术:  https://www.xiantao.love
MethSurv:  https://biit.cs.ut.ee/methsurv/
cBioportal:  https://www.cbioportal.org/
3.全文复现
Figure1
图1是表达差异,首先是在TCGA数据库中的泛癌分析,在仙桃学术的网站上,我们选择表达差异-表达差异-非配对样本,疾病选择泛癌,分子选择EXO1,项目中选择XENA-TCGA
确认之后就可以得到一样的图片了,之后可以选择pdf或者tiff格式下载。
图B-E是geo数据集中的表达差异分析,方法都是一样的,我们这里就不一一展示了,就以图B为例,选用的是GSE46408数据集。我们首先可以在数据集模块进行检索,
然后选择样本,将样本加入样本库
根据Source name中的样本类型进行分类后,提交分析
一两分钟之后,我们选择下载结果中的表达谱数据
然后在其中找到我们的目的基因EXO1,提取表达值并进行整理。
将整理好的数据上传到基础绘图-分组比较图,选择箱式/柱状图,就可以得到和作者一样的图片啦
(PS.图F是用临床的患者数据,应该就无法复现啦)
图G是TCGA数据库中EXO1表达差异的火山图,首先,我们选择表达差异-差异分析-单基因差异分析,首先进行分析
然后在历史记录中下载结果
选择其中的这四列数据
然后上传到差异分析-火山图,,基本参数选择,logfc> 1.5,p小于0.05就可以得到结果啦
图H是相关性的分析,我们只需要在交互网络-分析相关性分析 -单基因共表达热图中选择肝癌,然后输入目的分子,以及相互作用的分子,确认即可一步出图
Figure2
图二是GO/GSEA富集分析的图片,首先我们进行单基因差异分析,按文章中的筛选标准筛选出DEGs(PS.作者选择的DGEs是protein-coding编码蛋白,如果没选这个数量会不一样)
进入功能聚类-GO|KEGG富集分析,我们将得到的差异基因输入到分子列表,富集分析选择全部GO条目,得到结果后保存。
我们进入GO|KEGG可视化,然后找到我们刚刚保存的结果123,然后类型选择气泡图,方法选择分面,就可以啦。
图B-M是GSEA富集分析的结果,我们再回到单基因差异分析的结果,GSEA富集分析需要保留基因名和LogFC值,然后将文件上传到功能聚类-GSEA富集-GSEA分析,参考的数据集选择c2.cp.v7.2.symbols.gmt [Curated]。
然后在GSEA可视化中,基因集ID中依次输入我们想要的的基因集ID就可以啦
Figure3
图三是EXO1的免疫浸润情况,首先是棒棒糖图,我们选择交互网络-免疫浸润-棒棒糖图,选择肝癌,输入分子,然后调整一下XY轴以及文本的角度,就可以啦
剩下的都是分组比较图,我们选择免疫浸润-分组比较图,类型选择点图,然后依次换算法参数中的细胞就可以啦~这里以图B为例
Figure4
图四是相关性的散点图,只需要选择交互网络-分子相关性分析-散点图选择肝癌,然后基因A选择EXO1,更换基因B即可获得A-C的图片啦
Figure5
图5是一个看着很炫酷的甲基化的热图,但是可以在网站上一键出图也是非常的方便,进入网站后MethSurv后按照下面进行选择,之后点击browse in ClusVis即可,这个网站会有一点考验网速~我试了挺久的
刚加载进去就报错了,然后大家体谅一下,就大概效果是一样滴
Figure6
图六是使用cBiopotal网站制作的,首先我们登录网站按照作者的选择选择数据集
然后输入基因选择Submit
随后在oncoplot中即可看到图A的内容
随后我们进入Survival板块,分别选择OS和DFS就可以分别得到图B和图C
Figure7
图7是EXO1的临床相关性,我们只需要依次改变下面的参数,以图A为例,选择RACE,然后分别选择normal,Asian,White.就可以得到一样的图啦
Figure8
图8是预后的KM曲线图,我们选择临床意义-预后分析-KM曲线图,分别选择预后参数中的预后类型为OS,PFI,DSS,风险表格中,三个都选中,就可以得到图A-C啦~这里以OS为例
Figure9
图A是ROC曲线图,我们选择临床意义-ROC曲线,曲线下面积悬择显示,就可以得到结果啦
图B是一年三年五年的时间依赖性的ROC,我们选择3临床意义-预后分析-时间依赖ROC,预测年限分别选择1年,3年,5年。曲线下面积选择显示,就可以啦
图C是nomogram图,我们选择临床意义-预后分析-预后列线图,按照文中的参数输入好,预测年限同样是1年,3年,5年
Figure10
图10分别是EXO1高低表达对OS,DSS,PFI的COX的回归分析做的森林图,做法都是大致一样的,我们以第一个OS为例。
首先我们选择预后分析-亚组KM,这里我们输入RACE,后面选择Black or African American,white.然后运行之后得到一个km曲线,就可以得到EXO1高低表达在该分组的HR以及p值。
然后我们依次调整亚组,分别得到HR以及p值,之后在excel中进行整理。这里我用的方法有点繁琐,需要来回的做比较耗时间,不知道小伙伴们有没有更好的方法进行复现~
然后将整理好的文件上传到,基础绘图-森林图,就可以得到结果啦~
这里看到字有点重叠,我们调整图片的宽度,宽一点就好啦~
Table1
这里是关于EXO1甲基化位点的预后曲线,我们在MethSurv网站中选择All cancers,找到LIHC就是肝癌中的甲基化位点的预后KM,我们将数据下载下来整理成三线表即可
Table2
表2是患者的基线资料表,我们选择临床意义-基线资料表选择好肝癌,以及EXO1,然后在分类变量中选择文中的变量,确认之后即可。
Table3
表三是Logstic回归分析,选择临床意义中的Logistic回归,输入变量之后确认
然后在结果部分直接输出Word三线表即可
Table4
表4是分别对OS,DSS,以及PFI的单因素以及多因素的HR,我们选择临床意义-预后分析-单/多基因COX回归分析,选择好参数
然后依次调整参数中的类型OS/DSS/PFI
将得到的结果进行三线表下载,之后将三次的结果进行整理就可以啦~
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END
撰文丨夺命小书生
排版丨四金兄
主编丨小雪球
继续阅读
阅读原文