1、文章亮点
今天小编用发文献神器——仙桃学术,来给大家复现一篇单基因文章,文章于今年1月发表于Journal of Cancer,影响因子4.478。
虽然作者也补充了一些实验,但生信部分内容还是足够丰富的,常规差异富集分析和免疫学都有,还是很好的入门小白学习模板。单基因零代码,性价比还是蛮不错的!
下面我们就用仙桃,点点鼠标,对生信部分图表一一进行复现。
2、结果复现
 Figure 1  | TIMER、TCGA和GEO数据库中E2F2 mRNA在CRC的表达模式
登录TIMER2.0:http://timer.cistrome.org/
选择“Cancer Exploration”——“Gene_DE”模块,输入分子,点击“Submit”提交分析,即可得到Figure 1A
接下来,我们可以利用仙桃工具通过点点点实现复现
进入仙桃学术主页:
https://www.xiantao.love/,点击“生信工具”。
选择高级版(由于高级版功能最为全面,这里统一使用高级版作为示范)。
首先我们来复现E2F2在结直肠肿瘤和正常组织中的差异表达分析:
我们在生信工具中选择差异分析
根据文章,TCGA-COADREAD数据集中的647个结直肠腺癌组织和51个结直肠正常组织的RNA-seq数据是非配对样本,再选择结直肠癌,勾选TCGA-COADREAD的FPKM格式的RNA-seq数据。
再在右边栏根据作图需要,输入你要研究的分子,类型选择组合图,去掉点图,最后得到箱线图和小提琴图叠加的Figure 1B
统计分析方法系统会自动判断。最后就会得到和文献中一样的图了。
同理,可复现Figure 1C—I。
 Figure 3  | E2F2在CRC中的诊断和预后价值
KM曲线这里,作者用了PrognoScan数据库,进入
PrognoScanhttp://dna00.bio.kyutech.ac.jp/PrognoScan/,输入目标分子E2F2
Figure 3C为例,选择文献中使用的不同阶段结肠癌样本数据集GSE17537进入结果界面:
可以得到所需要的预后DSS曲线:
也揭示出E2F2表达下调是CRC患者预后不良的一个危险因素。
同理,可复现Figure 3A—B,以及OS和DFS。
研究者为了进一步证明E2F2的表达与预后之间的重复性和可移植性,也根据TCGA-COADREAD数据集进行了KM生存曲线分析。
正好我们的仙桃也可以轻松做KM曲线分析,
如下图所示:

选择自己需要的参数,预后模型,可选择OS、PFI和DSS,
鼠标轻轻点三下,Figure 3D—F就出来了。
接下来应用ROC分析评估E2F2 mRNA表达水平对区分结直肠腺癌和正常组织的有效性,仙桃也可以轻松点击完成。
如此得到Figure 3H, E2F2可以作为CRC患者的一个很好的诊断性生物标志物。
为了给后面的富集分析提供基础数据,我们先用仙桃做一下单基因差异分析。
下载表格:
 Figure 4  | 在TCGA-COADREAD数据集中,对CRC组织中与E2F2相关的基因进行Go和KEGG富集分析
接下来复现Figure 4A,打开刚才做差异分析时下载的Excel表格,根据文献中的条件|logFC| > 1, P.adj < 0.05对基因进行筛选:
首先做富集分析。
在左侧选择“功能聚类”下的“GO|KEGG”——“GO|KEGG富集分析”。上传刚才的差异表达基因列表,选择全部GO条目,“富集分析条目”根据Figure 4A选择“GO:BP",点击“确认”。
一定记得确认后在线保存结果,才能进行下一步:得到可视化结果。
下一步是得到富集分析可视化结果。
在“历史记录”中下载Excel完整版结果。

在左侧选择“功能聚类”下的“GO|KEGG”——“GO|KEGG可视化”。“类型”选择气泡图,基本参数里是系统默认的选项,根据Figure 4A纵坐标,输入想要展示的GO:BP条目(可从Excel完整版结果里复制),删去多余的,点击“确认”。
即可得到Figure 4A,Figure 4B—D同理。
 Figure 5  | 基因组富集分析(GSEA)的富集图
打开刚才做差异分析时下载的的Excel表格,复制粘贴gene_name、log2FoldChange列至新表格:
上传该表格至GSEA分析,数据集选择c2.all,参数多数情况下选默认:
分析后,和GO与KEGG一样,在“GSEA可视化”中选择需要的基因集,得到Figure 5H的结果,Figure 5其他图同理。
 Figure 6  | E2F2基因表达与免疫浸润的关联分析
棒棒糖图也很简单,远端数据选择结直肠癌,选择RNAseq,FPKM格式,分子依旧选E2F2,点击确定即可出结果。发文章时根据需要调整图片方向就好了。几下点击,Figure 7A就分析出来了。
散点图部分,在免疫浸润里选择散点图,数据和分子不变,只需要在算法中根据需要选择不同的细胞类型。
好了,本次零代码生信文章复现就到这里啦!是不是觉得仙桃很好用呢?那就期待下一次了,大家也要好好利用呀~

END

撰文丨三叶虫
排版丨三叶虫
编辑丨三叶虫
继续阅读
阅读原文