各位小伙伴大家好,本期给大家复现的是一篇2021年发表在审稿周期短生信文章相对友好的PeerJ杂志的零代码纯生信文章,来吧,话不多说,打开电脑,我们一起复现起来吧
文章信息
文章背景及思路
人成纤维细胞生长因子受体(FGFR)家族由四个成员组成,分别是FGFR1、FGFR2、FGFR3、FGFR4,其天然配体是成纤维细胞生长因子(FGFs),FGFRs调控异常与多种癌症有关,如尿路上皮癌、肝细胞癌、卵巢癌和肺腺癌等。目前,FDA批准了几种FGFR抑制剂用于治疗癌症,包括伦瓦替尼被批准用于碘难治性分化良好的甲状腺癌,瑞戈非尼被批准用于晚期结直肠癌和抗药性胃肠道间质瘤。帕纳替尼被批准用于耐药性慢性骨髓性白血病和费城染色体阳性急性淋巴细胞白血病以及肾细胞癌和肉瘤。FGF/FGFR系统在致癌过程中起着关键作用,但它对卵巢癌的影响却知之甚少。
当前研究中,作者通过纳排标准锁定GEO数据库中包含亚洲人群的GSE105437和GSE12470两个数据集,随后结合TCGA数据库中卵巢癌的数据进行meta-analyses和 bioinformatics analyses(表达差异、诊断效能、GSEA富集分析、临床相关性及预后分析)。
文章复现
  • 使用工具
仙桃学术工具(https://www.xiantao.love/products)
Review Manager软件
  • 复现步骤
  • Figure 1:基于GEO和TCGA数据的研究选择流程图
流程图的绘制可采用word、PPT、Visio、Edraw等工具进行绘制,这里就不给大家一一展示了,详细步骤可参考解螺旋《技术路线入门教程》
  • Figure 2:FGFR1在GSE105437和GSE12470数据集中卵巢癌组织中的表达
(1)进入仙桃学术工具(https://www.xiantao.love/products)→点击数据集检索——检索栏中输入GSE105437→点击检索
(2)点击选择样本→勾选正常卵巢样本以及卵巢癌样本→添加到样本库→点击进入我的样本库
(3)按照正常卵巢样本和卵巢癌样本分别分组为参考组和实验组,默认分析参数,点击提交分析
(4)分析完成后,点击下载差异分析.CSV、样本信息.XLSX、表达谱.CSV数据
PS:仙桃学术工具通过GEOquery包从GEO数据库中下载GSE数据集,当遇到对应同一个分子的探针时,这里仅保留了信号值最大的探针,所以数据结果可能和原文有偏差,没关系,这里大家掌握方法融会贯通学习即可。
(5)打开下载的表达谱数据,通过excel筛选功能在Gene.Symbol检索FGFR1,提取所有样本FGFR1表达值
随后结合下载的样本信息表,整理成如下表格
(6)进入仙桃学术工具,选择基础绘图→分组比较图→点击上传上方整理的FGFR1的表达数据→参数类型中选择点图→点击确认,即为原文中的图1A
重复上述操作,同样提取GSE12470中FGFR1中的表达值,以及EGFR、FGFR2、FGFR3在两个数据集中的表达值,整理相关数据表,通过基础绘图中分组比较图上传对应的数据即可分别绘制Figure1B-1F
  • Figure 4:FGFR1在GEO数据集中卵巢癌组织中表达的Meta分析
(1)借助仙桃学术工具按照前面Figure 1的步骤分别提取GSE105437和GSE12470数据集中FGFR1在正常卵巢和卵巢癌中的表达值,并计算其mean值和SD值
(2)进入Review Manager 软件,点击File→创建New→选择Intervention review→点击Next
选择Full review,点击Finish
选择Studies and references→点击Add Study,输入GSE105437,点击Finish
同样步骤添加GSE12470,结果如下
点击Data and analyses→选择Add Comparison→Name栏输入FGFR1,点击Finish
点击Add outcome→弹出界面选择Continuous,点击Next
后续弹出的对话框,默认相关参数(即原文中的固定效应模型),点击Next到最后或者直接点击Finish即可
点击Data and analyses中的FGFR1,右键选择Add Study Data,弹出的对话框选择GSE105437和GSE12470,点击Finish
输入GSE105437和GSE12470数据集中FGFR1在正常卵巢和卵巢癌中表达的mean值和SD值如下图所示
点击森林图标,即可弹出森林图,点击保存即文中Figure 4A
点击漏斗图标,即可弹出漏斗图,点击保存即文中Figure 4B
  • Figure 5:GSE105437和GSE12470数据集的差异表达分析
进入仙桃学术工具,分别检索数据集GSE105437和GSE12470,重复Figure 1的步骤(1)-(3),点击火山图下载即为文中Figure 5A和5B
  • Figure 6:GSE105437和GSE12470数据集中差异基因的GSEA富集分析
(1)打开借助仙桃分析工具在上述步骤Figure 2中得到的GSE105437的差异分析.CSV文件
(2)复制分子和对应的logFC,并整理成如下格式
(3)进入仙桃学术分析工具,选择功能聚类中的GSEA分析→上传整理好的GSEA文件,默认相关参数,点击确认
(4)待分析完成后,点击GSEA可视化,勾选刚刚分析完成的云端数据,在基因集ID中输入KEGG_FATTY_ACID_METABOLISM,默认其它参数,点击确认,即为文中Figure 6A
(5)重复上述步骤,上传GSE12470数据集的差异基因信息,GSEA富集分析后,输入要显示的基因集ID,将得到的图片通过仙桃学术拼图工具拼图即为文中Figure 6
注意:仙桃学术分析工具也可将多个基因集同时呈现在一个图中,如下
  • Figure 3:GSE105437和GSE12470数据集中FGFR1在卵巢癌中的诊断效能
(1)借助仙桃分析工具得到GSE105437数据集中FGFR1在正常卵巢样本以及卵巢癌样本中的表达(步骤参考Figure 2),整理成如下表格
(2)进入仙桃工具,点击基础绘图→选择诊断性ROC-独立指标→上传整理好的数据→默认相关参数,点击确认,即为文中Figure 3A
(3)同样操作得到GSE12470数据集中FGFR1在正常卵巢样本以及卵巢癌样本中的表达,重复上述步骤(2)即可得到文中Figure 3B
  • Table 1:FGFR1 mRNA在OC组织中的相对表达与患者临床指标的相关性
(1)进入仙桃学术工具,选择临床意义(靠)→点击临床相关性→选择FPKM格式的TCGA-OV数据→选择临床分期→输入分子FGFR1,默认其它参数→点击确认
(2)待结果分析完成后,提取不同临床分期中FGFR1的表达mean和SD以及对应的P值
(3)重复上述操作,分别选择其它临床参数,提取不同临床因素下FGFR1的表达mean和SD以及对应的P值,最终整理绘制三线表即文中Table 1
  • Table 2:卵巢癌患者的单因素预后分析
(1)进入仙桃学术工具,选择临床意义→点击预后分析→选择单因素|多因素Cox回归→选择FPKM格式的TCGA-OV数据→添加相关临床因素并分组→预后参数选择OS,默认其它参数→点击确认
(2)待分析完成后,可得到临床因素预后的HR值、P值、中位生存时间以及计算生存率等信息,提取相应数据整理绘制三线表即文中Table 2
注意:仙桃学术根据得到的单因素多因素COX三线表可直接下载应用
  • Figure 7:FGFR1表达预后生存分析
(1)进入仙桃学术工具,选择临床意义(靠)→点击预后分析→选择KM曲线图→选择FPKM格式的TCGA-OV数据→输入分子FGFR1,预后参数选择OS→默认其它参数→点击确认,即可得到文中Figure 7C
(2)关于文中Figure 7A和7B,这里借助仙桃学术根据下载临床数据,提取生存数据进一步绘制生存曲线,具体步骤如下:
进入仙桃学术工具,选择临床意义→[云]筛选预后分子→选择FPKM格式的TCGA-OV数据,默认其它参数,点击确认
待分析完成后,点击数据下载栏中临床数据-CELL预后数据下载的百度云链接下载数据
整理提取不同分期的生存数据如下
点击基础绘图→生存曲线-二分类/数值→上传整理好的数生存数据→后台系统会根据上传数据自动识别分组信息,默认相关参数→点击确认,保存图片即文中FIgure 7B
同样整理提取不同residual tumor的生存数据,重复上述步骤,即可得到FIgure 7A
到此为止,整个文章所有数据分析的图表复现就已完成,整体文章思路比较简单容易上手复现,这里不同平台多个数据集采用mete分析的方法也是值得大家今后借鉴的地方;此外,这里也给大家墙裂推荐一下仙桃工具最近上新的【筛选预后分子功能】,当你一筹莫展对一个疾病无从下手时,这块宝藏你可以试着挖掘一下,说不定会有惊喜掉落哦~
看完不会觉得内容结束了吧?

其实小编已为您准备了2000+页的复现实操手册

扫下方二维码即可免费获得
继续阅读
阅读原文