分分钟搞定6分+头颈癌干湿结合套路生信文章
大家好,我是浮浮~今天我们零代码复现一篇今年发表在Frontiers in Oncology杂志上的生信文章,该杂志最新影响因子已经涨到了6.2分!目前已经官宣不接收纯生信文章,本文是在生信分析的基础上进行了简单的实验验证,我们一起学起来吧。
期刊简介
复现任务
我们还是先来梳理一下全文,本文一共6个表7张图,总体来说数据量还是很大的。我们先来看一下图片结果。
图1 | 主要分析了主变量在头颈癌中的表达差异以及临床相关性,作者还将ROC曲线放到这里
图2 | 展示的是预后情况,绘制了KM曲线,Nomogram和Calibration图
图3 | 分析了主变量HMMR甲基化水平在头颈癌中的差异以及预后
图4 | 根据HMMR高低表达进行分组,展示差异基因热图以及共表达热图
图5 | GO/GSEA富集分析
图6 | 免疫浸润分析
图7 | 最后进行简单的实验验证,主要是表达差异,没有做功能表型
原文使用的多个数据库,还有R语言进行分析可视化,不过这里绝大多数结果仅使用仙桃工具就可以实现复现啦,不懂R语言的小伙伴快学起来吧。
全文复现
1

图一复现
进入仙桃学术主页:https://www.xiantao.love/
点击“生信工具”
【高级版】 → 【立即使用】(注:免费版和基础版都可以进行统计和可视化,由于高级版功能最全,这里选择高级版作为范例)。▼
首先我们来复现表达差异的结果。在左侧菜单栏“表达差异(挑)”模块进入,选择“表达差异”菜单,下拉有“非配对样本”和“配对样本”两种选择
我们以非配对样本为例,点击进入页面后,选择疾病数据集,右侧参数部分输入分子,这里输入“HMMR”,点击“确认”进行绘图。
这里也可以轻松绘制配对的表达差异结果,点击“保存结果”到历史记录,方便后续拼图。
表达差异中支持单基因泛癌分析!只要选择泛癌数据集,点击“确认”即可
同样地,也可以将这张图保存到历史记录中,方便后续拼图。
原文在这里放了一张ROC曲线,这个结果使用仙桃工具也是可以轻松出图的。在“临床意义(靠)”的模块中,可以找到“ROC曲线”,点击进入
这里仍然是利用云端的TCGA数据集,所以界面是类似的,只要用鼠标“点点点”,即可完成分析并且绘制精美图片。而且工具自带的记忆功能甚至免去了重现选择疾病数据集和输入分子的麻烦,进入模块直接点击“确认”即可出图,是不是超级方便了呢?
1分钟都不到,我们就得到了一张和原文一摸一样的结果,配色部分可以在右侧“参数”部分进行设置,如果想要更加个性化的结果,可以根据习惯设置其他参数。小伙伴们也可以参加仙桃工具相关训练营,学习更多使用工具的小技巧。
接下来是临床相关性分析。点击“临床意义(靠)”模块,进入“临床相关性”分析
选择好疾病和分子,点击“确认”进行绘图
保存结果,以便于后续的拼图。在分析项目中可以选择不同的临床指标进行分析,同理可以得到TNM分期、临床分期、性别、年龄等。这里的临床指标根据癌症种类不同可能会有差别,并不是完全相同的,根据疾病的不同进行选择。
接下来可以直接用仙桃工具的拼图功能进行一键拼图。点击进入拼图工具:
左侧保存着历史记录中的图片,用鼠标直接推拽到右侧的面板即可,然后对图片进行排布,操作简单,这里也不赘述了。需要注意的是,在排列图片的时候,小伙伴们最好在四周留一些空隙,以便工具自动插入图片字母序号
右下角可以选择TIFF或者PDF两种格式进行下载保存,一张发表级别的图片就做好了
这里我只复现了一种临床相关性的结果,其他结果图的绘制方法相同,最后拼在一起就可以了。大家在自己分析的时候也可以多尝试几种分类,然后挑出有意义进行展示。
2

图二复现

接下来是Figure2 预后相关结果的展示
进入“临床意义(靠)”模块,找到“预后分析”,下拉菜单第一个“KM曲线图”,点击进入
工具有记忆上一次疾病和分子的功能,所以进入后直接点击“确认”出图即可
如果想要调整风格,可以在右侧参数栏进行设置。
保存结果方便后面拼图,也可以下载PDF、TIFF、PPT等格式文件,满足绝大部分期刊投稿要求。
绘制Nomogram图也有云数据在线绘制!仍在是在“预后分析”下拉菜单中,选择“预后Nomogram图”
这个模块的疾病仍然是之前选择的,不过分子部分需要重新选择,因为还需要输入其他分期指标。原文结果中加入了1年、3年、5年的生存预测,这里可以在右侧参数部分进行设置。
点击“确认”即可出图,如果图中文字有重叠,可以在参数部分调整图片大小
在绘制Calibration图的时候,需要先进行分析。还是在“预后分析”下拉菜单中,有两个“Calibration”子项目,我们点击“Calibration分析”
仍然是Nomogram相似的界面,输入分期指标和主变量分子HMMR,并在右侧参数部分将生存年限设置为1年、3年、5年:
点击“确认”,提交分析结果
进入“历史记录”可以查看完成进度,当状态显示“完成”时,说明分析已经完成,可以进行下一步可视化了
我们回到“Calibration可视化”界面,云端数据就是我们刚才提交完成分析的数据,预测年限自动设置为1年、3年、5年,直接点击“确认”即可
可以根据绘制的图片再进行参数设置,比如调整图片大小
好啦,Figure2中所有小图也已经绘制完成了,拼图过程上面已经展示过了,我们就不在赘述了,下面直接进入Figure3的复现。
2

图三复现
这张图主要是突变和甲基化情况,原文是说用cBioPortal进行的分析,但是由于cBioPortal改版之后将这部分删掉了,仙桃工具后续会更新这部分内容~那我们先来看一下UALCAN数据库(http://ualcan.path.uab.edu/index.html)做出来的甲基化差异部分吧
复制网址到浏览器,打开数据库。首页很清新,注明了引用文献,小伙伴们使用这个数据库进行分析的话记得引用哦~原文用的是TCGA数据库,我们点击右上角的“TCGA”
进入下一个页面输入基因名称,选择头颈癌数据集,点击“Explore”
在找到该基因并进行相关分析后,会弹出以下界面。出了该网站对基因的分析,还可以链接到其他数据库对目的基因进行深入地分析,感兴趣的小伙伴可以试一下,这里我们点击“Methylation”获取甲基化结果:
跳转后的界面就是该基因启动子区域甲基化水平在正常vs肿瘤样本中的差异
点击图片右上角的菜单,可以保存多种格式的文件,也是很方便的
细心的小伙伴可能已经发现了,复现出来的图片和原文相比,没有p值的展示。在该网站结果的下方有统计p值的大小,猜测这个可能是作者后期PS或者AI自己加上去的
这部分由于数据库改版,后续等仙桃工具上线突变、甲基化的在线分析,小伙伴们可以再试一下~
下面继续复现Figure4,根据HMMR高/低表达进行分组,找出差异基因绘制火山图和共表达热图
4

图四复现
首先进入仙桃工具的“表达差异(挑)”模块,在“差异分析”下拉菜单中找到“单基因差异分析”
工具仍然保留之前的分析选项,所以直接点击“确认”即可
这里和Calibration分析类似,提交结果后等待分析完成
待分析完成后下载表格数据
打开表格,查看下载后的数据如下
然后复制gene_name、logFC、pvalue、padj这4列到一个新的excel表进行火山图的绘制
回到仙桃工具,在“表达差异(挑)”部分进入“火山图”
上传数据后耐心等待一会,待上方出现“数据验证成功”后,点击“确认”进行绘图。有的小伙伴操作过快,系统没有验证数据就开始绘图,有时会导致报错。
火山图就绘制完成了,如果想要对图片风格进行个性化调整,可以在参数部分进行设置
然后绘制共表达热图,筛选padj<0.05,logFC<-1.5或>1.5的差异基因
这部分作者没有详细解释展示的基因是如何挑选出来的,我们可以选择top 15作为展示。这部分功能在“交互网络(联)”的模块中,“分子相关性分析”下拉菜单可以找到“单基因共表达热图”,点击进入
疾病和分子仍然不需要再次选择,不过这里的“分子列表”部分输入刚才筛选出来的前15个差异基因,点击“确认”进行绘图
调整合适的图片大小,使基因名称显示不重叠
最后使用拼图工具将两张图片进行拼接即可。接下来我们继续看Figure5,富集分析的结果复现。
5

图五复现
首先是GO分析,在“功能聚类(圈)”的模块进入,点击GO|KEGG菜单下的“GO|KEGG富集分析”
将刚才获得的差异基因名称复制到右侧参数的“分子列表”中,点击“确认”进行分析:
在结果中,我们可以直接看到富集的项目。点击“保存结果”,以便进行后续分析:
GO|KEGG的可视化有两种形式,一种是比较常规的柱状图/气泡图,另一种是更加炫酷的可视化网络,不过后者对于展示项目的数目和字数比较苛刻,如果数目太多或者名称太长可能会显得凌乱,所以具体用哪一种大家可以视情况而定,主要还是看自己能驾驭哪种风格。这里我们仅演示柱状图的复现。
在云端数据选择刚才保存的项目,点击“确认”即可出图。文章中仅展示了GO分析的项目,那么可以在右侧“基本参数”中删掉KEGG的项目即可。同理,如果想要只展示某一种富集结果,就可以在这里进行设置调整。工具默认每种展示top3
具体个性化设置仍然可以在右侧参数部分进行设置,如果想要绘制气泡图,可以在“类型”中选择
GSEA富集分析过程与GO分析相似,只不过GSEA需要上传数据,并且上传表达差异值,我们一起来看一下吧
仍然在“功能聚类(圈)”的模块下,进入“GSEA富集”菜单,点击进入GSEA分析
界面就不介绍啦,大家肯定非常熟悉了。之后按要求整理数据:id即基因名;value可以输入logFC的值,由于筛选后的基因较少,这里我们可以将所有差异基因输入进去
上传数据,并等待上方出现“数据验证成功”字样后,点击“确认”提交分析
这里的参数部分如果不知道如何设置,选择默认即可,然后等待任务进行
分析很快,基本1分钟不到就可以分析好了,将结果下载备用
之后回到工具,点击进入GSEA可视化模块,选择刚才分析好的数据。这里需要注意的是右侧“基本参数”,这里可以输入富集到的“基因集ID”,也就是刚才下载结果中的项目。原文展示了6个结果,这里也可以选择6个项目分别进行可视化,然后拼图
富集的部分复现完毕,下面进入免疫浸润部分的内容,也就是Figure6
6
图六复现
免疫浸润部分在“交互网络(联)”这个模块中,点击“免疫浸润”下的“棒棒糖图”,进入绘图
这个模块是有云端清洗好的数据,而且工具保存了上次分析参数,所以直接点击“确认”进行出图
这样就轻松得到了免疫相关的棒棒糖图,是不是特别简单呢?
原文展示的图片是横过来的,调整也十分简单,只要在参数部分,将“风格”中的“XY轴颠倒”勾选取消,再调整图片到合适大小,就可以得到和原文一样的图片啦
接下来绘制该分子分别与各个免疫细胞浸润相关性的散点图,原文使用了TIMER数据库进行分析绘图,不过最近该数据库不是很稳定,有时候经常出错,其实我们使用仙桃工具就可以很轻松地画出这几张图片,并且利用拼图工具进行拼图还十分方便,我们一起来复现一下吧
还是在“免疫浸润”下拉菜单中选择“散点图”进入。
进入后,界面仍然是类似的,也不需要输入疾病和分子,工具自动填充好了
在参数的“算法参数”部分,可以选择不同免疫细胞,我们这里以Th2细胞为例进行绘图
绘图结果与原文中趋势相同,而工具绘图个性化设置更加灵活,保证发文不撞车!
最后一张图是是实验部分,主要验证了一下主变量分子在不同细胞系中的表达情况,以及qPCR和免疫组化验证了表达差异,收集70例患者信息做了预后KM曲线。虽然结果丰富,并且从不同维度、不同角度证明HMMR分子在头颈癌中的价值,但是这些实验却不难,也只停留在表达差异部分,所以文章整体实现难度并不大。
接下来我们直接看表格的复现。仙桃工具的又一大特色之一就是分析得到表格后可以直接保存word格式,直接放到文章中。
7

表一复现
Table1 基线资料表。如此基础的表格,仙桃工具怎么能少?来,跟我1分钟搞定它!
在“临床意义(靠)”的模块中选择“基线资料表”,点击进入
和之前一样,疾病和分子都不用选,直接点击“确认”
基线资料表就绘制好了,在结果下方,可以选择“Excel”或者“Word三线表”格式保存,直接用于文章发表
网速快的话好像1分钟都用不了~我们继续看Table2/3,单因素/多因素Cox回归分析,也是很常规的一张表,这个可能1分钟完成不了,需要2分钟
8

表2/3复现
在“临床意义(靠)”模块中,选择“预后分析”下拉菜单,进入其中的“单|多因素Cox回归”
疾病是自动选好的,不过临床分期指标和分子需要手动选择,所以要比绘制基线资料表稍微慢了一点,可能要2分钟,哈哈
之后点击“确认”进行分析,结果显示了分析情况,而并不是我们最终要的三线表。我们点击“Word三线表下载”,查看一下保存的Word结果
保存的结果就是我们需要的三线表了,很方便吧,2分钟足够啦
如果不使用云端数据,仙桃工具还可以上传数据进行分析,就在“预后分析”下拉菜单里面的“单|多因素Cox回归-上传”
9

表四复现
下面是Table4 GSEA富集分析项目列表。还记得在GSEA分析过程中,我们是先进行的GSEA富集分析,然后再进行的可视化吗?没保存结果?没关系,点击历史记录,可以看到我们之前进行的GSEA富集结果,下载之后筛选出想要展示的结果,绘制成三线表即可。
最后两个表就是基于作者自己收集的临床信息绘制的基线资料表,虽然我们没有这部分信息,不能进行复现。不过仙桃工具提供了上传数据分析绘制基线资料表功能!
当我们做自己课题的时候,收集好了相关数据,可以直接上传到仙桃工具,一键绘制基线资料表。在“临床意义(靠)”这个模块,点进去就可以看到“基线资料表-上传数据”
到这里一篇6分+文章的7图6表我们就复现完毕了,虽然第三张图由于数据库改版无法完整复现,但是我们的仙桃工具已经在计划更新突变和甲基化部分的分析模块了,之后的分析只会更加方便。而且后续更新的内容对于高级版用户都是完全免费的,不再进行另外收费!
好啦,还没有入手高级版的小伙伴们不要犹豫了,早买早学习,也祝大家早日发表属于自己的生信文章!
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END

撰文丨浮   浮
排版丨四金兄
主编丨小雪球
继续阅读
阅读原文