生信人必会!一文学会做出风险因子图
小伙伴们,大家好!我们又见面啦,不知道上期的雷达图大家学会了嘛?今天,小洋要向大家介绍一款在生信文章中也经常出现的图形——风险因子图。
基本概念
风险因子图:主要用于可视化由数值类型(分子表达、其他纯数值类型)构建的预后模型的风险因子分组情况。主要由4个部分组成:
风险得分通过预后模型预测得到的 Risk Score(风险得分),并对得分情况从高到低进行排序,一般用点图进行展示。
风险分组:对风险得分进行分组,常见是进行中位数分组。
生存结局:展示生存时间和生存结局情况,一般用点图进行展示。
热图:可视化完全由数值类型(分子表达、其他纯数值类型)构建的预后模型中的分子表达情况。
应用场景
可视化预后模型的风险得分情况以及分组。
当预后模型完全由数值类型的变量(比如,分子表达)构成,可以同时绘制风险得分、风险分组、生存结局以及热图这4个部分。
当预后模型不完全由数值类型的变量组成,此时不建议绘制热图部分,可以只绘制风险得分、风险分组、生存结局,以展示预后模型的风险得分的分组情况。
结果解读
图为经典风险因子图,一共包含4个部分:
风险得分:对每个样本的风险得分从小到大进行排序,用不同的颜色代表风险得分的高低组情况,一般是中位数分组。
生存结局:展示生存时间和生存结局情况,一般用点图进行展示。一般是在高风险得分组预后结局(死亡)发生多(红点多)于低风险得分组。
风险分组:用一个横条展示风险得分的高低分组。
热图:可视化完全由数值类型(分子表达、其他纯数值类型)构建的预后模型中的分子表达情况。一般会采取zscore转换。热图主要是看构建模型的分子表达分别在高低风险得分组中的差异情况。
zscore转换是热图中常用的一种对数据进行转换的方法(每个基因的表达值减去其在所有样本中的表达均值后,再除以标准差),可以减少不同分子表达值差异过大而影响整个热图的可视化效果,并且zscore 转换保留了单个分子在样本间的差异情况
以上就是有关风险因子图的背景介绍,如果想要进一步掌握风险因子图的相关内容,还可以登录解螺旋官方网站进行深入的学习和探索!
文献解读
下面让我们来看一篇2021年7月发表在“Frontiers in GeneticsIF= 4.599)杂志上的一篇文章。题名为“Esophageal Cancer Associated Immune Genes as Biomarkers for Predicting Outcome in Upper Gastrointestinal Tumors”。
期刊简介
复现工具
仙桃学术工具(https://www.xiantao.love/products
图形复现
进入仙桃学术,点击【生信工具】
【高级版】 → 【立即使用】
【临床意义(靠)】 → 【预后分析】 → 【风险因子图】→ 上传数据
我们参考文献中的风险因子图,模拟一份数据,然后进行绘图:
上面的数据是模拟数据,所以并不会和文献中的图片完全一致。不过复现我们主要掌握方法即可,不需要完全复现。上传数据后,点击“确定”进行绘图,并保存结果。
好啦,本期有关风险因子图的相关内容就介绍到这里,希望对大家的科研工作有所帮助。我是小洋,我们下期再见~
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END

撰文丨小   洋
排版丨四金兄
主编丨小雪球
继续阅读
阅读原文