单基因共表达热图和火山图
小伙伴们,大家好!又和小洋见面啦,在之前的推文里小洋向大家介绍了复杂数值热图和环形热图,不知道大家是否学会了。那么今天,小洋将向大家介绍一下基于单基因的共表达热图和火山图
小洋的单图复现系列传送门
基本概念
单基因共表达热图:通过热图的方式,展示单个主要基因和其他多个基因之间表达趋势的相关性情况。
涉及的统计方法:
Pearson 相关:参数相关性检验,衡量两组之间是否存在线性关系。
Spearman 相关:非参数相关性检验,通过秩次来判断两组是否存在相关性。如果不懂具体的选择条件,可以选择该方法。
火山图:表达谱(RNAseq)进行差异分析后得到的差异分析结果的可视化内容之一,火山图中每个点代表一个分子的差异倍数和经过转换的校正后的p值,整个图的形状形似火山喷发,所以称为火山图。
应用场景
单基因共表达热图:
单个基因和其他多个基因之间表达的相关趋势情况。
火山图:
可视化差异分析后的结果,需要提供logFC 和校正后的p 值(或者p 值)。
批量相关性结果的结果(需要提供相关系数和p 值)。
结果解读
单基因共表达热图
★ 单基因共表达热图分成两个部分,上部分为主要基因的表达情况,下部分为其他基因的表达情况经过zscore 转换后的情况。
zscore 转换是绘制热图中常用的一种对数据进行转换的方法(每个基因的表达值减去其在所有样本中的表达均值后,再除以标准差),可以减少不同分子表达值差异过大而影响整个热图的可视化效果,并且zscore转换保留了单个分子在样本间的差异情况。
整个图的x 值代表一个个样本,整批样本按照主要基因的表达的从低到高进行排序,再观察其他基因的表达趋势情况是否和主要基因显著关系(正相关/负相关)。
可以看到,第一个基因NAT1 和主要基因ERBB2 之间相关性比较明显(红色的地方跟主要基因高表达组比较趋同)。
★ 共表达热图的右侧还有*,这个代表这个基因和主要基因之间的相关性统计结果的p 值情况,***代表p<0.001。
 相关系数为正数,说明两个变量可能存在正相关关系;相关系数为负数,说明两个变量可能存在负相关关系。
相关系数强弱:
  • 绝对值在0.8 以上:强相关
  • 绝对值在0.5-0.8:中等程度相关
  • 绝对值在0.3-0.5: 相关程度一般
  • 绝对值在0.3 以下:弱或者不相关
火山图
图中横坐标为logFC 值,纵坐标为经过-log10 转换后的校正后的p 值。
每个点代表一个分子,对应有一个logFC 值和经过-log10 转换后的校正后的p 值。蓝色的点在左侧,代表logFC < -1 且校正后p 值< 0.05 的分子;红色的点再右侧,代表logFC > 1 且校正后p 值< 0.05 的分子。灰色的点代表| logFC | < 1 或者校正后p值>0.05 的分子。
(阈值线)图中还有两根竖线,分别代表logFC 为-1和1的竖线;还有一根横线,代表校正后p值在0.05的横线。
以上就是有关单基因共表达热图和火山图的背景介绍,如果想要进一步掌握单基因共表达热图和火山图的相关内容,还可以登录解螺旋官方网站进行深入的学习和探索!
文献解读
下面让我们来看一篇2021年1月发表在“Frontiers in GeneticsIF= 4.599)杂志上的一篇文章。题名为“Increased Expression of TICRR Predicts Poor Clinical Outcomes: A Potential Therapeutic Target for Papillary Renal Cell Carcinoma”。
期刊简介
复现工具
仙桃学术工具(https://www.xiantao.love/products
图形复现
进入仙桃学术,点击【生信工具】
【高级版】 → 【立即使用】
【交互网络(联)】 → 【分子相关性分析】 →【单基因共表达热图】→选择肾乳头状细胞癌→输入TICRR分子→输入分子列表→确认
保存结果
【表达差异(挑)】 → 【差异分析】 →【(云)单基因差异分析】→选择肾乳头状细胞癌→输入TICRR分子→确认
【表达差异(挑)】 → 【火山图】 →云端数据→选择刚刚分析好的肾乳头状细胞癌单基因差异分析结果→确认→保存结果
好啦,本期有关单基因共表达热图和火山图的相关内容就介绍到这里,希望对大家的科研工作有所帮助。我是小洋,我们下期再见~
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END

撰文丨小   洋
排版丨四金兄
主编丨小雪球
继续阅读
阅读原文