分分钟搞定最新7分+非肿瘤生信的免疫浸润分析
小伙伴们大家好,我是菠小萝。今天为大家带来一篇最新发表的7分+非肿瘤生信文章的全文复现,满满干货!话不多说~直奔主题!范文的题目是“Maternal smoking-induced lung injuries in dams and offspring via inflammatory cytokines.”于2021年3月发表在《Environ Int》,最新影响因子7.577。
推荐这篇范文的原因有很多~首先,文章逻辑框架非常规范,“挑、圈、联、靠”四步走;然后,选题非常新颖,数据集很有特点能够利用我们的仙桃学术生信工具零代码复现,是小白友好版高分文章啦~感谢范文的研究团队为我们树立了优秀的学习榜样!
期刊简介
“挑圈联靠”题目要素拆解
疾病Maternal smoking-induced lung injuries;
数据来源GEO(Abstract);
机制母亲吸烟通过炎性细胞因子导致母鼠和子代肺损伤;
研究目的(文章类型通过差异分析,识别在肺部疾病中起关键作用的Biomarkers。
知识背景
本篇范文是从一个科学问题出发的,由于母亲吸烟增加了很多妊娠并发症和其他长期健康风险的风险,对儿童健康同样会产生终身不利影响。另有多项研究表明,母亲主动吸烟与不良出生结局有关,包括宫内发育迟缓、早产、死产、出生体重不足、先天性畸形等。此外,大量研究表明,母亲吸烟可导致认知障碍,如多动障碍、后代学习成绩差和感知缺陷、心血管疾病和后代生育能力下降等。发育中的胎儿肺对母亲吸烟的影响极其敏感,多项研究表明,吸烟母亲所生的婴儿下呼吸道疾病增加。母亲吸烟对后代肺部的主要影响包括用力呼气流量和被动呼吸顺应性降低、呼吸道感染住院率增加以及儿童喘息和哮喘的患病率。实验研究还表明,母亲吸烟会增加氧化应激和炎性细胞因子,并导致子代肺线粒体功能障碍和DNA甲基化改变。这些数据表明,怀孕期间吸烟是后代肺部损伤的一个重要风险因素。出生前暴露在烟雾中会对后代健康产生负面影响。
首先,尼古丁会减少母体系统、胎盘和胎儿的血流,不可避免地增加缺氧的程度。其次,尼古丁诱导的高水平细胞因子可以释放到循环中,从而激活发育器官中的信号级联。第三,尼古丁还会诱导表观遗传变化,如改变miRNA的表达,这可能导致跨代效应。虽然最近的研究集中在母亲吸烟诱导的子代肺转录组的变化,但研究集中在母亲和子代肺差异表达基因之间的关系。于是,作者通过生信分析比较母体和后代肺的原始转录组数据,来识别可能在肺部疾病中起关键作用的潜在生物标志物,以在分子水平上揭示母体吸烟诱发后代肺部疾病的机制。
数据来源 & 思路框架
本篇范文立意新颖,目的明确,由临床问题出发筛选数据集,这发高分生信文章前期工作中最为必要的。高质量的数据来源是支持我们完成生信分析,得到有意义的研究结果的关键。范文选择的GEO数据集研究对象非常有特色,包括小鼠、母鼠可以进行两两比较ELT细胞、肺及其幼年后代的全基因组变化两个子系列(GSE96976和GSE96977)组成的GSE96978数据的原始研究,并侧重于寻找一种体外替代物,作为动物使用的人类组织替代物。因此,本研究仅分析了经与未经烟雾处理的母代与子代小鼠之间GO术语的相似性。然而,在母鼠和后代中差异表达基因之间的关系还没有被研究。目前的研究旨在确定与母亲吸烟导致的水坝和后代肺损伤有关的关键分子。来自GSE96977的数据从基因表达综合数据库(GEO)数据集下载。在我们的研究中,使用limma软件包对母鼠及其后代的差异表达基因(DEGs)进行了重新分析。基因集富集分析(GSEA)的结果表明,母鼠肺中的DEGs在免疫相关功能方面显著富集,子代肺中的DEGs在细胞生长方面富集。此外,共有90个在母代和后代数据集中共享的数据组被筛选出来。此外,这些deg大多富含细胞因子和细胞因子受体相互作用KEGG途径。此外,蛋白质-蛋白质相互作用(PPI)网络分析筛选出聚类1中的4个核心基因。此外,预测了与这些核心基因相关的miRNAs,筛选出了miR-1903。
综上所述,我们的数据表明,炎症反应可能在母亲吸烟导致的母鼠和后代肺损伤中起重要作用。此外,mmu-miR-1903是怀孕期间吸烟的母鼠后代肺部炎症的潜在表观遗传生物标志物。此外,通过筛选共享的差异基因,我们可以仅通过检测母体肺指标来推断后代肺损伤。孕妇在怀孕期间吸烟会导致新生儿炎症的永久性变化,这将导致终身影响。总之,通过筛选共有的差异基因,我们只需要检测母体基因就可以预测母体吸烟对后代的肺损伤
数据精析及图表复现
本篇范文思路非常清晰,结构也非常规范。本篇范文从“孕妇在怀孕期间吸烟会导致新生儿炎症及不良的终身影响”这样一个临床科学问题出发,找到一个4组分类的GEO小鼠样本数据集。从多次、多分组比较差异基因(挑),对相关差异基因进行蛋白互作网络及miRNA网络构建,以及样本间的免疫浸润分析(联),GO、KEGG、GSEA富集分析(圈)这些层面进行分析。在范文整体思路的学习之外,我们需要重点学习的是如何对GEO数据集进行免疫浸润分析。毕竟大部分临床医生撰写生信文章还是需要用到GEO数据库的~今天,小编就教大家如何巧妙、灵活的运用GEO数据集。
一、“”——差异表达
作者选择了一个包括6个母体小鼠肺组织和6个后代小鼠肺组织的GEO数据集GSE96977(包含于GSE96978数据集)。这个数据集在吸烟暴露设计中,设置怀孕的雌性小鼠在怀孕期间每天暴露4小时,持续5天/周,直到分娩(18天),从母鼠和后代小鼠(每组3个重复)采集肺组织。GSE96977数据集的分组包括暴露在过滤空气中的母鼠,暴露在香烟烟雾中的母鼠,暴露在过滤空气中的产前母鼠,及暴露在香烟烟雾中的产前母鼠。作者基于这四组经烟雾处理和未经烟雾处理的母鼠及其子代分别进行差异分析。本篇范文巧妙的通过比较DEGs的不同交集,巧妙的将一个多分组的数据集进行差异分析。由此,获得差异表达基因( P<0.05 & |logFC|>1.5)。下面我们就来零代码复现。
我们首先进入仙桃学术【数据集检索】界面,并检索GSE96977,点击右下方的【GEO2R】进行差异分析。
将样本分别命名并归为四组,点击下方【Analyze】,稍等几分钟。这里需要大家注意的是GEO2R是两组间进行差异分析,对于本篇范文这样的多组别差异分析,我们需要两两比较。就如下两图所示,分别进行差异分析。
接下来我们就获得了差异分析结果,点击【Download full table】下载结果列表。
我们还可以对GEO2R做出的差异分析可视化进行下载,也可以放到文章当中,如下图所示。
接下来,我们使用excel打开刚刚下载的差异分析结果列表,并以文章中的阈值( P<0.05 & |logFC|>1.5)筛选DEGs。
我们需要筛选出存在Gene Symbol,且基因名不重复的基因。于是,我们得到经与未经烟雾处理的母代小鼠间存在71个差异基因,其中上调的32个,下调的39个;经与未经烟雾处理的子代小鼠间存在3411个差异基因其中上调的3043个,下调的368个。虽然结果与文章不同,但生信文章由于有分析方法和阈值等多方面因素参与,因此很难完整的复现数据。学习本篇范文重点在于了解如何巧妙的对多分组数据集进行差异分析及结果展示。
下面我们就复现作者展示的韦恩图,分别将母代小鼠和子代小鼠间的DEGs,以及上调、下调的DEGs整理为如下所示的格式,列名为组别命名,包含所属组别的所有基因,然后取两组的交集。
这里以整体的DEGs为例:
我们可以调整韦恩图的颜色及命名等,下载图例即可。
其实,在差异分析中加上热图和火山图可以更加规范,这些都可以在仙桃学术生信工具中可以轻松实现的。
二、“”——富集分析
本篇范文的分析流程是非常规范的,GSEA、GO和KEGG通路富集分析为了确定暴露组和对照组之间的总体基因富集差异。这里作者在图1中展示了暴露组和对照组之间的总体基因富集差异。我们还需要将暴露于烟雾中的母代及子代小鼠与对照的母代及子代小鼠进行差异分析,步骤同前。然后,我们需要将Gene Symbol及logFC两列整理成如下图所示的格式:
将文件导入到【仙桃学术生信工具】中GSEA分析模块中,的能带分析结果。这里因为我们范文中是小鼠的样本,所以大家一定记得更改参数如下图红框中所示:
接下来,进入GSEA可视化模块,选中我们刚刚分析出的结果,修改参数,可以设置颜色及名称等,如下图所示:
这样图1的A-B也可以轻松复现了,由于生信分析影响因素很多,富集结果并不完全与文章一致,但小伙伴们需要掌握的实用的分析方法呢~作者另外还将取交集的基因用于进一步的功能富集分析。利用David网站,进行GO和KEGG富集分析。我们在【仙桃学术生信工具】中都可以一步实现的。只要将基因列表转换成如下图所示的格式,即一列基因ID即可。我们这里就以经合未经烟雾处理的子代小鼠间的差异基因为例进行展示。
点击“确认”进行分析,结果如下,可以下载结果列表放到文章当中。
这里还要记得保存结果,然后才能进行可视化。
进入可视化模块,选中我们刚才保持的结果,点击确定即可:
以上,是我们【仙桃学术生信工具】的富集分析工具,可以做条形图、气泡图等等。范文中则是利用了David数据库来进行富集分析即可视化。其实,具体的步骤我们应该都已经比较熟悉了,今天我们主要来搞定如何作图~ David操作演示在解螺旋《生信全书·上篇》中有详细讲解,非常适合新手小白。
首先,打开David网站(https://david.ncifcrf.gov/),点击“Start analysis”,然后依次输入要富集的基因列表、选择基因ID的类型进行分析,基本上也是一步搞定。
三、“”——交互作用
1

PPI网络构建
接下来就是通过STRING构建PPI网络,这里作者还用到了NetworkAnalyst 3.0数据库。解螺旋《生信全书·上篇》中有关于STRING网站构建PPI网络的详细讲解,小伙伴们如果对于这部分不太熟悉可以参考学习~从STRING网站获取的结果列表,可以导入Cytoscape软件中可视化,随自己的审美喜好调整PPI网络的样式~
2

miRNA相关的互作网络构建
作者使用miRWalk、miRanda、miRDB、TargetScan和RNA22数据库预测选定的靶向miRNAs的基因,并选择超过4个数据库作为预测结果。具体的分析流程在解螺旋《生信全书·上篇》中同样有详细的讲解呢~同样可以将分子交互列表导入到Cytoscape软件中进行可视化。
3

免疫浸润分析
免疫浸润分析是本篇范文学习的重点,我们大家应该也是比较熟悉的,【仙桃学术生信工具】中目前可以进行TCGA数据库的一站式分析。对于本篇范文,使用的是GEO数据库中小鼠样本的数据集。我们可以使用CIBERSORT官方在线版分析工具,我们“挑圈联靠”公众号中有详细的操作讲解。这里小编教大家使用R语言进行分析,文末回复“210601”可以获取代码哦~。
首先,我们需要从GEO数据库中下载如下文件并解压。
打开文档,将下图中红框圈出的部分全部复制到新的文本文档中。
即整理为行名为基因名,列名为样本名的格式,并利用GEO平台注释文件将基因转换为Gene Symbol。最后,我们得到如下图所示的文件,命名为“symbol.txt”。
从CIBERSORT官网注册申请账号我们可以获得CIBERSORT的源代码和“LM22.txt”注释文件,详细步骤我们“挑圈联靠”之前的文章也有详细介绍。
接下来,将以上两个文件放入到自己设置的文件夹中,并设置工作目录,然后两句代码搞定免疫浸润!
GEO数据库免疫浸润分析代码部分(后台回复“210601”可以获取R语言格式代码):
source("CIBERSORT.R")results=CIBERSORT("LM22.txt", "symbol.txt", perm=100, QN=TRUE)
并得到如下结果文件:
然后,利用【仙桃学术生信工具】的“柱状图”模块可视化。将我们之前得到的免疫浸润结果列表转置为如下格式。行名为免疫细胞名称,列名为样本名。
将转置后的文档导入到【仙桃学术生信工具】的“柱状图”模块,待数据验证成功可以进行分析。这里因为我们的数据比示例数据内容多很多,因此我们可以通过设置图片输出大小,以及调整坐标轴文本角度来作图,可以避免图片展示不全、文本标题重叠等问题
这样图1C也复现完成啦~ 小伙伴们是不是掌握了如何利用GEO数据集中的数据进行免疫浸润分析的技巧呢~快快在后台回复“210601”获取范文全文,数据信息和免疫浸润部分的分析代码吧~我们下期再见啦,拜拜!
参考文献
[1] Ji X, Yue H, Li G, Sang N. Maternal smoking-induced lung injuries in dams and offspring via inflammatory cytokines. Environ Int. 2021 May 11;156:106618. doi: 10.1016/j.envint.2021.106618. Epub ahead of print. PMID: 33989842.
往期传送门
重磅最新消息!DeepMind首次突破蛋白折叠的历史难题,这项AI技术能否成为生信领域的下一匹黑马?

17分+SCI,只用用TCGA数据库就能搞定?怎么做到的?

欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END

撰文丨菠小萝
排版丨四金兄
主编丨小雪球
继续阅读
阅读原文