领略高端套路,发表高分文章!
小伙伴们大家好,我是菠小萝。这里是菠小萝的高分生信SCI解读专栏。感谢作者为我们提供了很好的学习典范!2020年11月发表在《FRONT IMMUNOL》上的非肿瘤生信文章,是非肿瘤生信哦~文章的题目是“Multiple Processes May Involve in the IgG4-RD Pathogenesis: An Integrative Study via Proteomic and Transcriptomic Analysis”。
很多临床医生不仅工作忙碌,而且没有经费,没有科研基础。眼看着马上奔四,“上有老,下有小,就是没文章发表”。“中年危机”的你先不要慌,菠小萝教你万能的5分+非肿瘤生信套路。让你以最少的经费,走出课题申报无门的“僵局”!如果说我们临床医生还没有课题,或者本篇范文是临床小样本组织蛋白组学数据分析,联合大样本公共数据集验证的典范!
菠小萝推荐本篇文章有两个原因,第一就是针对很多不是肿瘤方向的小伙伴们讲解一些高分非肿瘤生信套路;另外呢,就是本篇文章主要通过“圈”——富集分析来探讨间接机制,下面我们就来看看如何通过“圈”来使文章提高一个档次!
期刊简介
“挑圈联靠”题目要素拆解
疾病IgG4-相关性疾病(IgG4-RD);
目的基因Unknown;
数据来源蛋白质组学和转录组学;
机制Unknown(推测应该涉及多种途径的间接机制);
研究目的(文章类型)重点分析发病机制。
背景知识
免疫球蛋白IgG4相关疾病(IgG4-RD)是一种新定义的疾病实体,其确切发病机制尚不清楚。IgG4-RD的共同特征包括血清IgG4水平标高,多个器官,还密集渗透IgG4 +浆细胞浸润和重要组织。这种疾病会影响男性比女性更常在诊断和年龄范围从50到70年。尽管大多数患者做好应对类固醇,复发率可接近50%。IgG4-RD的特征还包括获得性免疫系统的改变,在这些改变中可以观察到浆母细胞、CD4+细胞毒性T细胞和卵泡性T辅助细胞的异常扩张。
此外,一些炎症等因素TGF -β,IL-4、IL-10也被发现在IgG4-RD的发病机制中发挥作用。这些血清中细胞因子促进嗜伊红血球过多的增加,或促进某些组织表达高水平的IgG4浆细胞升高IgE的生产,和纤维化,炎性细胞浸润最终导致器官损伤。
此外,一些自身抗体常存在于IgG4-RD患者中,特别是那些伴有IgG4相关自身免疫性胰腺炎(AIP)的患者。
然而,由于缺乏理想的动物模型且样本来源有限,目前确切的致病机制尚不清楚,这是IgG4-RD研究中的一个重要问题。一些研究表明很多细胞因子和趋化因子水平的升高,通过多方面机制诱导IgG4浆细胞浸润,在IgG4- rd患者的LSG中IgG4水平的升高,并影响组织纤维化。因为蛋白质是生物功能的效应因子,且IgG4-RD领域的蛋白质组学研究仍然是空白。于是,作者将研究方向定义到蛋白组学上,并检测IgG4-RD患者的血清学和组织蛋白酶体,从而寻找潜在的致病信息。
数据来源 & 思路框架
由于已知很多细胞因子和趋化因子能够通过多方面机制诱导IgG4浆细胞浸润,并且蛋白质作为生物功能的效应因子,且IgG4-RD领域的蛋白质组学研究仍然是空白。于是,作者将研究方向着眼于蛋白组学上。
作者在本项研究中分了两步:
第一步就是利用自己的小样本临床组织的蛋白组学数据,检测IgG4rd患者的血清学和组织蛋白酶体,从而寻找潜在的致病信息。第二步就是大样本的验证,作者选择了两个GEO数据集。通过大样本基于蛋白质组和转录组分析的公共数据集,利用生信方法构建加权相关网络。再将这个结果与自己的样本富集结果对比,从而寻找到在IgG4-RD免疫-炎症反应方面的一些特性,以及挖掘潜在的治疗靶点。这些结果可能为阐明IgG4-RD的发病机制和开发治疗IgG4-RD的药物提供线索
该项研究纳入了武汉同济医院风湿病与免疫科8例未接受IgG4-RD治疗的患者(25-70岁)的8份诊断血清样本与8份健康对照(HC)的血清样本作者使用iTRAQ技术(等压标记相对和绝对定量)对8名未接受治疗的IgG4-RD患者和8名健康志愿者的血清和组织样品的蛋白酶体进行研究。并对2名IgG4-RD患者和2名非IgG4-RD患者的颌下腺组织样本进行了蛋白质组学分析。
重点来了~作者并没有用大样本的临床样品进行蛋白组学分析,而是在有了一定的临床实验数据支撑后,就选择了数据库的验证。这一步骤非常值得大家学习借鉴的,我们写生信的目的就是要省精力,省时间,而且最重要的是省钱是不是!那么,既要“三省”既能够达到大样本的目的,同时还节省了经费。可以说是一箭双雕啦~
作者在验证中使用了来自GEO数据集的转录组数据,包括GSE40568和GSE66465。并通过加权相关网络分析(WGCNA)这种模块化数据处理,分析出与IgG4-RD相关的基因模块。随后,就是筛选差异表达蛋白,KEGG通路富集等等,去分析可能影响这一发病过程的原因。
数据精析
”——鉴定组织蛋白质组学的差异蛋白
作者在图1中展示了在IgG4-RD和对照样品的组织中542上调和438下调)980差异表达蛋白质(DEPs)(图1A),而血清中鉴定出86上调和8下调,一共94个DEPs(图1B)。取交集后,有包括IGHG4、ITA2B、URP2、HV118、APOC2、GP1BA、CAP1、TBB1、APOE、DSC2、TSP1、SODE在内的12个DEPs同时存在于组织和血清中,且均在IgG4-RD患者中表达上调。
(图1)
”——功能富集
1

通路富集
为了了解这些可能与IgG4-RD相关的DEPs的功能,作者对上一步“挑”分子步骤中,通过对比IgG4-RD和对照样品之间的组织/血清中,发现的DEPs进行了功能富集分析。结果表明,大多数组织上调DEPs参与了免疫相关细胞激活(如免疫应答激活细胞表面受体信号通路)、细胞粘附(如白细胞细胞-细胞粘附)和感染相关过程。如人类免疫缺陷病毒感染、EpsteinBarr病毒感染、沙门氏菌感染等(图2A)。然而,组织中下调的DEPs主要参与细胞连接相关的加工(如细胞连接组装)(图2B)。
(图2)

2

转录组数据加权基因共表达网络分析(WGCNA)
鉴于血清中下调DEPs的数量较少,作者将重点放在上调DEPs上,以便进一步分析,如蛋白激活级联、血小板激活和细胞外结构组织在GO生物过程(BP)和KEGG通路中都表现突出(图3)。与此同时,作者还发现“绿松石”颜色的基因模块在转录组数据也如同富集分析的结果,显示出与感染相关条目如“人类乳头状瘤病毒感染”,“上皮细胞信号”等相关。
(图3)
作者这里使用的是GEO数据库中的GSE40568数据集,构建WGCNA。共有变异系数>5%的4,364个基因作为输入。结合拓扑重叠矩阵和分层聚类检测到IgG4-RD (n = 5)、pSS (n = 5)和HC样本(n = 3)中的13个模块(图4A)。其中,具有934个基因的“turquoise”模块与IgG4-RD表型相关性最强(相关系数为0.81,p = 7e-5)(图4A)。“幽门螺杆菌感染”、“细菌侵袭上皮细胞”等。这些Term大多与细菌感染有关,这可能与IgG4-RD涉及的器官大多是外分泌器官,如胰腺和颌下腺有关。因此,作者从中推测感染因子和感染相关过程可能在IgG4-RD的发展和进展中发挥重要作用。常常被我们忽略的KEGG富集结果原来还可以这样分析!
(图4)
”——机制探讨(大样本数据集验证
这部分是文章中的一大亮点,一般的生信文章都是对富集结果描述一下,而范文则是深入的研究这些富集结果可能存在的意义。反复的去寻找KEGG富集与WGCNA有意义的模块相关性,其实也是“联”的思路的体现。“联”不仅仅有分子鉴定关联,对于结果而言,同样存在很多可以交互的关联形式。所以不要小瞧富集结果,如果深入去挖掘其中的关联,真的可以有惊喜的发现呢!
1

GEO数据集同样的“&”套路(WGCNA模块化聚类分析)
作者自己的小样本组织蛋白组学数据分析过后,就是大样本的公共数据集验证,这样才有意义,没有在基于PBMC样本的GSE66456数据集中鉴定出2306个变异系数>5%的基因作为WGCNA的输入基因。本研究中WGCNA检测了治疗前IgG4-RD (IgG4-RD_BT, n = 2)、治疗后IgG4-RD (IgG4-RD_AT, n = 2)和HC样本(HC, n = 4)中14个模块,参照方法部分标准(图4B)。其中,包含360个基因的模块“黄色”与IgG4-RD_BT表型相关性最强(图2B)。于是,作者针对“yellow”模块中边缘邻接值大于0.2的247个基因进行功能富集。并发现IgG4-RD可能涉及三个主要的生物过程和几个信号通路。就包括了以下三个途径,载接下来会深入探讨:① 抗体介导的自身免疫反应;② 感染和感染相关反应;③ 血小板激活。
2

与临床组织样本富集结果对比
① 抗体介导的自身免疫反应
抗原受体介导的信号通路在IgG4-RD组织中显著富集。除了T闲暇的信号通路,KEGG使用蛋白质组学数据的分析,我们发现几个KEGG通路相关B闲暇的免疫过程,如“Fcγ-r-mediated吞噬作用”,“B细胞受体信号通路”,“抗原处理和呈递”和“白细胞迁移”Term明显富集在IgG4-RD中(图2)。同时,作者还发现在IgG4-RD-LSG转录组数据的WGCNA分析中,“turquoise”模块的基因中富集在“Fcγ-r介导的吞噬作用”等Team中。此外,KEGG富集中的“系统性红斑狼疮”在IgG4-RD来源的PBMC中富集(p < 0.0001)。这些结果表明了IgG4-RD的自身免疫特性,也揭示了抗体在IgG4-RD自身免疫应答中的重要作用。
② 感染和感染相关反应
感染性因子是病原体相关分子模式(pathogen associated molecular patterns, PAMPs)的主要来源,并可介导危险相关分子模式(danger associated molecular patterns, DAMPs)的释放。PAMPs和DAMPs都是模式识别受体(PRRs)的配体,它可以在参与免疫反应的许多细胞成分中发现。PRRs的激活可调节免疫相关细胞的功能状态,进而影响免疫应答过程。根据我们的蛋白质组学数据,许多与感染相关的术语,如“人类”免疫缺陷病毒1感染”、“eb病毒感染”和“细菌入侵上皮细胞”在IgG4-RD丰富组织(图2,表2)。与此同时,我们还发现基因模块“绿松石”在转录组数据也显示与感染相关条款如“人类乳头状瘤病毒感染”,“上皮细胞信号”,“幽门螺杆菌感染”、“细菌侵袭上皮细胞”等(表3)。这些Term大多与细菌感染有关,这可能与IgG4-RD涉及的器官大多是外分泌器官,如胰腺和颌下腺有关。因此,我们推测感染因子和感染相关过程可能在IgG4-RD的发展和进展中发挥重要作用。
(表2)
(表3)
③ 血小板激活
在蛋白质组学数据,上调DEPs IgG4-RD患者的血清和组织样本富含血小板激活“通路(图2,图3)。与此同时,作者还观察到“血小板激活”也来源于从组织转录组数据集加权得到的“绿松石”模块(图5)。这个结果符合血小板可能作为免疫成分具有调节功能。
(图5)
3

多种信号通路可能参与IgG4-RD的发病机制
了解IgG4-RD中显著富集的信号通路,有助于寻找潜在的3.发病机制和治疗靶点。在蛋白质组学数据,“Rap1信号通路”和“NF -κB信号通路”富集于IgG4-RD组织(图2B),而“MAPK信号通路”,“PI3K-Akt信号通路”,“TGF -β信号通路”,“Ray信号通路”和“Rap1信号通路”等富集于组织转录组数据(表4)。“TGF-β信号通路”也富集于IgG4RD PBMC的转录组数据中。在这项研究中,只有“Rap1信号通路”在这两个GEO数据集中同时富集(图6)。
查阅文献得知,Rap1信号通路的激活可导致促炎细胞因子的产生和调节基质金属蛋白酶的表达水平,这是至关重要的细胞外基质的调制,并影响纤维发生的过程。
(图6)
(表4)
4

潜在的治疗靶点
为了找出IgG4-RD潜在的治疗靶点,作者还是着眼于从组织样本中筛到到的DEPs的 KEGG/BP Top30富集结果(图7)。
(图7)
作者选择了基于组织间DEPs进行的KEGG & BP富集的Top 30 Term,将这些Term中的所有蛋白构建PPI网络。将Top 15的节点作为Hub基因,并将对应的蛋白鉴定为Hub蛋白。例如,蛋白激酶Cα/β/δ/γ型(PRCKA/B/D/G),增殖蛋白激酶1/3 (MAPK1/3)和磷脂酰肌醇4,5,双磷酸3-激酶催化亚基α/β/δ同种型(PIK3CA/B/D),是重要的组件在免疫相关信号通路在不同类型的免疫细胞。针对这些蛋白的药物可能有助于治疗IgG4-RD。随后,作者从治疗靶标数据库中提取了Hub蛋白的靶点药物信息(表5)。
(表5)
全文总结
好啦,这篇文中还是比较简单的~总结一下,这是目前第一个基于蛋白质组学和转录组学数据,为IgG4-RD潜在的发病机制提供新见解的研究。已知IgG4-RD存在强烈的免疫应答,不同的T细胞亚群可能与相关组织中的B细胞亚群相互作用,进一步导致向下的纤维形成。作者查阅了大量文献,IgG4可以介导抗原捕获,进而导致浆母细胞/浆细胞抗原呈递等。于是,作者着眼于挖掘IgG4-RD潜在的发病机制。作者在验证中使用了来自GEO数据集的转录组数据,包括GSE40568和GSE66465。并通过加权相关网络分析(WGCNA)这种模块化数据处理,分析出与IgG4-RD相关的基因模块。随后,就是筛选差异表达蛋白,KEGG通路富集。结果表明,IgG4-RD组与对照组共检测到组织中差异表达蛋白980个,血清中差异表达蛋白94个。WGCNA分析在组织和PBMC中分别检测到354和247个与IgG4-RD相关的基因。作者同时还发现IgG4RD样品中的DEPs富集于多种免疫相关活性,包括细菌/病毒感染和血小板激活,以及一些免疫相关信号通路。研究发现“Fcγ- r介导的吞噬”过程在IgG4-RD组织中显著富集,这可能提示了其在IgG4-RD发病机制中的潜在作用。在IgG4-RD组织中,作者的蛋白质组学研究显示IgG3水平显著升高,而IgG1仅表现出升高的趋势。这些线索表明IgG3在IgG4- rd中的潜在作用,至少部分是通过Fcγ受体介导的吞噬作用,这可能是IgG4+浆母细胞/浆细胞介导的另一种抗原递呈来源。并且作者还发现IgG4-RD组织中CXCL13、IL-27、IL-18等多种细胞因子水平均显著升高。细胞因子在免疫炎症过程中发挥重要作用。随后的GEO数据库的蛋白质组学和转录组学数据的富集结果,与上述富集做对比。作者根据IgG4-RD的组织蛋白质组学特征,又鉴定出几个可能参与IgG4-RD发病机制并发挥重要作用的Hub蛋白。这些蛋白大多是免疫反应中重要的信号成分,其中一些制剂甚至已应用于其他疾病的临床治疗。因此,通过实验室实验验证这些蛋白在IgG4-RD中的致病作用后,这些药物有可能成为靶向IgG4-RD的治疗药物。综上,作者首次通过蛋白质组学和转录组学数据对IgG4-RD进行了整合分析,并描述了这种神秘疾病的生物学过程,提示了一些潜在的致病分子和免疫炎症反应,并为IgG4-RD的治疗提供了几个潜在的治疗靶点。由此,作者可以有依据得出结论,发现可能参与IgG4-RD发病的多个过程/因子和多个信号通路,以及一些潜在的IgG4-RD治疗靶点。
通过自己的临床样本进行了一套“挑、圈、联”。得到一些富集结果后,大样本的公共数据集拿来继续一套“挑、圈、联”!聪明的不像话呀!大家想想单纯的生信,这两个数据集内容不够丰富吧,单纯的小样本临床数据上不了档次吧~作者就是这么巧妙地一结合!分分钟5分+!
但本篇文章重点在于探讨机制,而对临床意义和预后并没有进行比较客观的分析。如果可以有临床预后信息,并在文章中涉及一部分预后分析,相信这篇文章的档次还能再提升一大截。但也有可能确实是条件不足等原因。重点分析发病机制也是非常不错的选择呀!
本范文的研究思路非常值得借鉴。尤其是苦于没有前期的,研究非肿瘤方向的小伙伴们。菠小萝总结一个小技巧:生存预后等临床信息不够怎么办?间接机制拿来凑!
好啦,今天的分享就到这里~我们下期再见吧,下期还有精彩哦~一定要关注我呀!感谢大家的支持呢!拜拜啦~
参考文献
[1] Cai S, Chen Y, Lin S, Ye C, Zheng F, Dong L. Multiple Processes May Involve in the IgG4-RD Pathogenesis: An Integrative Study via Proteomic and Transcriptomic Analysis. Front Immunol. 2020 Aug 20;11:1795. doi: 10.3389/fimmu.2020.01795. PMID: 32973752; PMCID: PMC7468437.
往期传送门
重磅最新消息!DeepMind首次突破蛋白折叠的历史难题,这项AI技术能否成为生信领域的下一匹黑马?
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END

撰文丨菠小萝
排版丨四金兄
值班 | 弘  毅

主编丨小雪球
长按识别二维码免费包邮领取!

继续阅读
阅读原文