探索生信之美,解读每篇文章背后的故事
大家好啊,我是风间琉璃。今天我们不学R,来学习一篇2021年新出炉的高分文献。粗略一看,只感觉文章里面的Figure平平无奇,甚至还有一丝丝平庸的味道,却荣登当红明星期刊《nature communications》。那其中就有什么奥秘呢?今天我们就来一探究竟。文章 “Skeletal muscle transcriptome in healthy aging”解读,走起!
 m6A系列传送门 
〇、期刊信息
一、文献导读
正常个体随着年龄增长,骨骼肌也会随之老化。但是潜在的正常老化的生物学机制并不明确。因此在研究的第一步需要找到在健康人群里整个生命周期中发生系统性变化的分子。但之前的研究并没有从根据严格的临床和功能标准对广泛年龄范围内的非常健康的个体进行纳入研究。因此,本篇研究对53个健康个体(22-83岁)的肌肉活检进行测序,并通过线性回归(linear regression model)以及负二项分布模型(negative binomial regression model)筛选出与年龄明显相关的RNA。并对RNA的不同转录本进一步探索分析,从而找到在正常老化过程中具有重要作用的RNA。
接下来我们根据文章的主要结果,通过挑圈联靠四字心诀来细细解读。
二、挑:Ensembl gene(ENSG)差异分析
首先作者对研究对象——53个健康研究者的基本资料进行分析,研究对象平均年龄为52岁,其中大部分(n=33)为白种人。并根据52岁作为阈值,分为年轻组和老年组。两组间腰围、空腹血糖、体能、400米步行距离均具有显著差异。
接下来作者对研究对象的骨骼肌测序数据进行处理分析(Figure 1a),平均每个样本检测24453个基因,其中15291个事蛋白编码的基因,另外9162个则是非编码基因。通过线性回归分析,作者找到664个与年龄正相关的基因和57个与年龄负相关的基因(Figure 1b)。另外通过负二项分布(标准和0校正两种方式)模型发现了854个与年龄正相关的基因和65个与年龄负相关的基因(Figure 1b)。根据两个模型得到的差异基因结果进行取交集之后,得到506个基因显著与年龄相关(483个在老年组上调,23个在老年组下调)(Figure 1c)。并绘制了共同差异基因集在不同样本的表达热图(Figure 1d)。
(Figure 3)
为了进一步深度挖掘和验证差异基因集。作者展示了前20个在老年组上调/下调基因的具体信息,包括Ensembl ID、差异分析的P值、β值以及主要涉及的功能(Figure 2a和3a)。并且展示前10个在老年组上调/下调的基因和年龄的相关性散点+线性回归图(Figure 2b和3b)。
(Figure 2)
(Figure 3)
三、靠:RT-qPCR临床验证
为了进一步验证最具有显著差异的基因和年龄的相关性。作者对已有的研究对象中仍能够获得骨骼肌RNA的个体进行实时定量PCR(RT-qPCR)验证。并选取8个在既往的研究中同样明确与年龄相关的基因进行验证。其中有4个基因FAM83B、NR2F2、LGI1、C12orf75具有明确的统计学差异(P<0.05),但另外四个基因虽然在老年组高表达,但并没有统计学意义(Figure 4)。这可能和比较少的样本数有关(n=5)。
(Figure 4)
四:联:蛋白组学分析
作者为了进一步探索具有明显表达差异基因是否在蛋白水平同样表现出明确的差异以及和RNA的相关性。作者对相同的骨骼肌样本进行液相质谱分析(shotgun liquid chromatography-mass spectrometry method),一共测定了4281个蛋白的表达量。和以前的研究结论相同,mRNA和对应蛋白的相关系数类似于集中于0附近对称的、准正态分布,并且大于0的关系对要多于小于0的(Figure 5a)。接下来作者展示了4281个mRNA与年龄的相关系数(β值)以及对应和年龄的相关系数(β值)的散点图(Figure 5b),其中的红点则是122个和年龄明显相关的mRNA。作者进一步展示了这122个mRNA和对应蛋白的相关性热图(Figure 5c)。接下来,作者分析最具有显著差异的39个mRNA中,具有对应蛋白表达谱数据的15个mRNA和对应蛋白的相关性。其中有10个具有明确的相关性(Figure 5d)。
(Figure 5)
五、Ensembl transcript(ENSG)差异分析
除了我们常规的差异基因分析之外,作者同时对同一基因的不同转录本进行定量差异分析。通过线性回归分析,发现1005个RNA(大约1100个剪切突变)与年龄明显相关(P<0.05)。并根据以往的研究,作者筛选出四个基因CFAP61, ESRRG, TET2和PLAG1,展示基因和对应不同转录本和年龄的相关性(Figure 6a-b)。提示即使是同一基因,不同转录本和年龄的相关性也不尽相同。
(Figure 6)
六、差异外显子(exon)分析
由于不同转录本(剪切变异)主要是通过不同的外显子比对、技术拼接得到的,因此作者进一步通过DEXSeq包对与年龄相关的外显子进行差异分析。作者对老年组(>80岁)和年轻组(20-34岁)进行差异分析发现有163个基因具有统计学意义的差异外显子。并以基因SMIM11A为例,第11个外显子在老年组表达明显下调,同时包含对应外显子的转录本表达水平在两组间(老年vs青年)同样存在明显差异(Figure 7)。
(Figure 7)
好啦,文章的主要结果我们就分享完了。作者根据53个健康个体的骨骼肌测序数据分析差异表达的基因、转录本和外显子,并结合前期的研究基础对筛选出的核心的分子进行详细阐述。另外一方面,作者对其中一部分样本进行RT-qPCR,进一步验证具有表达差异RNA。除此之外,作者进一步在蛋白层面,验证明显差异mRNA和对应的蛋白之间的相关性。
整体读完下来,我的感觉是作者研究着力的角度很新颖,是对非常健康个体的自然老化的骨骼肌组织进行生信分析,正如文章中提到的,以前的研究并没有关注这一领域。其次,就算看文章的我们同样有一个全新的领域,无论是50多个样本的肌肉活检取样还是样本RNA+蛋白组测序都是研究的限速步骤。另外,对于RNA-seq数据,作者从基因、转录本、外显子的层层递进式分析同样值得学习。最后,在文章的结果部分作者还结合现有领域的文献对筛选到的差异基因进行了非常详细的说明,比如筛选到基因SLC47A1 (Solute Carrier Family 47 Member 1),作者会进一步阐述在之前的研究中SLC47A1在骨骼肌中广泛表达,并对许多药物的组织分布和排泄具有重要作用
但是话又说回来,除了样本采集和组织测序外,其实我们离《nature communications》就差一个具有创新性的idea,其他的技术瓶颈,多学一学,都能学会的,对吧。所以,小伙伴们,继续加油学习喔!我是风间琉璃,我们下期见~
往期传送门
END

撰文丨风间琉璃
排版丨四金兄
主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文