领略高端套路,发表高分文章!
小伙伴们大家好,我是菠小萝。这里是菠小萝的高分生信SCI解读专栏,带你体验不一样的生信旅程~2020年11月的菠小萝系列文献解读都是基于TCGA数据库的深入挖掘,今天来为大家讲解一篇新鲜出炉的9分+纯生信TCGA数据挖掘文章。题目是
A global and integrated analysis of CINSARC-associ ated genetic defects”,
于2020年10月发表在《Cancer Research》上,最新影响因子为9.727分。范文主要集中于对CINSARC签名功能和机制的研究,结果认为该基因签名能够识别高风险软组织肉瘤,并与高转移潜力相关。利用TCGA多组学研究评估CINSARC表达谱、基因组特征和两种潜在的调控机制:DNA甲基化和miRNA表达之间的关联。
在本研究中,我们CINSARC的表达与倍性的增加、肿瘤内异质性、拷贝数的改变、37个miRNAs表达的改变和DNA甲基化的减少有关。这些基因变化不是独立的,而是共同作用促进或抑制CINSARC的表达。这些发现为CINSARC的调控提供了新的见解。
期刊信息
文献背景
CINSARC已经被成功地开发和验证,目前正在进行两个前瞻性的三期临床试验来评估分层治疗。十年前,作者的研究团队鉴定了参与有丝分裂控制和染色体分离途径的67个基因的转录组特征,并将其命名为CINSARC。这种特征在STS中的表达与转移的发展密切相关,且CINSARC签名的表达与SCGs中常见的基因组不稳定性有关。
在多个独立分析中,作者团队证明了其优于FNCLCC分级系统的预后价值。此外,CINSARC克服了FNCLCC分级的一些重要限制,即不适用于所有的STS,对2级肿瘤的信息不足,难以应用于显微活检或新辅助治疗,而且它具有主观性,因此在病理学家之间存在很大的变数。为了验证其临床效用,作者将CINSARC标记引入了几个前瞻性的3期临床试验中对患者进行分层强化治疗。
虽然CINSARC表达和肿瘤侵袭性之间的联系已经得到了很好的证实,但是关于CINSARC基因是如何被调控的问题仍然存在。在本研究中,作者更详细地定义了与此签名相关的基因组图谱,通过分析验证CINSARC表达的确切驱动因素。
数据图表精析
在对范文围绕CINSARC签名展开的分析有了一定了解后,我们接下来逐步分析范文的数据结果。
TCGA提供了包含206个肉瘤的有价值的已发表数据资源,包括:临床注释、拷贝数畸变(CNAs)、突变负荷、mRNA/miRNA表达谱和DNA甲基化模式。为了了解CINSARC签名的调控作用,作者使用的数据是使用TCGAbiolinks下载的RNA-seq表达谱、miRNA-seq表达谱、甲基化数据及CNAs。
从TCGA官网下载了临床注释,DNA倍性改变,全基因组倍增(WGD),肿瘤内异质性(ITH)和突变负荷相应的数据。通过以上数据能够描述与转移潜能相关的STS中潜在的表观遗传和/或转录后效应。
1

临床数据分析

与大多数生信文章不同的是,本范文先从临床数据入手,这也是由于作者团队之前已有研究基础,是从临床队列研究的结论出发。在6种不同的组织学亚型中,作者选择了复杂基因组学(SCGs)肉瘤作为研究重点:平滑肌肉瘤、未分化多形性肉瘤和黏液纤维肉瘤。
在排除了随访时间不到一年的非转移性病例后,余下的127个样本数据能够正确估计肿瘤进展的风险。结果发现群体之间的遗传变化与CINSARC显著相关。作者在其中选择了77例与之密切相关的核心群体,并根据CINSARC表达进一步筛选预后好的34例作为C1,不良的43例作为C2。
与CINSARC特征的预后价值相一致的是,C1和C2之间的进展率不同,5年无转移生存率分别为69%(95%置信区间:55-87)和34%(95%置信区间:22-55),在生存分析中存在显著差异(Fig.1A)。
并且作者将C1和C2集合的基线资料比较列于Table.1。
2

CINSARC签名基因组特征

接下来是表达差异,在Fig.1B中展示了两组CNAs表达差异。以及Fig.1C中队列发生的基因组失衡的外显率图(累积的增益和损失百分比)。CINSARC C1和C2组分别为蓝色和红色。底部的面板显示了CINSARC组基因组失衡的差异。C2组染色体1p明显增多。
并分析CINSARC预后与全基因组加倍、DNA倍性改变、肿瘤突变负荷和肿瘤内异质性之间的统计相关性(Fig.2)。发现与具有低转移风险的肿瘤相比,具有高转移风险(C2)的肿瘤经历了WGD事件并具有更高的倍性。
3

全基因组甲基化分析

在无监督的分析中,肿瘤具有低水平和高水平的全基因组DNA甲基化与C2和C1分类显著相关(Fig.3A)。在监督分析中,预后不良组中鉴定出3186个高甲基化探针,预后良好组为27683个高甲基化探针(Fig.3B)。作者推测,是否特定的基因组位点,特别是靠近CINSARC基因转录起始位点(TSSs)的CpG岛,可能会发生不同的甲基化,从而可以解释签名的表达/抑制。
于是,作者绘制了所有探针的基因组区域及其在C1和C2组之间的差异甲基化(根据m值差异),并观察了显示DNA甲基化变化的基因组簇(Fig.3C)。为了评估这些位点是否具有统计学相关性,作者尝试使用三种应用算法识别差异甲基化区域(Fig.3D)。
结果发现所有这些DMPs在C1组都是高甲基化的,但其中的近一半的启动子位于它们各自最近的转录起始位点(TSS)下游超过1kb的位置,表明启动子甲基化没有差异。这一数据表明,CINSARC标记的表达与明显的全局DNA甲基化变化相关,但不存在CINSARC基因的局部差异甲基化
4

CINSARC签名相关miRNA调控

作者从C1组和C2组的差异表达分析发现,C2组有37个miRNAs过表达,而C1组没有过表达(Fig.4A)。
并发现其中有18个与超过10项癌症研究相关,其中12个与高比例的文献相关(Fig.4B)。在C2组中,不仅这些mirna与CINSARC基因一样高表达,我们还测量到,通过表达基因与感兴趣的mirna之间的线性回归分析,在29个mirna中,CINSARC基因在所有显著相关基因中排名最高(Fig.4C)。
并且miRNA一定少不了数据库分析,作者利用miRTarBase分析了实验miRNA-RNA相互作用来研究这37个miRNAs是否有助于关键的生物学过程。
5

CINSARC基因型的综合分析

作者对与CINSARC特征相关的所有识别的多组学特征进行整合分析,包括CNA水平、WGD、肿瘤DNA倍性、ITH、整体甲基化水平和miRNA表达(作为C2组37个miRNA过表达的平均z分数;值越高,所有这些mirna的整体表达越高(Fig.5A-B)。在该模型中,与DNA倍性相关的WGD在所有参数中贡献最大。除了WGD和DNA倍性,CNAs的数量和miRNA的表达鉴定了一组多倍体和重排,以及表达这些特异miRNA的肿瘤。
总结这一综合分析,甲基化水平和miRNAs表达是有价值的CINSARC指标,在其他几个遗传特征中,参与识别几个亚群。特别是,在近二倍体肿瘤的背景下,该基因特征有助于在C1和C2基因型之间分层。
小结
经过以上结果剖析,我们来总结一下全文。CINSARC签名可识别高风险软组织肉瘤,并与高转移潜力相关。且CINSARC目前作为前瞻性的标志物参与了多个3期临床试验,提示对高危患者的强化治疗,这一认识尤其重要。
在本研究中,作者利用TCGA多组学研究对具有复杂遗传学的肉瘤进行研究,以评估CINSARC谱、基因组特征,以及两种潜在的调控机制,即DNA甲基化和miRNA表达之间的关联。
接下来作者分析了CINSARC的表达与DNA倍性的增加、肿瘤内异质性、拷贝数的改变、37个miRNAs表达的改变和DNA甲基化的减少有关。这些基因变化不是独立的,而是共同作用促进或抑制CINSARC的表达。这些发现为CINSARC的调控提供了新的见解。
往期传送门
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END

撰文丨菠小萝
排版丨四金兄
值班 | 小雪球

主编丨小雪球


END
继续阅读
阅读原文