3030分+遗传谱系纯生信分析再次解析万能的TCGA
小伙伴们大家好,我是菠小萝。这里是菠小萝的高分生信SCI解读专栏。感谢作者为我们提供了很好的学习典范!今天带给大家的是一篇关于癌症遗传祖先及其分子相关性的综合分析,于2020年4月发表在《Cancer Cell》上,题目是“Comprehensive Analysis of Genetic Ancestry and Its Molecular Correlates in Cancer”。本篇研究分析了不同肿瘤类型的突变率、基因和miRNA表达以及DNA甲基化。分离混杂因素并确定可能解释癌症病因和治疗的祖先相关效应。
期刊简介
知识背景
最近一项TCGA泛癌突变研究中提到,很多突变对癌症的发展或许会产生小的个体效应,但并未出现可观的累积效应。于是通过对乘客突变进行分析,从而帮助解释了近10%的癌症病例。临床上常常存在一些机体中很少或并未发现明确的遗传驱动子的患者,一类乘客突变或会对基因组区域产生显著影响,其程度与驱动子相当,总体上也会对肿瘤的生长产生显著影响。
肿瘤的突变机理大家应该了然于心,对于细胞的原癌基因被激活和抑癌基因失活的机制大致包括病毒介导的调节作用,或是各种形式的点突变,小片段基因的插入、扩增、缺失,拷贝数变异等结构变异、染色体易位等。另有包括DNA的甲基化修饰和组蛋白氨基端的修饰等在内的表观遗传学改变机制。除此之外,尚有DNA修复机制的缺陷等因素。由于对祖先的关联分析很少用于解释不同祖先之间癌症亚型的不同患病率,这可能会掩盖亚型之间的差异。
本篇文章是从不同祖先的人表现出不同的种系遗传学特征出发的,并对癌症中与祖先相关的分子特征差异进行全面的解释。通过评估33种癌症类型中mRNA和miRNA表达以及DNA甲基化和突变的祖先关联。
数据精析
、TCGA 数据库整体血统分析
图1
作者通过五种独立的分类方法确定了每个TCGA患者的祖先,图1A -B展示了每种方法采用SNP阵列和/或外显子组测序数据进行分析的结果和33种癌症类型,其中13种分为预定义的亚型。对于体细胞改变、甲基化、mRNA和miRNA表达以及跨平台数据这些数据类型,进行了泛癌和组织特异性多元回归分析,以控制癌症类型和亚型。图1C反映了在一些情况下,祖先与不同的亚型相关。作者还对了相对于其全基因组水平的混合物进行评估,分析个体基因座是否富集于AFR或EUR血统。图1D展示了在控制多个假设后,没有一个位点达到统计上显著的富集水平。
、与祖先有关的躯体改变
图2
图2展示的是关于体细胞改变的总体负担相关性分析。在泛癌分析中观察到AFR和非整倍体(p=0.004)以及EAS和肿瘤突变负担(TMB;p=0.02)之间存在显著相关性。然而,对癌症亚型的控制消除了这两种相关性。并进一步在基因水平上评估了体细胞突变和拷贝数改变(SCNA)频率。图2A为在泛癌分析中初步确定AFR个体中的三个基因和EAS中的一个基因相对于EUR存在显著差异。图2B展示膀胱癌和食管癌分别富含HRA(OR=6.6;q=0.03)和NFE2L2(OR=11.6,q=0.07)突变。只有泛癌分析才能确定FBXW7中的差异突变率,这一发现表明这些差异跨越了不止一种癌症类型。为了避免癌症类型特异,研究进一步验证了外部队列中VHL、PBRM1、HRA和NFE2L2突变与祖先之间的关联。图2C-D 分别展示TCGA和FMI队列中的VHL(分别为Wilcoxon p=0.02和p<0.001)和TCGA中的PBRM1(p=0.007;)。
接下来,为了证明FBXW7、VHL和PBRM1基因座的种系遗传学促进癌症形成,作者通过控制全球EUR和AFR祖先率,询问在AFR祖先至少为10%的样本中,这些基因座是否有AFR或EUR祖先的局部富集(图1D)。发现在每种情况下,突变率较高的祖先在基因位点富集:AFR祖先在FBXW7(OR=1.001)和EUR祖先在VHL(OR=1.822)和PBRM1(OR=1.221)。然而,没有一项具有统计学意义,即这些基因座的种系特征可能与癌症无关。然而,EAS和EUR BLCA样本之间的特征表明,诱变剂暴露不是这些样本之间HRA突变率差异的主要混杂因素。图2E 展示在VHL和PBRM1在EUR中比AFR KIRC样本更频繁。这表明VHL和PBRM1突变在EUR KIRC样本中富集。
、祖先相关的差异DNA甲基化
图3
图3A为显式SNP的阳性对照,图3B为AFR和EUR 样本、泛癌和六种癌症类型之间的回归系数和差异显着性。代表泛癌分析中的重要位点在大多数癌症特异性分析中显示出类似的祖先关联。图3C为相同基因探针之间的一致祖先偏差,与多个祖先差异甲基化位点相关的基因对祖先效应的支持最大。具有至少四个祖先差异探针的基因被着色。图3D为甲基化变异尚未被描述的基因。上两图包括了聚集在基因启动子或转录终止位点(TTS)的探针。图3E为SPATC1L的启动子甲基化与四个祖先群体中的SPARC1L mRNA水平呈负相关,表明对基因转录有影响。图3F即在 149 个全基因组亚硫酸氢盐测序样本中检测到的祖先相关差异甲基化区域 (A-DMR)。显示了PM20D1 启动子和 HOOK2 基因体增强子位点。图3G显示隔离探针也可以是 A-DMR 的一部分。并显示AFR样品中优先缺乏甲基化。即这是一种潜在的 A-DMR。
、mRNA与祖先遗传谱系的关联
图4
在校正批次、组织类型和亚型的泛癌分析中,研究发现327个基因的AFR和EUR样本之间以及654个基因的EAS和EUR样本之间存在显著的mRNA表达差异(图4A-B)。先前的GTEx联盟分析确定了221个与AFR祖先相关的蛋白质编码基因,其中44个与上述分析重叠(图4C-D)。4E-F显示在至少33%的癌症类型中具有显著性。
、miRNA与祖先遗传谱系的关联
图5
在跨祖先的miRNA分析中,一个重要的考虑因素是与种系变异相关的伪影的可能性。图5A-B 为在泛癌分析中筛选后的149个miR通过显著性阈值FDR q<0表现出祖先差异表达。较少的miR在单个癌症类型或亚型中表现出相关性,BRCA中最多有54个miR。因此,与甲基化和mRNA结果类似,不同癌症类型之间有足够的共同性,因此泛癌分析中增加的力量确定了更多的关联。然而,与甲基化和mRNAs一样,泛癌miRNA分析中的关联仅代表祖先之间的微小差异;没有人在表情上有双重变化。相反,癌症类型之间的关联通常表现出更大的差异,有时超过四倍(图5B)。然而,在这66个宿主miR中,约有一半的宿主基因的表达未经TCGA评估。
图5C、D为相同基因的探针(点)之间的一致祖先偏差。具有至少四个祖先差异探针的基)因被着色。图5E为SPATC1L启动子的甲基化与基因表达降低(纵轴)相关。图5F为在 149 个全基因组亚硫酸氢盐测序样本中检测到的祖先相关差异甲基化区域。图5G隔离探针也可以是 A-DMR 的一部分。
、祖先关联与种系遗传学的关系(eQTL)
图6
根据上述分析, 在DNA甲基化和RNA表达中观察到的祖先关联提出了两个问题:第一,这些与种系遗传差异有何关联;第二,这些差异与癌症有何关联?
作者试图通过鉴定与之前鉴定的mRNA差异相关的祖先相关表达数量性状位点(EQTL)来解决第一个问题。通过确定编码祖先相关基因的位点是否在癌症患者的祖先之间非随机分布来解决第二个问题。
mRNA表达中的祖先关联可能是由于不同祖先群体所经历的基本遗传学或环境的差异,在前一种情况下可能期望识别EQTL。因此,作者评估了顺式和反式EQTL可能解释祖先差异mRNA表达的程度。首先,通过使用TCGA队列匹配的正常样本(n=10678)测试SNP基因型比例与祖先之间的关联,确定了大约85%的测试SNP与祖先有关。,作者将与祖先相关的遗传多态性与癌症顺式和反式EQTL相结合,以发现与癌症类型特异性EQTL重叠的祖先相关SNP。针对至少有10个少数群体样本的癌症类型,观察到与祖先特异性基因表达相关的不同数量的癌症类型特异性顺式QTL。图6A-B为顺式EQTL中64-90%的祖先相关遗传变异。图6C为与顺式或反式EQTL相关的许多祖先相关表达差异,可以通过这些基因座下的基因型频率差异来解释。由此说明种系遗传变异可以部分解释不同人群中mRNA表达的差异,并具有癌症类型特异性。
、整合分析——祖先相关途径和细胞状态
图7
考虑祖先相关的差异涵盖了所有分子特征和数百个基因,但生物学上的显著差异通常是组织特异性的,而不是肿瘤特异性的。作者整合了上述分子数据,说明了两个问题。第一,甲基化的祖先相关差异是否解释了mRNA表达的祖先相关差异;第二,所有这些分子特征结合在一起是否表明特定分子途径激活的一致差异。作者在8种肿瘤类型中观察到AFR组和EUR组之间的显著差异特征。然而,只有BRCA在具有至少10个差异下游靶点的Hub节点中提供了显著差异(图7A-B)。图7C显示了EAS和EUR的BLCA亚型样品中 MYC/Max 复杂的IPL。即在七种肿瘤类型中观察到不同的特征,但仅在BLCA、BRCA和ESCA中发现了关键的调节节点。图7D则根据亚型调整分析,通过评估已知的癌症途径和驱动基因是否在亚型调整分析中推断IPL的差异范式基因中过度表达,展示了显著富集的途径。发现在祖先组之间的差异通路特征中丰富的癌症相关基因和通路。图7E、F分别展示了EAS血统与免疫浸润评分的关联,及编码PD-L1的CD274在所有 AFR、EAS 和 EUR 血统中的表达这些在亚型调整分析中均不显著,表明它们反映了亚型的丰富。其中图7E为在EAS中控制年龄、性别、亚型、TMB和非整倍体后,根据mRNA表达估计,BLCA因免疫浸润而减少。
综合和通路分析表明,其中一些差异与癌症有因果关系。具体发现包括非洲裔患者的FBXW7突变增加,非洲裔肾癌的患者VHL和PBRM1突变减少,东亚裔膀胱癌患者的免疫活性降低
全文总结
本项研究评估了癌症基因组图谱中33种癌症类型的10678名患者的祖先对突变率、DNA甲基化、mRNA和miRNA表达的影响。可以从四个方面显示对祖先的分子和细胞效应的理解。首先,通过检测新的祖先相关分子特征和癌症类型。第二,通过确定祖先效应是癌症或组织类型特异性的,还是跨类型的共同效应。第三,通过增加检测共同效应的能力,使用不同癌症类型的综合数据。第四,整合跨平台分析。丰富的分子数据还可以实现精确的癌症亚型分类,从而能够精确计算癌症亚型祖先关联。
结果证明了癌症亚型是重要的混杂因素,但没有得到充分的解释。由于生物学上的显著差异通常是组织特异性的,整个研究跨越了所有分子特征和数百个基因。具体的结果包括非洲裔患者FBXW7突变增加,非洲裔肾癌患者VHL和PBRM1突变减少,东亚裔膀胱癌患者免疫活性降低。
好了,这篇30分+的TCGA数据库纯生信高分文献就解读到这里了,后台回复“1119”获取范文一起学习吧,下期再见了,拜拜!
参考文献
[1] Carrot-Zhang J, Chambwe N, Damrauer JS, Knijnenburg TA, Robertson AG, Yau C, Zhou W, Berger AC, Huang KL, Newberg JY, Mashl RJ, Romanel A, Sayaman RW, Demichelis F, Felau I, Frampton GM, Han S, Hoadley KA, Kemal A, Laird PW, Lazar AJ, Le X, Oak N, Shen H, Wong CK, Zenklusen JC, Ziv E; Cancer Genome Atlas Analysis Network, Cherniack AD, Beroukhim R. Comprehensive Analysis of Genetic Ancestry and Its Molecular Correlates in Cancer. Cancer Cell. 2020 May 11;37(5):639-654.e6. doi: 10.1016/j.ccell.2020.04.012. PMID: 32396860; PMCID: PMC7328015.
往期传送门
重磅最新消息!DeepMind首次突破蛋白折叠的历史难题,这项AI技术能否成为生信领域的下一匹黑马?
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END

撰文丨菠小萝
排版丨四金兄
主编丨小雪球
继续阅读
阅读原文