领略高端套路,发表高分文章!
小伙伴们大家好,我是菠小萝。这里是菠小萝的高分生信SCI解读专栏。本周我要与大家分享的是一篇2019年7月发表在《J Natl Cancer Inst》上,题目是“Genomic, transcriptomic, epigenetic, and immune profiling of mucinous breast cancer”,最新影响因子11.577。大家跟着菠小萝学过了不少TCGA数据库大样本&多数据类型的泛癌研究了,难道只有泛癌才能发10分+?今天菠小萝就为大家介绍这篇仅有2张Figure的单癌种高分生信文章,保证你们大开眼界。
期刊信息
题目要素拆解
疾病Breast cancer ;
目的基因Unknown;
数据来源Genomic, transcriptomic, epigenetic, and immune profiling(包含这么多数据类型的数据库非TCGA不可);
机制可能是分子间的相关性及互作;
研究目的多组学整合分析诊断/预后型文章。
背景知识
浸润性导管乳腺癌(IDC)是乳腺癌最常见的组织学类型,但也有少量亚型,如黏液性乳腺癌(MuBC)。本文研究的疾病是单纯黏液性乳腺癌(MuBC),与浸润性导管癌(IDC)相比,MuBC患者一般年龄较大,预后良好,但在病理水平上,肿瘤细胞漂浮在细胞外黏液中。MuBC的特征在于细胞外粘蛋白的存在,通常表达雌激素(ER)和黄体酮(PgR)受体,缺乏HER2扩增。MuBC患者通常年龄较大并且预后良好。虽然早期的研究发现初级黏液样本和IDC样本在基因表达、拷贝数和突变水平上存在差异,但先前的研究从样本数量或从技术角度来讲都比较局限。
为了揭示MuBC的分子结构,我们应用低通全基因组测序和显微镜评估基质肿瘤浸润淋巴细胞(TIL)对30个MuBC的回顾性研究队列。我们进一步分析了两个独立的数据集,包括28个MuBC和429个雌激素受体阳性/ her2阴性的IDC。MuBC的特征是低TIL水平(中位= 0%,平均= 3.4%)。与IDC相比,MuBC具有更低的基因组不稳定性(尽管在多次测试校正后没有统计学意义),以及PIK3CA突变发生率降低(IDC为39.7%,MuBC为6.7%,P=. 008, 34.8% vs 0%, P=.006)。最后,我们的报告确认MUC2异常的DNA甲基化可能是MuBC细胞外产生粘蛋白的一个原因。
本项研究的目的即,通过TCGA & ICGC两大数据库的大样本队列研究,在基因组和免疫水平上分析转录组、基因组和DNA甲基化水平的差异,并由此进一步阐明这种疾病的生物学效应先前有研究表明,MuBC通常显示低TILs水平,只有5/30(16.7%)的肿瘤有>10% TILs。因而,作者进一步评估基质肿瘤的浸润性淋巴细胞,以阐明MuBC的分子结构,并分析可能存在的MuBC细胞外产生粘蛋白的原因
数据来源 & 思路框架
本文主要研究的内容是,通过训练一个回顾性研究数据的基因组和免疫水平,包括在1989年1月至2015年12月间在Jules bort研究所确诊的103例MuBC患者,使用了这些患者病理样本和低通全基因组测序数据,并评估了TIL的浸润情况。并在TCGA & ICGC两个独立的数据集中验证,使用了两数据库中转录组和基因组数据。由于MuBC的基因组改变相对较少,作者又进一步研究了DNA甲基化驱动模式,使用HumanMethylation450K芯片的DNA甲基化数据,能够进一步阐明这种疾病的相关生物学。
数据精析
”——差异分析
)全基因组差异分析
首先,第一步仍然是组间的差异分析,本文在这一部分涉及到疾病全局和部分两方面的差异比较。一者是疾病间的差异分析,另外就是两验证队列间的差异比较。通过大样本、全基因组的数据分析以明确肿瘤内TIL分布差异以及存在的空间异质性
1

IDC与MuBC的基因组改变
作者在纳入研究的26例MuBC病理样本中比较肿瘤内TIL分布存在空间异质性。作者为了扩大数据量,选择了大样本的全基因组分析全基因组分析。结果显示,同一原发肿瘤不同区域间的差异≥15%。并且测序显示除了两个肿瘤样本之外的所有肿瘤都是二倍体,并且几乎没有体细胞拷贝数变异(Fig.1A),与之前的报道一致。虽然有报道称这些扩增在复发的MuBC患者中富集,但是本文的队列患者中,没有一个具有任何上述扩增的患者复发。于是,作者进一步比较了ICGC和TCGA中ER+/ HER2- IDC与MuBC的基因组改变。在ICGC数据中,两种组织学之间未观察到临床病理学特征的统计学显着差异。
(Fig.1A)
也就是说,很少有体细胞拷贝数变化ICGC数据表现出较低的单核苷酸变异,插入,重组和多倍体突变负荷。
2

ICGC和TCGA队列差异比较
在ICGC的MuBC数据集中,PIK3CA突变率为IDC 39.7% vs MuBC 6.7%,p=0.01;TCGA的MuBC数据集中,PIK3CA突变率为IDC 34.8% vs MuBC 0.0%, p=0.02(Fig.1B-E)。即MuBC的特征是低肿瘤浸润淋巴细胞水平,并且与IDC相比,MuBC具有较低的基因组不稳定性和较低的PIK3CA突变率(Fig.1F)。
(Fig.1B-E)
PS:这里简单介绍一些基因组不稳定性的理解。首先,基因组不稳定性(CIN)和发生突变是癌症发生的重要标志之一。主要代表在肿瘤细胞有丝分裂时染色体分离错误,导致子细胞中整条染色体非整倍体突变,或者DNA损伤引起染色体结构改变,造成的基因易位、缺失、反转、断裂等的统称。
在基因的突变和重排方面,作者观察到在MuBC中载脂蛋白(Apobe)相关的基因表达显著降低。尽管结果在统计学上不显著,在MuBC中PIK3CA突变的频率显著低于IDC,且MYC和ZNF703/FGFR1在MuBC中扩增(Fig.1G-H)。TCGA队列中观察到癌症基因改变频率的类似差异(Fig.1I-J)。
(Fig.1G-J)
)DNA甲基化数据差异分析
1

差异甲基化程度及差异位点分析
由于MuBC中存在相对较少的基因组改变,那还需要继续找出MuBC细胞外产生粘蛋白的原因。一种数据类型没变化,当然要换其他类型的数据继续分析啦~阴性结果总是能在一定程度上佐证阳性结果的,所以并不要慌。既然表型有差异,那一定存在导致这种差异的原因。于是,作者进一步研究其典型表型是否可以由特定的DNA甲基化驱动模式作者使用了两大数据库中HumanMethylation450K甲基化芯片数据生成数组,确定了ICGC和TCGA的ER+/HER2- IDC和MuBC的差异甲基化CpGs 。结果非常令人兴奋,在MUC2中存在许多差异甲基化CpGs(ICGC中有14个,TCGA中有18个,其中12个很常见)。那就说明MUC2是接下来研究的重点。
MUC2属于粘蛋白家族,它是大型糖蛋白,要么是膜结合的,要么是成胶的。在不同器官的黏液肿瘤(包括乳腺癌)中,分泌凝胶形成黏液蛋白MUC2的蛋白过表达已被报道。这就更令人兴奋啦!
2

MUC2基因表达与甲基化水平的相关性
确定了差异位点,那就继续对比吧~与IDC相比,在ICGC和TCGA中,MuBC的mRNA水平也出现过表达MUC2(Fig.2A & D)。作者进一步计算了两个基因表达签名,并观察到在ICGC和TCGA中,只有形成胶蛋白(“Gel-MUC”)和膜结合胶蛋白(“Membrane-MUC”)的形成在两种肿瘤组织间存在统计学差异(Fig.2B-C & E-F)。作者又查阅文献发现位于启动子区域的CpGs的DNA甲基化,在调控一些凝胶形成黏液的表达中可能发挥的作用。
(Fig.2B-C & E-F)
于是,作者进一步研究差异甲基化位点,发现直到第一个外显子出现前,MUC2在MuBC中才发生显著低甲基化。说明MUC2甲基化水平和基因表达之间具有统计学意义的负相关。然而,在更下游的外显子中,与IDC相比,CpGs在MuBC中被高甲基化。这些结果在两个队列中是一致的(Fig.2G-H)。
(Fig.2G-H)
综上所述,作者的发现在一定程度上完善了关于MuBC这个小众癌种的的低基因组不稳定性的研究结果。并进一步强调了其低免疫浸润状态,可能是被作为免疫识别障碍的细胞外粘蛋白阻碍了。由此提出MUC2的差异甲基化可能是这些肿瘤细胞外产生粘蛋白的机制。
到这里,文章就结束了!虽然看似有些戛然而止的感觉,但是范文却是一个非常完善的队列研究。既有自己的数据集,又有公共数据集的结果验证。不仅仅有验证这么简单~而且还是毫不敷衍的两个大样本公共数据库!有了数据库的验证作者还嫌不够,还有多组学的验证!这篇文章真的回味无穷~引人深思~生信界绝对是卧虎藏龙~不发不知道,一发吓一跳呀~如此简洁清晰的文章框架,如此丰富的数据量和多组学分析。既有临床样本病理组织和全基因组测序数据,又有两大权威数据库验证支持!
我只能说一句,快点学起来吧小伙伴们!把细碎的思路整合起来,多多运用才能融会贯通。菠小萝教给大家的绝对不是死板的套路,生信文章就有这么一个特点,每篇优质的文章,都是各种套路的“套餐”,拼出来总是独一无二的。这也是当代生信飞速发展的原因,只要你能说出个所以然,数据一验证,就是篇文章。至于文章的层次嘛~还记得我们分析题目的五大要素吗?哈哈哈点到为止~跟着菠小萝品读高分生信,每周带给你新鲜感~
思路总结
菠小萝想总结给大家的是,一篇好文献在于它的科学假说和思路框架。几张Figure不重要,但重要的是研究中用到的数据和研究方法。这里数据包括对样本量和质量的要求。无论是泛癌还是单一癌种,最好纳入多数据库的样本,一是扩大样本量,二是排除一些混杂因素的干扰,增加分析结果的可信度。
我们再回顾范文,浸润性导管乳腺癌(IDC)是乳腺癌最常见的组织学类型,而纯粘液性乳腺癌(MuBC)是一种特殊的乳腺癌组织学亚型,占所有浸润性乳腺肿瘤的约2%。MuBC的特征在于细胞外粘蛋白的存在,通常表达雌激素(ER)和黄体酮(PgR)受体,缺乏HER2扩增。MuBC患者通常年龄较大并且预后良好。尽管有早期研究揭示MuBC和IDC样本之间基因表达,拷贝数和突变水平的差异,但受限于样本数量或技术水平。
本篇文章出发点找到很好,第一是小众癌种,第二是不仅纳入了自己的临床数据,还对两大数据库进行了队列研究。通过分析MuBC和IDC样本之间基因表达,拷贝数和突变水平的差异,揭示MuBC的分子结构。再基因组数据分析没有得到显著结果后,作者又利用甲基化数据分析,通过获得差异甲基化位点,确定MUC2在MuBC中的重要意义。并进一步表明MUC2基因的DNA甲基化异常可能是MuBC胞外粘蛋白产生的原因。
尽管两大数据库中MuBC病例个数也并不是很理想,但作者改进了以前关于MuBC较低基因组不稳定性的文献的结果。结果发现,低免疫浸润状态下,可能被细胞外粘蛋白作为免疫识别屏障而阻碍。并且本研究结果中比较有价值的地方,就是首次报道了MUC2的差异甲基化作为这些肿瘤中细胞外粘蛋白产生的可能机制。
好啦,小伙伴们~本周的分享接近尾声,本篇范文虽然仅用了两张Figure,但言简意赅,一张Figure说明了基因组数据分析,另一张则是甲基化水平的差异分析哦~一个阴性结果,一个阳性结果,缜密的逻辑和严格的队列研究设计,让这篇文章显得格外精彩!有兴趣的小伙伴可以再细细品味~后台回复“菠小萝MUC2”获取范文原文哦,我们下周再见吧,拜拜!
往期传送门
重磅最新消息!DeepMind首次突破蛋白折叠的历史难题,这项AI技术能否成为生信领域的下一匹黑马?
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END

撰文丨菠小萝
排版丨四金兄
值班 | 先锋宇

主编丨小雪球
长按识别二维码免费包邮领取!

你的国自然还差最后临门一脚!


Get了国自然选题的秘诀!

Get了如何写好一份国自然标书!

详细了解了最新指南的方向与重点!

国自然申请
是你面临的最后问题!


本期直播酸菜老谈直播讲解:

---
国自然申请常见的十大天坑
---

国自然申请时哪些问题必须要注意?

1月28号
解螺旋直播间来听听详解!


点击下方
视频号-预约直播
酸菜老谈助你冲刺国自然


👇👇👇



周四酸谈直播基本信息
主题
:《国自然申请常见的十大天坑》

日期
:1月28日 18:00—20:00


(👆点击“预约”就完事了!!!)
继续阅读
阅读原文