Methsurv数据库:肿瘤DNA甲基化数据生存分析
嗨,小伙伴们大家好!新的一周我们继续甲基化修饰的话题。上期推文为大家介绍的是DiseaseMeth数据库,帮助小伙伴们在甲基化研究单变量论证环节增加了一张重磅临床相关性分析的Figure,这周带大家学习一款肿瘤DNA甲基化生存分析数据库Methsurv,为大家甲基化研究再添一图,其中玄妙一起来看看吧~!
 甲基化数据库系列传送门 
数据库概览
Methsurv数据库网址(https://biit.cs.ut.ee/methsurv/),基于TCGA GDAC Firehose数据集中25种癌症的7358个甲基化数据,提供目标基因及基因亚区域CpG位点与患者基线特征(年龄、性别、身高、体重和种族等)和临床病理特征(肿瘤分期、等级等)的单因素和多因素生存分析、聚类分析及结果可视化功能。其中,基因亚区域包括TSS200(转录起始位点上游200 bp)、TSS1500(转录起始位点上游1500bp)、第一个外显子、5'UTR、Body、3'UTR,以及其他CpG岛区域如S_Shore和N_Shore(CGI上游和下游2kb)、S_Shelf和N_Shelf(CGI上游和下游2-4kb)及OpenSea(剩余区域)。Methsurv数据库用于初步筛选肿瘤预后相关的基因及甲基化修饰位点,为甲基化研究筛选主变量环节提供极大便利。
点击Quick start快速浏览数据库核心功能,随后将详细介绍;点击Download下载数据库源数据;点击FAQ查看常见问题,官方推荐使用Chrome、Safari、Firefox和Opera浏览器访问数据库。
数据库核心功能及操作演示
 1 
Single CpG
该模块提供感兴趣基因及其亚区域单个CpG位点相关生存分析、甲基化水平人群分布密度图和基于临床特征分组的表达差异小提琴图。页面左侧选择感兴趣的肿瘤数据集、基因名、CpG区域、基因组区域、探针、用于生存分析的二分组方法(均值、中位数和最佳cutoff值等),以及是否校正协变量。以肾透明细胞癌为例,选择数据集TCGA cancer datasets Kidney renal clear cell carcinoma [KIRC] TCGA March 2017,基因输入RASSF5,CpG区域选择Island,基因组区域选择TSS1500,甲基化探针选择cg16032102,生存分析二分组方法默认best,暂不矫正协变量,页面刷新得到结果。
结果部分,Kaplan meier图可见RASSF5基因启动子区域较低水平甲基化的患者预后相对较好,HR=2.319,P=0.00021;最下方表格Survival analysis summary为生存分析结果,提供P值、HR值和95%置信区间;甲基化水平人群分布密度图,横坐标β-values=M/(M+U+100),纵坐标为β-values值所对应的患者比例,展示不同的生存分析二分组cutoff值,红色竖线表示当前使用的cutoff值。
结果部分,violin plots展示基于不同临床特征分组的甲基化表达差异结果,下拉菜单可选择感兴趣的分组依据,如年龄、性别和临床分期等。
页面底部提供上述结果下载按钮,及GeneCards、COSMIC和AmiGO2数据库链接。
以上是基于Kaplan meier的单因素生存分析,左侧勾选include covariate,选择矫正协变量Age,页面刷新后展示基于Cox比例风险模型的多变量生存分析结果,HR和P值均发生改变。
 2 
Region based analysis
该模块用于探索感兴趣肿瘤中特定基因组区域内CpG位点与临床预后相关性。以肾透明细胞癌为例,探索chr1基因组CpG位点与肾透明细胞癌患者预后相关性,页面刷新得到37105条结果,下方展示不同甲基化探针对应的肾透明细胞癌患者生存分析K-M曲线。
表格右上角检索框输入RASSF5基因,有37条结果,展示该基因亚区域内甲基化修饰位点及对应的生存分析结果,提供P值、HR和95%置信区间,点击表格标题栏右侧小箭头可排序。
 3 
All cancers
该模块提供25种肿瘤中感兴趣基因甲基化位点及甲基化修饰的生存分析结果,左侧选择RBL2基因为例,有292条结果,点击View列Click for KM plot查看生存曲线图。
表格左下方点击Save as tab delimited下载该结果,EXCEL打开后,删除重复值,以P小于0.05筛选,可见RBL2基因甲基化修饰与9种肿瘤预后显著相关,其中有8个是在RBL2基因TSS1500区域。
 4 
Top biomarkers
该模块展示感兴趣肿瘤排名靠前的生存相关甲基化修饰biomarkers,展示该基因各区域内甲基化修饰位点及对应的生存分析结果,提供HR值、P/adjust P值和95%置信区间,点击View列Click for KM plot查看生存曲线图。以肾透明细胞癌为例,表格左下方点击Save as tab delimited下载该结果,EXCEL打开后,以adjust P小于0.05筛选,可见表格中200个基因的甲基化修饰均与肾透明细胞癌预后显著相关。
 5 
Gene visualization
该模块对感兴趣基因单个CpG位点进行聚类分析,以肾透明细胞癌中RASSF5基因为例,热图展示RASSF5基因各CpG位点甲基化表达谱,以及在基因亚区域和患者临床特征的聚类情况,下方可下载PDF、PNG格式图片,点击Browse in ClustVis链接至ClustVis对聚类结果进行个性化设置,以及更多聚类分析功能。
文献案例分析
Methsurv数据库较为简单,无论是生信文章或干湿结合,都会给文章添彩不少,提供几篇文献供大家学习。
以上就是Methsurv数据库的全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下参考文献!
Modhukur V, Iljasenko T, Metsalu T, Lokk K, Laisk-Podar T, Vilo J. MethSurv: a web tool to perform multivariable survival analysis using DNA methylation data. Epigenomics. 2018 Mar;10(3):277-288. doi: 10.2217/epi-2017-0118. Epub 2017 Dec 21. PMID: 29264942.
 往期传送门 
小白实战课堂开课啦!手把手教你转录因子与靶基因预测操作~!
 引药生变数据库系列传送门(完结) 
END

撰文丨弘   毅
排版丨四金兄
主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文