DiseaseMeth数据库:人类疾病相关甲基化数据库
嗨,小伙伴们大家好!新的一周我们继续甲基化修饰的话题。在前述介绍过的各种类型甲基化修饰位点信息数据库基础上,这周带大家学习一款甲基化修饰与临床相关性分析及功能注释数据库DiseaseMeth,为你的甲基化研究中单变量论证环节增加一张重磅Figure,其中玄妙一起来看看吧~!
 甲基化数据库系列传送门 
数据库概览
DiseaseMeth数据库网址(http://bio-bigdata.hrbmu.edu.cn/diseasemeth/index.html),于2017年更新至DiseaseMeth 2.0版,整合TCGA、GEO和IHEC等数据库中人类疾病相关甲基化组数据,包括88种疾病的32701个样本甲基化表达谱,提供经实验验证和基于计算预测的679602条疾病与基因甲基化修饰关联信息,疾病包括常见的多种类型肿瘤、神经发育和退行性疾病、肥胖、糖尿病和自身免疫疾病等,DNA甲基化芯片包含illumina DNA甲基化芯片常见的27K和450K两种,及某些定制的DNA甲基化芯片illumina GoldenGate Methylation Cancer Panel I等,高通量测序包含WGBS/RRBS两种分析类型的数据。
DiseaseMeth 2.0版还设计开发了甲基化差异分析平台,用于识别差异甲基化基因,并探索目标基因甲基化修饰与疾病关联性,提供“基因-疾病”、“疾病-疾病”和“基因-基因”相关性分析结果,同时该数据库在线分析工具还可以用于聚类分析、功能注释和生存分析。
菜单栏点击Help,可查看数据库介绍、使用指南、材料与方法、常见问题和数据库更新信息。
数据库核心功能及操作演示
 1 
数据检索功能
首页侧边栏或菜单栏点击Search,可见该数据库检索方式有三种:以基因检索、以疾病检索和高级检索
1)GeneSearch
GeneSearch模块以基因名或基因组位置检索目的基因甲基化修饰与不同疾病之间的关联信息,输入感兴趣基因Gene symbol或染色体基因位置,Curation Level of Disease-Gene Association部分选择疾病与基因之间关联水平(实验验证与推断的、推断的和潜在的)。
以下以示例基因DEFB119为例检索数据库中所有的DEFB119基因甲基化修饰与疾病关联信息,点击Search待页面刷新得到检索结果。
结果列表展示疾病类型、基因名、疾病甲基化水平、正常甲基化水平、P值、基因高表达或低表达、基因组可视化、相关性水平和数据来源等信息,点击蓝色基因名链接至GeneCards数据库。以P值大小排序,多发性骨髓瘤疾病与正常组织中DEFB119基因甲基化水平差异P值最小,点击view profiles查看基因序列、CpG岛、DNase和TFBS的基因组分布,下方设置栏可增减或隐藏样本、CpG岛、DNase或TFBS。
页面下拉,Methylation Profile部分展示不同疾病中该基因甲基化表达谱热图,以多发性骨髓瘤为例点击Show查看,热图展示DEFB119基因7个转录本的甲基化修饰情况,行代表转录本,列代表样本,绿色是正常样本,黑色是疾病样本,可下载该热图或表达谱数据。
2)DiseaseSearch
DiseaseSearch模块以疾病和基因名检索基因甲基化修饰与疾病关联信息,选择感兴趣的疾病,并输入或不输入基因Gene symbol,若不输入基因名则默认展示所有基因对应的检索结果。
以检索多发性骨髓瘤中癌基因TP53甲基化修饰与疾病关联信息为例,结果与前述类似。
3)AdvanceSearch
AdvanceSearch模块以基因名称或转录本ID或基因组位置检索目的基因甲基化修饰与疾病关联信息,以多发性骨髓瘤中癌基因TP53甲基化修饰与疾病关联信息为例,依次选择疾病、输入基因名或转录本ID、选择技术平台,点击Search,新窗口选择感兴趣转录本,在Select Region of Interest处选择启动子、refseq类别或CGI类别,refseq分类包括Up2kb、Gene Body、5'UTR、Coding Exon、Intron、3'UTR和Down2kb,CGI类别包括CpG Island、CpG Island Shelves和CpG Island Shore。支持自定义启动子,可以针对整个启动子或仅CpG岛进行分析。
结果部分Association Between Disease and Methylation of Gene与前述类似,在Search Result Overview部分勾选感兴趣样本,然后在Extended Tools部分进行基因组可视化展示或甲基化修饰差异性分析。
可视化结果基本同前。差异性分析结果中,表格展示基因名、P值、疾病与正常组织中甲基化表达差值、差异性结果(DMR为差异甲基化区域,N-DMR为非差异甲基化区域)和基因高低表达情况,Extended Tools部分链接至DAVID数据库对上述表达差异分析结果进行功能注释。
 2 
在线分析功能
首页侧边栏或菜单栏点击Analyze,该功能模块提供目的基因相关的甲基化差异分析、与疾病关联性分析、甲基化表达谱、功能注释和生存分析等,当输入多个基因或疾病时,提供基因与基因关系和疾病与疾病关系分析结果。
以结肠腺癌中癌基因TP53甲基化修饰与疾病关联信息为例,选择疾病、输入基因名或转录本ID、选择技术平台,Control Type处选择对照组,Method of Differential Analysis处选择差异分析方法(t-test、minfi、samr或edgeR),Significant p-value处选择显著性水平阈值,Absolute Methylation Difference绝对甲基化差异选项用于过滤差异甲基化区域和p值,点击Search,新窗口选择感兴趣转录本,其余设置同前。
结果Differential Analysis between Case and Control部分展示表达差异分析结果,以箱图形式展示,可下载表格数据。
结果Association Between Disease and Methylation of Gene部分展示基因甲基化修饰与疾病关联性信息,与前述类似。
结果Methylation Profile部分展示甲基化表达谱的热图,提供表格数据下载。
结果Survival Analysis for Cancer部分展示生存分析结果,应该是数据库近期在维护的原因这部分链接打开总是提示错误,以帮助文档中的生存分析结果为例展示如下。
结果Functional Annotation部分可链接至DAVID数据库,针对表达差异分析结果进行功能注释。
点击+ Show Query Box返回上级检索页面,可更改检索参数。
另外,以帮助文档中基因与基因、疾病与疾病相关性结果展示如下。
 3 
可视化工具
首页侧边栏或菜单栏点击DisMethBrowser,该功能模块展示目的基因序列、不同样本中甲基化修饰位点/区域、CpG岛、DNase和TFBS的基因组分布情况,最下方设置栏可增减或隐藏样本、CpG、DNase或TFBS,基本与前述类似。
 4 
数据下载
DiseaseMeth数据库数据来自TCGA、GEO和其他数据库,Download页面提供各种疾病甲基化表达谱数据、注释文件等下载链接。
文献案例分析
PMID 33318306,IF=5.682
本文为一篇2020年12月发表于Aging (Albany NY)的非肿瘤领域纯生信文章,即时影响因子5.682。本文旨在探索肥胖及代谢紊乱相关的关键基因,基于GEO100748数据集进行WGCNA分析鉴定出与脂肪形成阶段密切相关的四个模块,分别包含276,1459,853和835个基因,并分别进行GO分析。随后将上述基因与基于GSE80614数据集的表达差异基因取交集,获得12个共有的脂肪生成相关基因,鉴于CPA4在两个数据集中表达趋势相反而剔除,剩余11个候选基因,5个下调基因TK1,SCARA3,PRC1,CENPF和CDC20,6个上调基因SAA1,WFDC1,GPX3,GHR,DDIT4L和COMP。
接下来,PPARG、FABP4、LPL和PPARA是脂肪生成过程关键标记,将上述11个基因与这四个脂肪生成标记进行相关性分析,结果显示有5个基因(GPX3、GHR、SAA1、SCARA3和WFDC1)与上述标记显着相关,GPX3、GHR和SAA1与脂肪生成显著正相关,SCARA3和WFDC1脂肪生成显著负相关。其中GPX3、GHR和SAA1已有报告与肥胖有关,WFDC1与脂肪生成标记物负相关和在脂肪生成过程中逐渐表达增加之间存在矛盾,故剔除。在AD-MSCs中敲减SCARA3基因,结果增强脂肪生成标志物Pparα、Pparγ和Lpl表达,支持SCARA3抑制脂肪生成过程的假设。进一步对SCARA3基因表型特征进行分析,文献报道提示2型糖尿病患者SCARA3基因甲基化增加,作者基于DiseaseMeth 2.0版数据库中搜索发现SCARA3甲基化与代谢疾病如动脉粥样硬化病变、2 型糖尿病存在相关性,从而做出假设:脂肪生成过程中SCARA3表达的降低可能通过甲基化修饰介导的。本文思路清晰,值得借鉴学习。文中基于DiseaseMeth 2.0版数据库中搜索结果展示在Figure9 IJ。
 复现如下 
进入DiseaseMeth 2.0版数据库,点击Analyze进入在线分析模块,疾病选择代谢紊乱,基因输入SCARA3,其他参数默认,点击Analysis,新窗口显示SCARA3两条转录本,与原文一致,全选,其他参数默认,点击Analysis。
结果显示SCARA3甲基化与2型糖尿病、1型糖尿病肾病、肥胖、非酒精性脂肪肝和动脉粥样硬化病存在相关性,点击Methylation Profile可查看甲基化表达谱热图,下载PDF文件,导入AI即可编辑成原文Figure9IJ样式。
在这里,还可以点击Differential Analysis between Case and Control查看不同疾病中目的基因表达差异箱图结果。
应用DiseaseMeth数据库其他文献案例如下,供大家学习:
以上就是DiseaseMeth数据库的全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下参考文献!
[1] Xiong Y, Wei Y, Gu Y, Zhang S, Lyu J, Zhang B, Chen C, Zhu J, Wang Y, Liu H, Zhang Y. DiseaseMeth version 2.0: a major expansion and update of the human disease methylation database. Nucleic Acids Res. 2017 Jan 4;45(D1):D888-D895. doi: 10.1093/nar/gkw1123. Epub 2016 Nov 29. PMID: 27899673; PMCID: PMC5210584.
[2] Lv J, Liu H, Su J, Wu X, Liu H, Li B, Xiao X, Wang F, Wu Q, Zhang Y. DiseaseMeth: a human disease methylation database. Nucleic Acids Res. 2012 Jan;40(Database issue):D1030-5. doi: 10.1093/nar/gkr1169. Epub 2011 Dec 1. PMID: 22135302; PMCID: PMC3245164.
 往期传送门 
小白实战课堂开课啦!手把手教你转录因子与靶基因预测操作~!
 引药生变数据库系列传送门(完结) 
END

撰文丨弘   毅
排版丨四金兄
主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文