MethBank:DNA甲基化综合数据库
嗨,小伙伴们大家好!本周我们继续甲基化修饰的话题。之前给大家介绍过一款来自于中科院基因组研究所生命健康大数据中心(The BIG Data Center)的DNA甲基化芯片数据库EWAS Data Hub,新的一周给大家介绍该大数据中心另一款DNA甲基化综合数据库MethBank,其中玄妙一起来探索吧~!
 甲基化数据库系列传送门 
数据库概览
MethBank数据库网址(http://bigd.big.ac.cn/methbank/org/),作为一款甲基化综合数据库,整合有跨物种的共识参考甲基化组(Consensus Reference Methylome,CRM)、全基因组单碱基分辨率甲基化组(Single-base resolution methylome,SRM)、单细胞甲基化图谱和表观遗传组关联分析(EWAS)数据,并提供DNA/RNA甲基化研究工具查询(MeTools)和甲基化基因组信息可视化功能。目前MethBank 4.1版本涵盖了,来自12个年龄组的5,687,344个健康人类样本的163个CRM,来自5种植物不同发育阶段和/或组织中336个SRM,以及人和小鼠的从配子到早期胚胎发育阶段的18个SRM,并能够系统识别基因甲基化谱,并提供差异性甲基化启动子(DMP)、差异性甲基化区域(DMR)、差异性甲基化位点(DMC)及与年龄密切相关甲基化位点和跨不同年龄的恒定甲基化水平位点等信息。
菜单栏点击Documentation,可见该数据库包括MethBank-CRM、MethBank-SRM和MethBank-EWAS三个子数据库,以及MethBank-MeTool信息库,还有Visualization功能和Analysis tool模块。其中,scMethBank提供人和小鼠26种细胞类型及两种疾病相关的3,166个单细胞甲基化图谱数据。Documentation部分有各个子数据库和功能模块的快速使用指南。
数据库核心功能及操作演示
 1 
Search功能
首页检索框,在下拉菜单选择感兴趣的检索条目,然后输入Gene symbol或甲基化探针ID或单细胞名来检索甲基化相关数据,支持输入以分号分隔的多个关键词进行批量检索。
以示例TP53为例,下拉检索条目选择CRMs,点击Search,结果列表中点击TP53对应的Gene ID查看详细信息。
第一个列表展示TP53基因组信息;第二个列表展示不同组织中TP53甲基化图谱数据,以甲基化水平降序排列,2~4岁年龄段外周血中TP53甲基化水平最高。
再以TP53为例,下拉检索条目选择SRMs,点击Search,结果有Gene、DMP和CpGI三个列表,Gene列表中点击人类TP53对应的Gene ID查看详细信息。
在第一个列表展示TP53基因组信息;第二个列表和折线图展示不同组织中不同类型TP53甲基化水平。以甲基化水平降序排列,在3岁健康胸腺组织中TP53 CG甲基化水平最高,点击JBrowse展示可视化结果。
返回上级页面,查看DMP、CpGI列表,数据库未收录TP53相关的差异性甲基化启动子DMP和甲基化CpG岛信息。
检索框下拉菜单选择scMethBank,以示例4-cell embryo检索,结果页面上方可依据GSE数据集、物种、组织来源、细胞类型、组织类型、发育阶段、年龄和性别进行筛选感兴趣的条目,点击列表More Details列加号显示数据集详情,感兴趣数据集前方勾选后,左上方可批量下载。
检索框下拉菜单选择EWAS,以TP53为例进行检索,结果页面展示与TP53甲基化相关的疾病信息,点击第一条breast cancer prognosis,链接至EWAS Data Hub数据库,详情见前期该数据库推文介绍。
检索框下拉菜单选择MeTools,以Cancer为例进行检索,结果页面上方可以筛选感兴趣的甲基化研究工具,下方列表展示不同的肿瘤甲基化研究工具信息,提供文献支持。
 2 
Browse功能
菜单栏鼠标悬浮Browse,下拉菜单中依次点击CRMs、SRMs或MeTools进行数据浏览,内容基本同前,右上键可检索感兴趣的基因;点击EWAS链接至EWAS Data Hub数据库。
点击scMethBank链接至scMethBank数据库,Browse模块支持按照样本、基因、差异性甲基化区域DMRs或Project进行数据浏览,Tool模块中DMRs Analysis支持上传DMRs数据进行功能注释。
 3 
Visualization功能
菜单栏点击Visualization,该模块提供基于JavaScript和HTML5构建的DNA甲基化可视化结果,以人类TP53基因甲基化基因组可视化结果为例,展示如下。
 4 
Tools模块
该模块提供两个小工具,Age Predictor用于预测人甲基化年龄,IDMP用于分析差异性甲基化启动子。
Age Predictor提供三种算法,第一种基于标准Illumina原始数据,第二种基于处理过甲基化探针及表达矩阵数据,第三种基于GEO格式数据。以第三种示例GSM1225379数据集为例进行甲基化年龄预测,结果展示不同甲基化CpG年龄分布情况。
IDMP工具提供离线软件下载。
 5 
Download模块
提供不同物种不同组织的CRMs和SRMs数据下载功能。
以上就是MethBank数据库的全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下参考文献!
[1] Li R, Liang F, Li M, Zou D, Sun S, Zhao Y, Zhao W, Bao Y, Xiao J, Zhang Z. MethBank 3.0: a database of DNA methylomes across a variety of species. Nucleic Acids Res. 2018 Jan 4;46(D1):D288-D295. doi: 10.1093/nar/gkx1139. PMID: 29161430; PMCID: PMC5753180.
[2] Zou D, Sun S, Li R, Liu J, Zhang J, Zhang Z. MethBank: a database integrating next-generation sequencing single-base-resolution DNA methylation programming data. Nucleic Acids Res. 2015 Jan;43(Database issue):D54-8. doi: 10.1093/nar/gku920. Epub 2014 Oct 7. PMID: 25294826; PMCID: PMC4384011.
 往期传送门 
小白实战课堂开课啦!手把手教你转录因子与靶基因预测操作~!
 引药生变数据库系列传送门(完结) 
END

撰文丨弘   毅
排版丨四金兄
主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文