表观遗传学(epigenetic)是与遗传学(genetic)相对应的概念。
相对于遗传学在基于基因序列改变导致基因表达水平变化方面的研究
表观遗传学的基于基因序列不变下的基因表达水平变化方面的研究,以其在肿瘤预测和疾病诊断方面的前瞻性广泛应用
越来越被人们所关注,热度急速上涨!
越来越多的小伙伴们的论文的标题,也少不了甲基化与表观遗传之类
面对大家期盼的眼神,小编考虑到
甲基化主分为三个方面:DNA、RNA和组蛋白
大家课题各有不同
就分别挑选了一些应用广泛且有代表性的甲基化数据库推荐给大家。
下面我们就开始吧!
一、DNA甲基化数据库
DNA甲基化是指在DNA甲基转移酶(DNMTs)的催化作用下,以S-腺苷甲硫氨酸(SAM)为甲基供体将甲基转移至DNA碱基上的一种表观遗传修饰方式。在人的体细胞中,DNA甲基化一般发生于CpG位点,它不改变核苷酸序列,但是却能调控基因的转录。
1、EWAS Data Hub
https://bigd.big.ac.cn/ewas/datahub
数据内容:
标准化的DNA甲基化芯片数据以及相关的元数据
75,344个样本,主要来自GEO、TCGA、ArrayExpress和Encode等数据库。
EWAS数据中心能提供不同背景下的参考DNA甲基化图谱,涉及81种组织/细胞类型(包含25个脑部和25种血细胞类型),6个祖先类别和67种疾病(包括39种癌症)。
中国科学院北京基因组研究所开发
功能 & 优点:
有效减弱或去除数据间的批次效应
提供了高效的查询方式,可协助检索和发现基于甲基化的生物标记物。
2、MethBank
http://bigd.big.ac.cn/methbank
数据内容:
各种物种的共有参考甲基化组(CRM),全基因组单碱基分辨率甲基化组(SRM),DNA和RNA甲基化工具(MeTools)和表观基因组范围关联研究(EWAS)相关信息。
34个来自大量人类样品的共识参考甲基化组织,336个来自不同发育阶段5个植物组织的单碱基分辨率甲基化组织,18个单碱基在人类和小鼠的多个阶段从配子和早期胚胎中分辨甲基化组织。
中国科学院北京基因组研究所开发
功能 & 优点:
提供了基化数据可视化的交互式浏览器
高质量甲基化酶大规模整合
系统地鉴定与年龄密切相关的甲基化位点、在不同年龄段具有恒定甲基化水平的位点、年龄特异性差异甲基化胞嘧啶/区域和甲基化CpG岛。
在线估计人甲基化年龄,鉴定差异甲基化的启动子。
对于解读DNA甲基化调控机制有很大的帮助。
3、Pubmeth
http://www.pubmeth.org/
数据内容:
文献中与癌症相关的甲基化数据,进行人工校对和注释,提供一个高质量的癌症相关的发生了甲基化基因的数据库。
5000多条记录,来自1000多个文献来源。
功能 & 优点:
最快速文献判断一个基因是否已经被描述为甲基化且属于哪种癌症类型
二、RNA甲基化数据库
RNA中存在着超过100种不同的化学修饰,包括N6-甲基化腺嘌呤(m6A)修饰、5-甲基化胞嘧啶(m5C)修饰、5-羟甲基胞嘧啶(hm5C)修饰、N1-甲基化腺嘌呤(m1A)、次黄嘌呤、假尿嘧啶等。m6A是mRNA上最丰富的甲基化修饰。
4、RMBase
http://rna.sysu.edu.cn/rmbase/
数据内容:
13个物种的47个研究中的566个数据集和1 397 244个修饰位点
m6A、m5C、2'-O-Me和100种其他类型的修饰物。
中山大学开发
功能 & 优点:
目前最全面的RNA修饰数据库
整合转录组测序数据,以探索RNA的转录后修饰,
以基因为关键词,查询每个基因上鉴定到的化学修饰
查询与miRNA结合事件,疾病相关SNP和RNA结合蛋白(RBP)的关系
5、RMVar
http://rmvar.renlab.org/
数据内容:
影响m6A修饰的相关变异,与变异相关的RBP结合区、miRNA-靶点和剪接位点。
修饰物:m 6 Am,m 1 A,ψ,m 5 C,2'-O-Me和m 7 G,5-甲基尿苷m5U,A至I。
来自全基因组关联研究(GWAS)和ClinVar的数据,
功能 & 优点:
帮助用户研究m6A相关变异对转录后调控的影响
为研究m6A相关变异和疾病间的关系提供支持。
三、组蛋白甲基化数据库
组蛋白的甲基化直接影响基因的转录,可以抑制或激活转录,这取决于甲基化的位点、程度和模式以及甲基化发生的基因组环境。
6、ChIPBase
http://rna.sysu.edu.cn/chipbase/ 
数据内容:
ncRNAs和PCGs的转录调控网络:
数千个结合motif矩阵及其结合位点
约为10000个肿瘤样本和约为9100个正常组织和细胞系的基因表达谱
中山大学开发
功能 & 优点:
预测转录因子(TFs)与基因之间的转录调控关系。
预测涉及或影响ncRNAs和PCGs转录的TFs和组蛋白修饰。
探索DNA结合蛋白和各种类型基因之间的共表达模式。
预测不同基因的功能和可视化各种芯片seq数据。
四、多组学联合数据库
7、iMETHYL
http://imethyl.iwate-megabank.org/index.html
数据内容:
DNA甲基化、 SNP和RNA_seq的多组学联合数据库。
CD4 + T淋巴细胞,单核细胞和嗜中性粒细胞的全DNA甲基化(〜2400万个常染色体CpG位点),全基因组(〜900万个单核苷酸变体)和全转录组(> 14000个基因)数据。
功能 & 优点:
两两之间的关联分析,
推断DNA甲基化,基因组变异和基因表达之间的调控机制。
END

撰文丨三叶虫
排版丨三叶虫
编辑丨三叶虫
继续阅读
阅读原文