SRAMP:m6A甲基化位点预测网站
嗨,小伙伴们大家好!上周给大家介绍过EWAS Data Hub数据库,提供表观遗传组关联分析信息,尤其是DNA甲基化信息图谱,带大家初步尝鲜了甲基化修饰模式的美味。不过不少小伙伴表示,关于甲基化研究还是毫无头绪。所谓:合抱之木生于毫末,九层之台起于累土,千里之行始于足下!大餐诱人,也需要一口一口来品味不是?在拿到一个主变量分子需要往甲基化机制上去靠时,我们首先要从预测甲基化修饰位点学起来。
甲基化修饰位点包括m6A、m5C、2'-O-Me和Ψ等多种多样,m6A则更是研究热门,想必大家也是耳熟能详耳濡目染甚至于耳朵满是老茧了,奈何总是徒呼有心无力,只可远观而不能亵玩。那么,这周就给小伙伴们带来一款小而精的m6A甲基化位点预测数据库,老牌SRAMP数据库帮助大家走出万里征途第一步,一起来康康吧~!
 甲基化数据库系列传送门 
 引药生变数据库系列传送门(完结) 
数据库概览
进入SRAMP主页(http://www.cuilab.cn/sramp),网站页面对新手很友好。首先,映入眼帘的是关于m6A甲基化修饰介绍,m6A即N6-甲基腺苷甲基化修饰,属于转录后水平修饰,广泛存在于哺乳动物转录组中,介导转录本RNA降解、亚细胞定位、剪接加工和成熟及结构动力学等过程。m6A甲基化修饰依赖于特定RNA基序和甲基化修饰相关酶。RNA基序指的特定RNA序列及其结构特征,例如但不限于DRACH、GAC基序。相关酶便是大家耳熟能详的readers、writers和erasers蛋白。SRAMP数据库是北京大学崔庆华教授团队于2015年开发并发表在Nucleic Acids Research杂志,在机器学习框架下提取并整合m6A位点及其周围序列和结构特征构建训练集,随后基于目标RNA序列进行测试分析,提供潜在m6A修饰位点信息。在使用SRAMP时仅需要提供目标RNA序列,无需加载任何外部组学数据,同样适用于lncRNA、circRNA等非编码RNA的情况。
除了在线预测之外,该数据库还提供Windows离线版本,可点击Download下载安装包,并查看帮助文档。
数据库核心功能及操作演示
点击Prediction进入m6A修饰位点预测功能页面,数据库提供两种预测方式:
(1)在左边输入框,以含有内含子的转录本进行预测,该方式预测结果准确性更好,务必输入完整的转录本序列;
(2)在右侧输入框,以不带内含子的成熟mRNA进行预测,该方式为替代策略,仅支持输入无内含子的成熟mRNA序列,无法预测内含子中的m6A位点。数据库作者推荐第一种方式。
RNA secondary structure为RNA二级结构,提供预测的m6A位点周围局部RNA二级结构的文本和图形可视化结果,需要运行更长时间等待,因此默认禁用该功能。
Tissue,预测范围可选择HEK293和A549细胞系,CD8+T细胞,脑或肝脏组织,网站默认为Generic全基因组范围内预测。
以上两种预测方式都支持输入mRNA、DNA或cDNA序列,提交预测任务前需要选择输入的核酸序列类型。
以第一种方式为例,点击Click here加载示例核酸序列,RNA secondary structure选择yes,其他参数默认,点击Submit提交预测任务,页面显示检索任务信息,提示等待刷新。
页面刷新得到预测结果,首先是数据库对预测结果的评分,并按照Position顺序依次展示预测到的m6A位点及其对应的可信度,网站提供99%、95%、90%和85%四个阈值对应very high、high、moderate和low四个级别可信度。图中结果表明示例核酸序列预测到两个潜在m6A位点,可信度都在very high以上。
页面下拉,展示上述两个m6A位点详细信息,包括Position、Sequence context(序列文本)、Structural context(结构文本)、Local structure visualization(m6A位点结构可视化结果)、Score(预测评分)和Decision(可信度等级)等信息。结构文本的含义分别是:P-成对、M-多环、I-内部环、B-凸出环、H-发夹环。点击Draw可显示二维结构图,标注有m6A位点。
以上结果网站保留72小时后自动删除,请及时保存和下载。
返回上级页面,同样以第一种方式为例,点击Click here加载示例核酸序列,不过这次的RNA secondary structure选择no,其他参数默认,点击Submit提交任务,页面刷新得到预测结果,除了无结构文本与可视化以外,与前述类似。以这种方式得到结果的速度明显快了很多,因此在预测之前可先以不预测二结构的方式来初步探索。
文献应用案例
献案例PMID:33791305 IF=6.681
本文探讨YTHDF1以m6A修饰方式调节胃癌发生和转移的潜在机制。作者首先基于GEO/TCGA数据集获悉m6A修饰与胃癌临床预后相关,随后实验证实在胃癌中YTHDF1与增殖、迁移表型的调控关系。进一步基于RNA-seq、MeRIP-seq和RIP-seq获得与YTHDF1相关的表达差异基因集,富集分析提示与蛋白酶体蛋白质分解代谢过程有关。USP14是蛋白酶体相关去泛素化酶复合物的关键组分,在SRAMP数据库预测到USP14 mRNA的3'UTR区域存在m6A甲基化位点,并以MeRIP-seq证实该结果。接下来,以StarBase2.0数据库预测到USP14 mRNA与YTHDF1结合关系,进而实验证实m6A Reader YTHDF1以m6A依赖的方式调节USP14翻译促进胃癌发生和转移。本文SRAMP数据库预测的m6A位点信息展示在Figure5A和TableS12。
结果复现如下:进入NCBI-Gene,检索USP14,可见该基因有两条转录本,我们以其DNA序列来进行m6A位点预测。
点击人类USP14基因进入详情页面,页面下拉至Genomic regions, transcripts, and products,点击右上角FASTA,复制该DNA序列。
进入SRAMP数据库,点击Prediction进入m6A修饰位点预测功能页面,左侧栏输入上述DNA序列,这时RNA secondary structure选择no以便先行初步探索,其他参数默认,点击Submit提交任务,页面刷新得到预测结果。
结果展示,预测到不少m6A位点,表格整理即可得类似于本文TableS12的表格,然而复现结果与本文TableS12不完全一致。
返回检索页面,尝试以USP14转录本进行预测。NCBI获得USP14转录本序列,以第一个转录本为例。
进入SRAMP数据库,点击Prediction进入m6A修饰位点预测功能页面,在右侧栏输入上述mRNA序列,同样RNA secondary structure选择no以便快速获得初步探索结果,其他参数默认,点击Submit提交任务,页面刷新得到预测结果,与本文TableS12仍不大一致。
按照同样方法,以另外一条转录本进行预测,结果得到9个m6A位点信息,表格中的Position信息与本文不一致,但是m6A位点信息是一样的,推测可能是转录本序列输入有差异,但是不影响结果。
返回上一层预测页面,RNA secondary structure选择yes,其他参数默认,点击Submit提交任务,页面刷新得到预测结果,点击High confidence结果的Draw查看二级结构,至于是否如作者说的该位点是3’UTR序列,给小伙伴们留作作业吧!嘿嘿~
更多文献案例学习如下:PMID: 33676554;PMID:34026852;PMID: 33869171

以上就是SRAMP数据库的全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下参考文献!

写在结尾
Zhou Y, Zeng P, Li YH, Zhang Z & Cui Q (2016) SRAMP: prediction of mammalian N6-methyladenosine (m6A) sites based on sequence-derived features. Nucleic Acids Research, 44(10):e91.
 往期传送门 
小白实战课堂开课啦!手把手教你转录因子与靶基因预测操作~!
 引药生变数据库系列传送门(完结) 
END

撰文丨弘   毅
排版丨四金兄
主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文