一文学会PTMD蛋白翻译后修饰数据库使用

引子
大家好,我是风。据我观察,发在线数据库的推文阅读量总是遥遥领先于其他推文,而且总是不断有学员询问xxx网站有没有教程或者介绍啊?好的,没问题,只要你们有需求,我们就解决需求!我邀请了两位优秀的作者来给大家更新在线数据库系列,其中一位就是今天的作者——弘毅(还有一位我们静静等待)。弘毅来自于一个发了Science的实验室,自身实力强大,每回跟他讨论问题时候我总是怕他说出一句什么话我接不上来(卑微ing),咱们将在后续推文体会到这位大佬的细致入微。当然我跟他们两位作者说的是这个系列更新100个在线数据库,包括常见和不常见的在线网站,我想,100个应该也能解决大家的大部分需求了吧?
大家好,我是弘毅,今天给大家介绍第一个在线数据库——PTMD。
初识PTM和PTMD数据库
翻译后修饰(Post translational modification, PTM)发生在中心法则描述的mRNA翻译产生蛋白序列之后,对蛋白质的结构和功能调控至关重要。据不完全估计,人体50%~90%的蛋白质发生翻译后修饰,包括但不限于肽链骨架剪接,在特定氨基酸侧链上添加新基团,对已有基团进行化学修饰等等。常见的修饰过程有磷酸化、泛素化、甲基化、乙酰化、糖基化、苏木化、硫酸化、硒化、泛素化、干扰素激活基因化、脱氨化、亚硝基化和琥珀酰化等。目前已掌握的蛋白修饰过程仍然非常有限,至少70%尚不明确,其中包括未知的修饰种类、未知的修饰蛋白质和修饰位点等信息。表1列出常见蛋白质翻译后修饰的种类和频率等信息。
PTM通过调节蛋白质功能参与几乎所有生物学过程,涉及各式各样的细胞信号通路、功能表型,与包括癌症和神经系统疾病在内多种疾病相关,因此做完表型在探索机制问题往蛋白质修饰上蹭一下,往往可以为文章增色不少。
Haodong Xu等于2018年发布PTMs that are associated with human Diseases (PTMD 1.0)数据库,主要收集蛋白质翻译后修饰与各种疾病之间关联性信息,截止目前共计收录了在275种疾病中749个蛋白和24种PTM类型。数据库将PTM与疾病关联分为6类,包括U/D(PTM水平上调/下调)、P/A(PTM存在/缺失)和C/N(PTM点突变位点发生/中断),然后建立与疾病相关PTMs数据库,并从第一手文献中对PTMs与疾病的关系进行详细的描述,并从公共数据库Cancer Gene Census, Comparative Toxicogenomics Database (CTD), DisGeNET和OMIM获取和整合更多关于所收集蛋白的疾病注释信息。此外,该数据库还提供了已知的PTMs位点和蛋白与蛋白相互作用(PPI)信息。PTMD揭示PTMs与疾病之间的关联性信息,有助于研究者更好地了解疾病的发生发展、诊断和临床治疗。
PTMD数据库整体概览
PTMD网址: http://ptmd.biocuckoo.org
PTMD主页:包含数据库简介,PTM预测数据库,疾病和生物学过程注释信息数据库,等详细介绍。
工具包下载栏,可用于蛋白质结构域可视化的软件包,热图绘制软件包,基于词云图的富集分析结果可视化软件包,以及基于深度学习的计算机视觉方法分析荧光图像自噬表型的软件包,点击可阅读详细信息。
简单检索功能,可以设置检索词包括Uniprot AC号、Gene ID、Gene Name、PTM类型、Disease疾病和Organism生物种类等。并提供了参考文献。
点击BROWSE 可以看到PTMD数据库两种检索方法,即通过PTMs类型和疾病名称两种方式检索信息,可以选择感兴趣某种PTMs类型,检索得到疾病中与该PTM相关的蛋白,也可以选择特定的疾病,获取与该疾病相关PTMs蛋白。框-1显示各种不同的PTMs类型,框-2显示各种不同疾病词云图,均可以点击感兴趣的条目查看详情。
点击ADCANCE,进入高级检索功能页面。框-1显示,可以设置检索词,包括Uniprot AC号、Gene ID、Gene Name、PTM类型、Disease疾病和Organism生物种类等,最多可以设置三个关键词。框-2显示,可以输入或上传蛋白质列表,亦可选择输入的检索词类型,同前。框-3用于通过序列比对,寻找到特定蛋白质和/或相关的同源蛋白,每次只允许输入一个FASTA格式蛋白质序列,E-value阈值可以由用户定义,默认为10。点击三个功能板块名称后面的“?”可进入详细功能介绍页面。
点击ENRICHMENT,进入富集功能页面。框-1显示,可输入蛋白质列表进行富集分析,可输入的检索词有Uniprot AC号、Gene ID和Gene Name三种,提供Protein Enrichment和PTM Site Erichment两种富集分析方法。点击Example1,可输入蛋白列表,只能针对磷酸化修饰,进行Protein Enrichment分析,点击Example2,可输入蛋白表达矩阵,并选择感兴趣的PTM类型,进行PTM Site Erichment分析。框-2显示,可输入蛋白质列表进行通路分析,只允许输入检索词Uniprot AC号,E-value阈值可以由用户定义,默认为0.01。
点击DOCUMENTS,查看数据库功能板块简单介绍信息。
点击LINK,查看相关数据库信息。
点击CONTACT显示开发者联系方式,DOWNLOAD显示数据库下载的数据类型。
PTMD数据库核心功能示例
1
基本检索功能
(1)点击BROWSE 在PTMs类型中选择磷酸化
可显示有572种与疾病相关磷酸化修饰的蛋白信息,包括去磷酸化,丝氨酸磷酸化,苏氨酸磷酸化和酪氨酸磷酸化。
点击第一个条目酪氨酸磷酸化,进入详细介绍界面,结果提供了酸化修饰蛋白底物UniprotAC号和EntrezID,点击蓝色字体可查看该蛋白详细酪氨酸磷酸化信息。
蛋白基本信息,名称,序列号,基本功能,蛋白质FASTA序列等。
PEM与疾病相关性,及其他数据库相关疾病交叉注释信息。
PTM位点信息。
PTM相关蛋白交互信息。
(2)点击BROWSE 在疾病类型中选择乳腺癌
可显示有139种含有与乳腺疾病相关的PTMs蛋白,点击条目查看详情,内容同前。
2

高级检索功能
(1)Advanced Query板块
选择示例数据,点击Submit,可获得TP53在人类疾病中相关磷酸化信息,点击蓝色字体可查看详细介绍。
(2)Batch Query板块
选择示例数据,点击Submit,可获得批量检索结果。
(3)BLAST Search板块
选择示例数据,点击Submit,可获得蛋白序列比对结果。
3
ENRICHMENT功能
(1)ENRICHMENT板块
选择示例数据1,点击Submit,可富集到含有与疾病相关磷酸化修饰的6个蛋白结果,点击蓝色字体查看详情,点击Download可下载结果。
选择示例数据2,选择磷酸化修饰,点击Submit,可富集到含有与疾病相关磷酸化修饰的5个蛋白结果,点击蓝色字体查看详情,点击Download可下载结果。
(2)Pathway analysis板块
选择示例数据,E-Value值默认0.01,点击Submit,可富集到含有与疾病相关PTMs的通路结果,p-Value默认降序排列。
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文