SPENCER
肿瘤相关非编码RNA编码生物活性短肽信息数据库
嗨,小伙伴们大家好啊!新的一周我们继续Nucleic Acids Research(NAR)杂志数据库追新。非编码RNA(no-coding RNA, ncRNA)顾名思义就是不编码蛋白的RNA序列,然而随着研究的深入,也发现不少ncRNA尤其是circRNA或lncRNA事实上是可以编码短肽并发挥一定生物学功能。SPENCER数据库是肿瘤相关非编码RNA编码生物活性短肽的信息数据库,一起来看看吧~!
数据库概览
SPENCER数据库(http://spencer.renlab.org/#/home)于2021年9月发布在Nucleic Acids Research杂志,基于55项研究中涵盖15种肿瘤的1007个样本和719个正常样本的2806个质谱数据集中29526个非编码RNA编码的短肽(ncRNA-encoded peptides, ncPEPs),其中有22060个ncPEPs在既往研究中得到实验验证,有8060种肿瘤特异性肽被划分为肿瘤特异性表达组、癌中上调表达组、癌中下调表达组和其他表达组,还有基于MHC-I结合亲和性、稳定性和TCR识别概率预测的4497种具有潜在免疫原性的短肽,作为基于新抗原肿瘤免疫治疗的潜在靶点。首页介绍了SPENCER数据库两大检索功能,Peptide-explore和Sequence-explore以及三个分析模块,即differential expression analysis module,curation module和immunogenicity analysis module,点击help查看详细介绍。
数据库核心功能及操作演示
 1 
Browse功能
Browse模块选择感兴趣的肿瘤、组织类型及项目编号进行数据浏览,以乳腺癌乳腺组织的所有研究项目为例,页面刷新后Cancer Information部分展示基本信息,乳腺癌有3个研究项目,鉴别了486个ncPEPs,潜在有免疫原性的有144个,详细信息展示在Distribution部分。
Expression Heat Map部分,火山图展示上调、下调的ncPEPs,及潜在具有免疫原性的ncPEPs,热图展示ncPEPs在各个正常/肿瘤样本中的表达量,可用于表达差异分析。
Browse Result部分,设置表达分组(Tumor-specific、Upregulated、Downregulated、Others)、实验验证状态(validated、Non-validated)、免疫原性情况(immunogenic、Non-immunogenic)及泛癌或单个肿瘤中表达(Simultaneously expressed、Exclusively expressed),以查看在肿瘤中特异性表达的实验验证的具有免疫原性并在多个肿瘤中表达的ncPEPs为例,页面刷新后结果展示在下方列表,有52条ncPEPs,提供Peptide ID、相关基因及转录本、肿瘤及组织类型、免疫原性、组别、实验验证状态、泛癌或单个癌中表达情况和序列信息。
以ID为SPENP022397的结果例,为lnc-ATP5MF-1所编码,相关转录本为SPENT002364和SPENT001681,点击SPENP022397查看详细信息。Peptide Information部分与上级页面列表中信息类似,提供参考文献链接,SPENP022397在乳腺癌、皮肤癌、膀胱癌、肺癌、肝癌和结肠癌中表达。
MS/MS Visualization部分展示序列为LGELPSWILMR的SPENP022397短肽质谱检测结果,左侧栏提供各种参数设置,支持个性化展示。
Immunogenicity Information部分展示免疫原性分析结果,提供三种评分,即Recognition Score、Binding Affinity Score和Binding Stability Score,结果中满足Recognition score大于10-11、Binding affinity score小于等于34(nM)、Binding stability score大于等于1.4(h)表示具有免疫原性。表格提示SPENP022397与HLA-B40:01相关。
返回上级目录,点击编码SPENP022397的lnc-ATP5MF-1,点击Gene Information部分提供的LNCipedia链接,lnc-ATP5MF-1有4条转录本,其中2条被鉴定为编码短肽。
点击转录本SPENT002364,Transcript Information部分提供转录本序列信息,Secondary Structure部分展示二级结构图,均可下载。
ORF Visualization部分为开放阅读框的模式图,下方表格展示ORF核酸序列及其编码肽段的氨基酸序列信息,以及与ORF相关的其他短肽,对应的CPAT评分,若大于等于0.364则表示为编码序列,否则为非编码序列,详细展示在下方Peptide Overview部分。
 2 
Search功能
Search功能,可以在首页选择检索词类型,然后输入关键词进行快速检索,或点击菜单栏Search进入检索页面添加检索词类型,然后输入关键词进行检索。Search检索页面支持输入多个类型关键词进行精确检索。
 3 
BLAST功能
BLAST板块提供以转录本序列或氨基酸序列进行比对检索功能,支持输入多个序列进行批量检索,以示例转录本为例,结果展示在下方列表,前2条为目标序列。
最后Download部分提供数据下载,基本的非编码RNA及其编码的短肽信息,及质谱数据、免疫原性、实验数据及肿瘤和组织信息等数据。
总结:目前SPENCER数据库收录15种肿瘤相关22060个经实验验证的及其他未经验证的ncPEPs序列及其免疫原性信息,为肿瘤相关非编码RNA所编码短肽的功能研究提供极大帮助。
以上就是SPENCER数据库全部内容,暂无引用文献,小伙伴们使用时别忘记引用以下文献哦~!
Luo X, Huang Y, Li H, Luo Y, Zuo Z, Ren J, Xie Y. SPENCER: a comprehensive database for small peptides encoded by noncoding RNAs in cancer patients. Nucleic Acids Res. 2021 Sep 27:gkab822. doi: 10.1093/nar/gkab822. Epub ahead of print. PMID: 34570216.
 往期传送门 
小白实战课堂开课啦!手把手教你转录因子与靶基因预测操作~!
 引药生变数据库系列传送门(完结) 
 甲基化数据库系列传送门(完结) 
END

撰文丨弘   毅
排版丨四金兄
主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文