circRNA, lncRNA and mRNA in human blood exosomes
嗨,小伙伴们大家好!这里是每周一弘毅专栏,我志向用小小文字助力你的SCI发表之路。上周给大家分享的是EVmiRNA数据库,老腊肉miRNA搭讪外泌体蹭新潮的戏码,这周我们继续外泌体话题,给大家分享exoRBase数据库,人类血液外泌体RNA表达谱数据和功能注释,跟着弘毅的脚步一起来康康吧~!
数据库概览
进入exoRBase主页(http://www.exorbase.org/)可见数据库简介,exoRBase由复旦大学医学院上海肿瘤研究所黄胜林教授课题组于2018年发表在Nucleic Acids Research杂志,该数据库基于归一化处理的人类血液外泌体RNA-seq数据和已发表文献数据进行整合,旨在表征人类血外泌体中circRNA、lncRNA和mRNA表达及可视化结果、功能注释和可能的组织来源信息,识别血液外泌体分子标记,为疾病循环标志物的发现和功能预测研究提供便利。
该数据库目前共收录92例血液样本,58330个circRNA、15501个LncRNA和18333个mRNA数据。点击Sample,可见其中包括健康对照者32例、冠状动脉心脏疾病患者6例、结直肠癌12例、肝细胞癌21例、胰腺腺癌14例、乳腺癌2例和全血样本5例。
点击FAQ,下拉至第7项可见该数据库整合的RNA-seq数据集,可通过GSE号在GEO数据库检索,或者点击Download进行相关数据集下载,包括表达谱数据、注释文件以及实验性验证文件。
点击Community,为该数据库整合的高质量文献信息。
另外,该数据库支持上传个人数据,仅考虑人类血液外泌体来源的circRNA,lncRNA和mRNA数据,并要求提取的血液外泌体满足ISEV(国际细胞外囊泡协会)最低要求。
数据库功能及操作演示
1. 信息浏览:Browse
首先,外泌体cirRNA信息浏览,可从主页点击进入,或点击Browse目录下cirRNA进入,以检索肝癌患者血液外泌体中表达上调的cirRNA为例,Samples types栏下拉菜单选择HCC,Detection frequency表示所有样本中检测到RNA的频率,填入0~1的数(0表示在任何样本中都没有检测到,1表示在所有样本中都能够检测到),Different group下拉菜单选择HCC(up),其他默认即可,其中Samples types栏允许输入单个或多个样本类型,点击Search得到检索结果。
结果栏中,Expression rank表示同一类型RNA表达水平排序,如0-10%表示表达水平在前十分位,点击Expression rank按照降序排列,以表达水平排在第一条的为例,该cirRNA在exoRBase中的ID为exo_circ_046669,circBase ID为hsa_circ_0017109可链接至circBase数据库,基因组位置为chr1:236029549-236038253,对应的Gene symbol为NID1,还有样本类型,表达差异组别,Validation栏信息表示没有对应的已发表文章的实验证据。
点击exo_circ_046669进入详情页面,首先是5种疾病和全血外泌体中表达情况,页面下拉是exo_circ_046669详细信息,比前文表格多了Cells/Tissues条目。
其次,外泌体lncRNA和mRNA信息浏览,同样可从主页点击进入,或点击Browse目录下lncRNA and mRNA进入,以检索结直肠癌患者血液外泌体中结肠组织特异性的表达上调的lncRNA和mRNA为例,Samples types栏下拉菜单选择CRC,Gene type下拉菜单选both,Tissue specificity表示在某个特定组织中特异性表达,此处勾选Colon,Detection frequency填入0~1的数,Different group下拉菜单选择CRC(up),其他默认即可,同样Samples types栏允许输入单个或多个样本类型,点击Search得到检索结果。
检索到一条结果,表格内容与前文类似,另外可见组织特异性评分,有2条与之相关的circRNA,可用于ceRNA候选,点击进入可查看其表达情况可视化结果,底部可选择以热图或线图形式展示。
页面下拉,是2条circRNA详情,点击Box plot栏可显示不同疾病来源外泌体中表达值箱图,点击circRNA ID查看详情,内容同前文。
2. 检索功能:Search
首先,首页快速搜索功能,输入示例TRAF3,点击Search得到结果,内容基本同前文类似,可见12条与之相关的circRNA,点击可查看其表达情况可视化结果,点击Box plot栏可显示不同疾病来源外泌体中表达值箱图,点击Gene symbol查看TRAF3详情。
然后,Search模块,点击进入检索界面,包含lnRNA and mRNA、circRNA、Chromosome region共3个子模块,如下图所示,可分别输入多个Gene symbol和circRNA ID或输入基因组位置信息进行检索。以Chromosome region示例,点击Search进入结果界面,此功能可供查询暂未命名的新发现circRNA。
结果得到8个位于目标基因组位置的circRNA,同前,可逐一浏览其在不同疾病来源外泌体中表达值可视化结果,具体的基因组位置信息,对应的Gene symbol有3个,样本类型有4个来源,还有表达差异分组等信息。
文献单图复现
文献案例一:PMID: 33169793,IF=2.943分
本文旨在探索在胰腺癌临床预后中有预测价值的胞外囊泡相关基因,前文基于TCGA和ICGC胰腺癌转录组测序数据差异分析,构建PPI网络,并进行通路富集分析和生存资料分析,获得与肿瘤微环境相关的15个基因(GPR18,GPSM2,CXCR5,CX3CR1,CNR2,NMU,GNGT1,NPY1R,SSTR5,GIP,NTS,LEP,H3F3C,HIST2H3C和HIST1H2BC),而后通过HPA和GEO数据库验证其蛋白和mRNA水平表达情况,最后在exoRBase数据库分析得知,与正常组织相比,其中CXCR5,HIST2H3C,CNR2, CX3CR1和GPR18共5个基因在肿瘤来源外泌体中的表达有显著差异,如下图Figure9。
单图复现如下:进入exoRBase主页,点击Search,点击lncRNA and mRNA,然后分别输入15个基因,以逗号隔开,点击Search得到检索结果。
选择以热图形式展示如下,右上角可下载图片,即原文Figure9A。
页面下拉,分别点击CXCR5,HIST2H3C,CNR2, CX3CR1和GPR18这5个基因Box plot获得在不同疾病来源外泌体中的表达值箱图结果,即Figure9B~F。值得注意的是,不知是否作者疏忽或是数据库更新导致,表格中可以看到的是,在胰腺癌中只有2个基因显著差异表达,GPR18表达显著下调,HIST2H3C表达显著上调。
最后在PS或AI中,将获得的A~F图片进行组合,编号,即可得到原文Figure9如下,网站下载的图片规格基本一致,只需要遵循对齐的原则即可。
文献案例二:PMID: 33292256,IF=4.175分
本文探讨结直肠癌(CRC)外泌体中hsa_circ_0004831及其参与的ceRNA网络对CRC临床预后的预测价值,首先从exoRBase数据库获得CRC患者和正常组织来源的外泌体circRNA和mRNA表达矩阵进行差异分析,结果得知hsa_circ_0004831在CRC中表达水平平均增加3.92倍,在Figure3A中展示。而后从BBCancer数据库下载相应的细胞外囊泡miRNA表达矩阵进行差异分析,获得显著下调的13个miRNA,进一步从Circbank数据库获得hsa_circ_0004831可能结合的22个miRNA,二者取交集获得一个结果,即hsa-miR-4326与hsa_circ_0004831可能存在ceRNA关系。此后,作者在TargetScan预测到hsa-miR-4326靶基因3629个,与之前exoRBase数据库mRNA差异分析结果显著上调的mRNA取交集,获得12个mRNA,均与hsa_circ_0004831表达存在正相关关系,最后通过PCR验证50名健康志愿者和81例CRC患者血液样本中的外泌体mRNA表达情况,12个mRNA中ZBED1显著上调。因此可知,hsa_circ_0004831/hsa-miR-4326/ZBED1 mRNA构成ceRNA关系。本文Figure3A和Figure5C均可利用exoRBase进行复现,方法类似,原文利用limma包实现差异分析及可视化,现以Figure3A为例,通过Excel+prism演示如下。
单图复现如下:进入exoRBase主页,点击Download,分别下载CRC来源和正常患者来源的外泌体circRNA、mRNA数据集和注释文件,备用。
用Excel打开注释文件,circBase_ID列查找hsa_circ_0004831,查到其对应的exoRBase数据库ID为exo_circ_011671。
用Excel打开CRC来源外泌体circRNA数据文件,在exo_circ_ID列查找exo_circ_011671,将其对应的CRC1~CRC12样本表达量值复制到Graphpad Prism,同理将正常患者来源外泌体circRNA数据集文件中exo_circ_011671行对应的N1~N32样本表达量值复制到Graphpad Prism。
在Graphpad Prism中绘制散点图,添加标题和差异性指标,修缮细节后,如下图所示,即原文Figure3A。

乌鸦反哺,羔羊跪乳!吃水不忘挖井人,开发并维护数据库不易,小伙伴们使用exoRBase数据库时,别忘记引用以下参考文献哦!

写在结尾
Li S, Li Y, Chen B, Zhao J, Yu S, Tang Y, Zheng Q, Li Y, Wang P, He X, Huang S. exoRBase: a database of circRNA, lncRNA and mRNA in human blood exosomes. Nucleic Acids Res. 2018 Jan 4;46(D1):D106-D112. doi: 10.1093/nar/gkx891. PMID: 30053265; PMCID: PMC5753357.
好啦~这期关于exoRBase数据库加餐就到这里!食不厌精,脍不厌细,美食需要用心烹饪,更需要用心细品,小伙伴们莫要着急,外泌体这道大餐会慢慢呈现给大家~欲知更多生信知识,我们相约“挑圈联靠”公众号~下期再见了~!
往期传送门
小白实战课堂开课啦!手把手教你转录因子与靶基因预测操作~!
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END

撰文丨弘   毅
排版丨四金兄
值班 |菠小萝

主编丨小雪球

继续阅读
阅读原文