CancerSEA:肿瘤细胞功能注释图集
嗨,大家好!紧张的国自然标书冲刺月眼看就要落幕了,不少小伙伴表示忙忙碌碌一整年,中与不中全在专家一念之间,简直是前脚长舒一口气,后脚又提起一颗忐忑不安的心。尤其是肿瘤口的小伙伴,往年都是血流成河惨不忍睹,千军万马争过独木桥哇!弘毅在这里默默为大家拜求顿爷坦叔金哥等各路大神保佑,嘿嘿~!而没有发挥好的小伙伴也不用太过纠结啦,不妨开始好好准备一下明年的标书呢。新的一周给大家带来单细胞测序数据库第五趴,CancerSEA数据库,一款肿瘤单细胞功能数据库,带你一起领略肿瘤研究上分新姿势哦~!
数据库概览
CancerSEA数据库,由哈尔滨医科大学肖云教授团队开发,于2019年发表在Nucleic Acids Research杂志,旨在描绘肿瘤细胞在单细胞水平不同功能表型图集。进入数据库主页(http://biocc.hrbmu.edu.cn/CancerSEA/),可见该数据库目前收录25种肿瘤的41900个单细胞功能注释信息,包括干性、侵袭、转移、增殖、凋亡、分化、EMT和血管生成,以及DNA损伤/修复、缺氧、炎症等14个来自HCMDB、Cyclebase和StemMapper等数据库的功能表型,涉及来自SRA、GEO和ArrayExpress数据库的72个单细胞测序数据集中280个细胞分组,其中有18895条编码基因(Protein coding genes, PCGs)数据和15571条非编码lncRNAs数据。
点击Statistic,可见该数据库整体上数据概览,分别按照肿瘤类型对质控前后的数据进行统计,以饼图和柱状图展示,可以点击下方的图注来添加或删除感兴趣的肿瘤名称,来对饼图个性化设置。
点击Help,展示数据库基本信息和各个功能板块的详细使用指南,小伙伴们在遇到困难时可以点开学习哦~!
数据库功能及操作演示
 1 
浏览功能:Browse
点击Browse进入数据浏览页面,首先映入眼帘的是CancerSEA所收录的来自72个单细胞测序数据集概览,可以点击任意一个查看详情,或在左侧栏点击感兴趣的肿瘤类型查看详情。
侧边栏点击Astrocytoma,可见星形胶质细胞瘤相关单细胞测序数据集有1个,点击Breast cancer,显示乳腺癌相关单细胞测序数据集有8个,在右侧分别展示各个数据集在14个细胞功能表型的聚类热图。
点击Venteicher AS. Science. 2017 (Brain),Detailed description显示,该文章于2017年发表在Science杂志,GSE89567,研究IDH突变型星形细胞瘤中基因表达多样性问题,研究蛋白编码基因。
页面下拉,Functional state profile部分展,通过示基因组变异分析(Gene Set Variation Analysis,GSVA)进行14种功能表型的聚类分析热图,行表示功能表型,列表示不同样本和分组,颜色表示GSVA评分。
然后,Cell distribution部分为基于T-SNE和PCA分析结果,不同颜色表示分层聚集的细胞和分组,鼠标悬浮可查看详情,右上角可下载图片。
接下来,热图展示显著差异表达的PCGs/lncRANs,行表示PCGs/lncRNAs分子,列表示分层聚集的细胞和分组。
最后,Inferred copy number variants of cells部分展示基因拷贝数变异(CNV)聚类热图,列为按基因组位置排序的PCGs(1-22和X),行代表分层聚集的细胞和分组。
 2 
检索功能:Search
该数据库有2检索方法,第一种方法,进入首页,点击图片或右侧Functional states栏中14种细胞功能表型,查看该功能表型下对应的所有肿瘤中差异表达的PCGs/lncRNAs信息,以Metastasis为例,点击进入详情页面。
检索结果中以BRCA为例,点击进入,可见研究乳腺癌细胞转移相关的单细胞测序数据集有4个。
页面下拉,分别是乳腺癌中与细胞转移相关的差异表达PCGs/lncRNAs分子列表、以及GO/KEGG功能聚类结果,左上角可下载CSV格式文件,右上角可检索感兴趣条目,
差异表达PCGs/lncRNAs分子列表中展示Ensemble ID和Gene symbol,以及对应的数据集数目,与乳腺癌转移相关性,点击More Details可查看详情,以S100A10为例,点击进入首先可见该基因基本描述。
页面下拉,展示该基因在多种肿瘤中与14中细胞功能表型相关性热图,柱子表示显著相关的数据集,散点表示相关性系数,可下载表格文件。点击BRCA查看该基因在乳腺癌中的细胞功能表型相关性信息。
或者在下方Functional relevance处选择BRCA,以2016年Cell Reports这篇为例,点击“+”,下拉框显示与S100A10基因表达显著相关的细胞功能表型,提供所有样本整体相关性和P值,以及某个样本基因表达值、相关性散点图、相关系数和P值。
接下来,展示4个数据集中S100A10表达情况,以EXP0052为例,左侧是该基因相对管家基因表达丰度,右侧展示每个单细胞样本t-SNE分析情况,点的颜色代表S100A10表达水平。
最后,Functional relevance in different cell groups部分展示上述数据集的4个分组中与S100A10基因表达显著相关的细胞功能表型,提供所有样本整体相关性系数和P值,以及某个样本基因表达值、相关性散点图、相关系数和P值。
第二种检索方式,点击Search进入高级检索页面,可根据基因名检索,输入Ensemble ID或Gene symbol,可根据肿瘤类型和细胞功能表型进行检索,分别以S100A10基因,或Breast Metastasis为例,点击Search,结果同前述。
该模块还可以上传或输入基因列表,或选择GO/KEGG基因列表进行检索,以Cancer Pathway From KEGG/Reactome目录下Apoptosis为例,点击Submit得到检索结果。
结果页面首先展示该通路包含的在CancerSEA有注释的基因列表,共141个,点击每个基因ID可进入详情页面,以ENSG00000117020为例,点击可见该基因基本描述,在不同肿瘤中的表达情况,其他结果同前述S100A10基因。
 3 
下载功能 Download
点击Download进入数据下载页面,包含每个单细胞数据集的功能表型配置文件和PCG/lncRNA表达谱文件。
文献应用案例
文献案例一:PMID: 33609219,IF=2.834分
本文探讨黑色素瘤中LINC01550表达与肿瘤细胞增殖和侵袭的调控关系,本文借助LINC01550与临床相关性和CancerSEA数据库中LINC01550与表型相关性结果来充实主变量和疾病关系,思路值得借鉴。在文中Figure1G图展示CancerSEA中LINC01550表达谱,Figure2E展示CancerSEA中LINC01550表达与增殖、迁移两个功能表型之间的相关性。
单图复现如下
进入CancerSEA数据库,点击Search进入检索页面,检索框输入LINC01550,点击Search,进入结果页面。
在Relevance of LINC01550 across 14 functional states in distinct cancers栏选择黑色素瘤MEL,点击后,下拉查看Functional relevance in distinct cell groups栏,右侧t-SNE结果即本文Figure1E。
页面下拉,Functional relevance in different cell groups栏显示黑色素瘤中LINC01550表达与细胞功能表型相关性,此处3个分组结果均与原文不同,或是数据库更新结果。
文献案例二:PMID: 33632211,IF=4.175分
本文探讨非小细胞肺癌中SLC7A7与免疫浸润相关性,前期基于Oncomine数据库做表达差异分析和GO/KEGG富集分析,并基于PrognoScan数据库做预后生存分析,为进一步探讨SLC7A7介导肿瘤细胞表型的机制问题,在CancerSEA数据库进行探索。本文Figure4展示CancerSEA中SLC7A7在不同肿瘤中与细胞功能表型相关性。
单图复现如下
进入CancerSEA数据库,点击Search进入检索页面,检索框输入SLC7A7,点击Search即可得到结果。
文献案例三:PMID: 32296635,IF=4.848分
本文探讨lncRNA SNHG6与hnRNPA1相互作用调控PKM选择性剪接,进而增强有氧糖酵解,促进结直肠癌细胞增殖。在Figure3中展示CancerSEA数据库中lncRNA SNHG6与结直肠癌细胞功能表型相关性。该文章单图复现方法基本同前,此处不再赘述。
更多文献案例:PMID: 31781507,IF=4.848分;PMID: 31888570 IF=3.15分。小伙伴们可以自行练习复现哈,以巩固学习效果。
以上就是CancerSEA数据库的全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下参考文献!
Yuan H, Yan M, Zhang G, et al. CancerSEA: a cancer single-cell state atlas. Nucleic Acids Res. 2019;47(D1):D900-D908. doi:10.1093/nar/gky939.
好啦~!本文关于CancerSEA数据库介绍为单细胞测序分析无代码第五趴,就暂到这里啦~!欲知更多生信知识,我们相约“挑圈联靠”公众号~下期再见了~!
 往期传送门 
小白实战课堂开课啦!手把手教你转录因子与靶基因预测操作~!
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END

撰文丨弘   毅
排版丨四金兄
值班 | 风间琉璃

主编丨小雪球
长按识别二维码免费包邮领取!
继续阅读
阅读原文