进行单细胞分析逃不离也跑不了的数据库
5min学会它一劳永逸
Hi,大家好,我是晨曦。
这一期将给大家带来一个在单细胞领域基本上是人人知晓的数据库,同时也是我们进行细胞注释最常使用的数据库——CellMarker数据库
考虑到晨曦在以前的推文对于这个数据库也曾简单介绍过使用方法,这次的介绍将会更加的全面和具体。
那么我们就开始吧!
晨曦单细胞数据库系列传送门
引言
我们进行scRNA-seq分析的时候,获得细胞亚群的展示图,到最后都会去定义一个类群,好去契合我们的主题,那么这个主题如何去定义,自然会涉及到一系列的工具,而这些工具中最为我们所熟知的就是——CellMarker数据库
简单来说,CellMarker数据库就是帮助我们进行细胞注释的数据库
CellMarker数据库在2019年1月份发表于核酸研究 (Nucleic Acids Research),由哈尔滨医科大学Yun Xiao等老师发表,该团队通过梳理100,000+发表的文献,梳理出人的158个组织 (亚组织)的467个细胞类型的13,605个Marker基因,和鼠的81个组织 (亚组织)的389个细胞类型的9, 148个Marker基因
不管是从数据的丰富程度还是数据的来源都是十分的可靠,所以说我们有必要掌握这个数据库,那么接下来我们就正式进入这个数据库的讲解
Home
序号1切换样本(人类或者鼠)
序号2点击以后直接跳转到相关细胞类型的结果页面
因为有多种搜索形式到最后都会跳转到一样的结果界面,所以结果界面将在后续进行介绍
序号3点击组织图表,查看更详细的细胞类型以及数量
序号4快速搜索框
序号5信息总览
序号6数据库的功能选择栏(后续简写为:功能选项卡)
至此,Home界面介绍完毕
Browse
点击功能选项卡中的Browse进入浏览界面,界面如下:
红色框中显示了细胞和组织的层次分类,可以通过单击人类或者小鼠不同组织中的细胞类型来浏览查看细胞标志
举例我们想要查询人类脑组织海马体相关的细胞类型,我们应该进行何种设置呢?
还是在当前界面,我们通过调节左边的筛选栏进行设置,界面如下
首先看被红色方框圈出的地方提示着结果部分的来源有以下几个分类,分别是单细胞转录组测序、实验、综述和公司,然后其下方的结果部分展示的信息就很通俗易懂了~
提问晨曦,左边筛选栏你画两个箭头的地方,为什么前面一个是“T”,一个是“C”?
回答:“T”即组织,展现的是一个总结性的结果界面;“C”即细胞,展示的是按照细胞分类的结果,可以理解为很多“C”的结果组成一个“T”的结果,这两块的结果页面也会有所不同
我这里随便点击一个“C”的结果,界面如下:
词云图中越靠近中心,面积越大的标志物生物学证据越多,可以结合旁边的统计表格进行查看
提问:如何下载这类信息呢?
回答:下拉页面就可以看到类似界面,点击下载按钮即可
至此,Browse界面介绍完毕
Search
看完上面的讲解,肯定会有小伙伴问
有没有那种类似于浏览器检索那样的功能,让我们可以直接检索
CellMarker数据库支持两个搜索面板进行检索,分别是Cell search和Marker search,界面如下
使用还是十分的简单的,在图片上都进行了标注,其实本质上就是加了一步内置的机器筛选的过程

而结果界面就和上面讲解的结果界面一样,这里就不过多介绍了
至此,Search界面介绍完毕
Download
可以根据需求下载需要的marker信息
这里也可以通过下载信息后导入R完成自主注释,但是个人不是很推荐这种方式
第一:一般来说我们手动注释挑选差异表达前10的基因用来进行细胞注释,工作量并不是很大
第二:在注释的过程中会出现两个细胞亚群相似或者干脆注释不出来结果的,这个时候手动更方便我们进行标注和回顾
第三:写出来的代码运行报错,焦头烂额(硬伤TUT)
至此,下载界面介绍完毕
总结
该数据库存在三种检索方式
1.直接在Home首页点击感兴趣的组织或者细胞类型进行搜索
2.点击Browse浏览页面进行搜索
3.点击Search进行有针对性的检索
结果展示页面都是相同的,只不过是抵达途径不同而已
那么,晨曦单细胞数据库系列的第八弹就介绍到了这里,预计还会有5期-6期的内容这个系列就会接近尾声,然后开启下一个阶段的学习。
我是晨曦,我们下期再见~
晨曦单细胞笔记系列传送门
晨曦从零开始学画图系列传送门
END

撰文丨晨   曦
排版丨四金兄
主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文