零成本装逼指南！单细胞时代，教你用单细胞数据库巧筛基因，做科研！

课题里的主变量分子无法确定？

10秒钟给你一个基于单细胞层次的主变量分子

Hi，大家好，这期是晨曦单细胞数据库系列的第五期，我们这一阶段的目的就是为大家打下坚固的单细胞分析基础，而生信分析的核心自然是数据，所以我们这里会花费一部分的时间来讲解数据的各种来源，虽然枯燥，但是如果细心学习，想必会带给你更长远的提高~

晨曦单细胞数据库系列传送门

宝儿，5min掌握一个单细胞数据库，今年国自然就靠它了！（附视频）

审稿人返修让我补单细胞数据咋办？这个神器帮大忙了！

想白嫖、想高大上、想有高大上的SCI？这个单细胞数据库，你肯定用得上！（配视频）

What? 扎克伯格投资了这个数据库？炒概念？跨界生信？

不同物种也能合并做生信？给你支个妙招，让数据起死回生！

那么话不多说，我们就请出我们今天的主角——SC2disease数据库

该数据是由西北工业大学、西安交通大学、哈尔滨工业大学、复旦大学、天津大学等团队合作开发的首个包含细胞类型特异信息的疾病基因数据库，旨在提供病病例与健康对照之间、病例中不同细胞类型之间以及不同病理程度病例之间基因表达的差异

其中包含了946481条目，对应于341种细胞类型、29 种组织和 25 种疾病

每个条目包含10个部分，分别是：疾病名称，实验组织，细胞类型，基因名称，用于描述基因表达的变量名称（log2FC或均值），变量的值，差异表达基因（DEG）的比较，PMID，测序平台和详细信息，其中的详细信息部分包含有关细胞类型，疾病和基因的详细信息

晨曦解读

通过阅读这篇关于SC2disease数据库的文献，我们可以知道，这个数据库主要是把目前已经发表单细胞测序数据，利用同样的pipline进行了整理，目的是阐明疾病和正常细胞之间有无表达差异

下面这个图也详细的展示了该数据库是如何搜索、获取、整理数据的流程

其实这个数据库说的直白一点，就是把已经公开的scRNA-seq的数据进行了统一的加工，并且获得了基因在不同的疾病细胞以及正常细胞当中的表达情况，然后我们通过检索来获取这些作者分析好的结果，本质上来说属于一个数据库类型的文章

提问：晨曦，有没有更直白的、告诉我这个数据库能干什么？

回答：安排！

该数据主要可以帮助我们获取以下信息（重点）

1.浏览感兴趣的Gene

2.搜索细胞类型的marker

3.浏览多种疾病下的marker

4比较疾病和非疾病状态下各种类型细胞的表达谱（纳尼！，这岂不是帮助我们把差异分析都完成了~）

综上所述：SC2disease的横空出世为研究人类疾病相关的细胞类型中的特异性基因提供了有力的支持

干货来袭预警

主页面

首先，我们键入网址http://easybioai.com/sc2disease/进入SC2disease数据库界面

晨曦解读

可以看到该数据所纳入的疾病类型，页面下拉，可以看到该数据库的介绍信息以及该数据库整体的一个数据分布类型和排布，如下图所示

至此，主页面介绍完毕

Browse（浏览）

这个界面可以浏览数据库存在的所有数据的结果，界面如下：

然后我们可以选择左边的筛选栏来选择我们想要的疾病种类和细胞类型

至于右边的结果栏相比较于其它数据库则显得”别具一格“

不知道小伙伴们有没有发现，选择好想要研究的疾病或者细胞类型后，右边出来的结果界面是直接展示的DEGs的结果，并且标注好了细胞类型+Gene symbol+logFC等重要信息

随后我们点击”details“进入数据详细页面：

上面详细页面展示了，三大模块的详细信息，分别是”疾病“、”细胞类型“、”基因“这三块的详细信息

至此，Browse（浏览）界面介绍完毕

Search（检索）

上面Browse（浏览）中检索还是不够直接和精确，如果我们想要体验Pubmed数据库检索文献那样的检索模式，我们可以尝试使用Search（检索）

我们点击主页面上的Search（检索）进入检索界面，界面如下：

在上面这个界面，我们可以通过输入疾病名称、基因名称或细胞类型来访问数据库中的信息

至此，Search（检索）界面介绍完毕

Download（数据下载）

数据下载界面提供了数据库内数据的下载链接

主要在这里我们可以获得两种数据（当然包含更多类型的数据，但是晨曦在这里认为可能这两类数据更重要一点），界面如下：

1. All single-cell data, cell-type specific disease genes

全部不同疾病、不同组织在细胞水平上的表达差异

2. Disease-disease associations based on single-cell data

基于单细胞水平与一种疾病以上疾病都相关的基因

至此，该数据库的重点功能就给大家介绍到了这里，下面介绍一下使用该数据库的场景，或者也可以称为彩蛋部分~

妙用一

首先该数据库与前几个数据库的区别在于，该数据库整理了大量的、基于单细胞水平的差异基因，可以简单理解为对其它数据库的数据进行了差异分析

我们完全可以从其中获得我们想要的主角变量，也就是marker分析

举个栗子

我想要研究AD（爱茨海默症），我首先需要获得一个主角分子，这个分子的来源有很多，要么筛，要么猜（酸菜大大在体系课中对如何筛分子总结了很多经验哦~）

我这里想要通过生信的方式去获得一个分子，基于单细胞的差异分析我还不太熟练，那么我就可以用到这个数据库，操作界面如下：

我这里只需要10秒钟就可以得到一个在单细胞水平，基于AD疾病的差异基因，并且还有文献支持和链接，剩下的我们只需要看这个分子在我的研究中该以一个怎样全新或半全新的角度加以新的诠释，是不是很方便呢？

妙用二

scRNA-seq分析中对于细胞注释这个环节，总是存在着很多的分歧，现在晨曦个人的理解是采取多数据库、多方式来进行细胞注释，而这个数据库通过选择细胞类型就可以获得该细胞类型中表达具有差异的基因，而这些基因，我们就可以从中选择出我们的marker并对其细胞类型进行注释，操作如下：

到这里，关于SC2disease数据库就给大家介绍到了这里，也标志着晨曦单细胞数据库系列第五弹就结束啦~

数据库的介绍可能略显单调，所以在晨曦单细胞数据库系列中，每期都会录制导学视频并且也会介绍数据库妙用和功能总结，希望可以最大限度的帮助到挑圈联靠的每一位小粉丝

Ps：可以先看导学视频，导学视频看完后，挑感兴趣的部分阅读哦~

那么，就这样啦~

我是晨曦，我们下期再见QAQ

晨曦单细胞笔记系列传送门

1. 首次揭秘！不做实验也能发10+SCI，CNS级别空间转录组套路全解析（附超详细代码！）

2. 过关神助！99%审稿人必问，多数据集联合分析，你注意到这点了吗？

3. 太猛了！万字长文单细胞分析全流程讲解，看完就能发文章！建议收藏！（附代码）

4. 秀儿！10+生信分析最大的难点在这里！30多种方法怎么选？今天帮你解决！

5. 图好看易上手！没有比它更适合小白入手的单细胞分析了！老实讲，这操作很sao！

6. 毕业救星！这个R包在高分文章常见，实用！好学！

7. 我就不信了，生信分析你能绕开这个问题！今天一次性帮你解决！

晨曦从零开始学画图系列传送门

1. 看完这篇，彻底掌握生信画图精髓！超级实用，我不许你不知道！

2. 想让SCI看上去更高逼格？这些绘图技巧你一定要知道！

3. 3min掌握SCI配色神技，学会你就是组会汇报上最靓的仔！

—

END

—

撰文丨晨曦

排版丨四金兄

主编丨小雪球

欢迎大家关注解螺旋生信频道-挑圈联靠公号~

继续阅读

阅读原文

关键词

细胞类型

数据库

类型

生信

这个数据库