146+72本期刊《SCI期刊分析+选刊网站》免费领
扫描下方二维码免费领取☟☟☟
没钱不用代码也能找到分子
从小白能懂的角度,聊生信方方面面。大家好,我是解螺旋的雪球。分子是医学研究的主角。从分子的角度进行切入,无论是基础科研领域的模型、检测方法还是标志物,还是生信分析中的富集分析、互作网络、临床预测模型的建立,都紧紧围绕这一认识深度展开。
分子该怎么找呢?
大家都知道酸菜老师有句名言,“要么筛,要么猜;有钱筛,没钱猜”。
说的就是有钱人家做研究,可以通过高通量筛选外加一通生信分析,从而得到差异表达基因以及关键基因;没钱做测序芯片的筛选,在浩如烟海的文献中,通过查阅检索文献的方式,找到一个或者几个没有在自己研究领域里做的研究。也有小伙伴说,我没钱,但是我有技能呀,我会R语言用公共数据库进行挖掘呀,不仅能二次利用公共数据库,还能顺手产一篇文章。
可是R语言不是还需要学习周期不是?真的是分析用一天,学习要半年。入门门槛太高,我要教大家的技巧,是五分钟快速学会在自己研究领域中定位到差异表达基因或者关键基因。接下来,我就抑郁症这个非肿瘤领域的疾病为例,和大家聊一聊如何只用在线数据库,轻松点点,就能锁定非肿瘤领域的关键基因。
1.人类疾病数据库(http://www.malacards.org/)
这个数据库一个人类疾病及其注释的综合可搜索数据库,综合了 72 个数据库的信息,可以查阅和检索对不同疾病的总结信息,查看相互联系疾病之间的关系,检索的疾病的药物研究中重要有哪些重要的药物,与疾病相关的发表文章,查找和这个疾病相关的差异表达基因和经典基因。
1
 打开MalaCards数据库,在检索框中输入疾病名称——Depression, 点击放大镜按钮:
2

 跳转到疾病的亚类的界面,选择一个更准确的亚类的类型,这里就选择第二行的“Depression" 这一个疾病关键词:
3
跳转到"Depression" 这个疾病的介绍页面:
4

下拉页面,会看到与抑郁症的相关基因:
5
把页面拉到底部,会看到与抑郁症相关的数据库及链接。感兴趣的可以一个个探究看一下:
2.GeneCards数据库(https://www.genecards.org/)
GeneCards数据库是可检索的人类综合数据库。
除了自建的信息外,还整合了超过150给外链数据库或者网站的数据,其中125个网站数据自动同步更新,提供简明的基因组、蛋白质组、转录组、遗传和功能上所有已知的和预测的人类基因功能数据资料,并整理归纳成别名、疾病、结构域、药物、表达、功能、基因组学、定位、同源序列、旁系同源基因、通路、产品、蛋白、文献、资源、概述、转录本、变异等18类(章节)信息,是目前信息最全的基因注释网站之一。
1
打开GeneCards网站,输入“Depression",点击search:
2
页面跳转到Depression页面,功检索到11478个与抑郁症相关的基因,并附带有基因的全程、分类、打分情况等:
参考教程单元课08《GeneCards数据库使用教程》
3.OMIM数据库(https://www.omim.org/)
OMIM数据库,全称Online Mendelian Inheritance in Man,中文称在线人类孟德尔遗传数据库。
OMIM包括了现在所有已知的遗传病和超过15000个基因的信息。OMIM侧重于疾病表型与其致病基因之间的关联。OMIM数据库包括gene entry基因条目;allelic variations 等位基因变异;gene map 基因图谱;phenotypic series 表型系列;phenotype entry 表型条目;clinical synopsis 临床提要;external links 外部链接。
1
打开OMIM数据库,在检索框中输入“Depression",点击检索按钮:
2
页面跳转,看到441个词条与抑郁症有关。每个词条下包括:表型与基因的关系、临床概要、疾病的临床信息、外部链接:
3

以第一个词条[# 168605. PERRY SYNDROME ]为例,点击进入:
1. 表型与基因的关系
解释:
location代表相关基因在染色体中的位置;
phenotype代表基因相关的表型;
phenotype MIM number代表表型的MIM编号;
inheritance代表遗传,是指该基因的遗传类型,如AD是指常染色体显性遗传,SMu是指体细胞突变,鼠标点击缩写符号就会出现不同缩写代表的具体含义;
phenotype mapping key代表表型映射关键,3代表该疾病的分子基础是已知的;
Gene/Locus代表对应的基因或位点;
Gene/Locus MIM number代表对应的基因或基因座MIM编号。

点击location还能显示该位置在同一个染色体相邻的基因列表。以及引发的各种疾病。
2. 临床概要
在该主页还能看见抑郁症的临床概要信息,包括:引起抑郁症的突变类型,抑郁症相关基因,以及分子生物学基础等。
3. 疾病的临床信息
如果想详细的了解该疾病,该主页还提供了该疾病的现代流行病学,临床特征,目前为止研究该疾病比较重要的研究汇总,分子遗传学水平的发病机理等等。
4.Pubmed(https://www.ncbi.nlm.nih.gov/)的Gene数据库
1
搜索栏的选项卡中选择Gene,在搜索栏输入"depression",点击search,可以进入该基因的信息页:
2
页面跳转,共筛选到1172个与抑郁症的相关基因:
5. GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)
GEO,全称Gene Expression Omnibus(基因表达综合数据库),是由美国国立生物技术信息中心于2020年创建并维护至今的高通量基因表达数据库。GEO是一个国际公共存储库,收录并整理了全球范围内研究工作者上传的微阵列芯片、二代测序以及其他形式的高通量基因组数据,并提供免费下载。
GEO数据库分为GEO DataSets和GEO Profiles两个子数据库,GEO DataSets以数据集为单位,存储同一个实验中的数据,GEO Profiles则是以基因为单位,存储基因在数据集中的表达谱。
GEO2R是GEO提供的在线分析工具,可对系列数据(Series)进行分析
实操演示:
1
在检索框输入Depression
2

点击search,会出现一个小的下拉框。说明GEO DataSets中和抑郁症相关的有3722个结果,GEO Profiles中和抑郁症相关的有352561个结果
3

点击352561,跳转到GEO Profiles中与抑郁症有关的结果,可以直接看到综合了所有数据集的差异表达基因的情况。可以看到所有与抑郁症有关的差异表达基因:
4
如果想对单个与抑郁症相关的数据集进行分析,就点击3722,跳转到GEO Datasets中与抑郁症有关的数据集。既可以用GEO自带的在线分析工具GEO2R进行差异表达分析,也可以将与抑郁症有关的数据集下载,用R语言进行差异表达分析。
参考解螺旋的免费单元课教程10《GEO数据库使用教程》、会员专属课程《GEO数据库使用教程》、《生信体系课》上篇/下篇的第一段位——差异表达 · 挑,上篇是无代码。
今天和大家就聊到这里。从小白能懂的角度,聊生信方方面面。我是解螺旋的雪球。我们下期再见。
往期回顾:
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文