做gene ontology分析首先我们需要像下图这样一列我们所感兴趣的基因,一般是通过测序数据分析Fold-change后选出来的基因

很显然这里面的基因类别是gene symbolID。除此以外,常用的还用gene ensembleID等等。
下面打开david网站https://david.ncifcrf.gov/
点击function Annotation,之后list中在“paste a list”处复制表格里的基因名称,再在“step2 select identifier”中选择official gene symbolID
”step3 gene list“中选择gene list,所有的选择如下图所示,
点击submit list后会出现上图提醒你选择所研究物种的相关信息,这时候右侧会有实时的results,如下图所示,由于我们没有选择关心的物种,虽然我们的输入只有50左右的基因,但是在所有的数据库中却找到了8767个基因相匹配,这时需要在”list“中选择相关的物种
由于我们测序的是人类的样品所以选择如下。再点击”select species“后可以看到现在匹配到的基因个数变成了56个,由于我们输入的基因是list2,所以下面我们选择的应该是list2
由于是gene功能的富集分析所以我们需要选择一个背景,在这个大背景下的全部基因中,看看我们输入的基因到底和哪些功能的基因吻合的最多,这个大背景可以不由我们输入,在david中有做好的物种特异的背景,直接用就好了。
在”background“中依旧选择人类,然后点击use,之后就可以愉快的查看结果了,我们关心的是GO和KEGG的结果,所以先点击右侧的gene_ontology,出现内容如下所示:
其中BP代表(biological process),CC代表(cellular component),MF代表(Molecular Function),我们所关心的是BP所以点开GOTERM_direct_BP,
所得到的结果如下图:
其中P值是一个很关键的数值,代表了随机情况下这种富集程度出现的可能性,详细的内容将在教程(二)中介绍。最中间的是富集到的term的具体的名称,count数是我们输入的基因中落在这个功能中的基因的个数。点击右上角的dowload file得到如下表格。
这个表格我们之后会用来在R语言中绘制出最终GO分析的柱状图,相同的道理和操作,我们可以在”pathway“中选择KEGG_pathway,进行通路分析,如下图所示:
同样的下载相应的表格,得到的KEGG表格如下:

这个表格我们也会用来在R语言中绘制气泡图,R语言后续处理过程之后详见教程(三)。
教程(一)到此结束,主要介绍一下david的基本操作,重点是要注意自己的基因ID到底是什么类型,千万不可以搞错了。
我们恳请:若能转发分享,我们将非常感谢!(目前微信公众号改为乱序推送,如沐风科研设为星标,时常点击阅读,我们才会出现在您推送的前面位置)。
加入中医药交流群】添加小编微信邀请加入,也可由群友邀请加入,欢迎广大老师、朋友加入我们。小编微信:1278317307
往期推荐
如沐风科研 (Rumfer)公众号:由浙江中医药大学、中国药科大学、江西中医药大学以及福安药业和浙江省疾控中心的硕博士组成,主要发布科研实验、前沿咨讯、Figure绘图和药物研发、生产及注册等相关信息。欢迎广大朋友老师关注我们,您的分享和关注是对我们的最大鼓励。
继续阅读
阅读原文