仙桃工具GEO数据库一站式数据挖掘
小伙伴们,大家好!又和小洋见面啦,在前面的推文中小洋向大家介绍了如何利用仙桃工具复现SCI文章中常见的图形,感兴趣的小伙伴可以在挑圈联靠公众号——小洋专栏中查看前面的推文。那么,本期小洋将向大家介绍如何利用仙桃工具在GEO数据库中进行一站式的数据挖掘。
小洋的单图复现系列传送门
GEO数据库简介
GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它收录了世界各国研究机构提交的高通量基因表达数据,目前已经发表的论文中涉及到的基因表达检测的数据可以通过这个数据库中找到,并且免费提供下载,对科研人来说真是非常友好的存在。其网址是https://www.ncbi.nlm.nih.gov/geo/,它包含有多种平台的数据,包括常见的芯片数据、高通量数据(RNAseq、ChIP、单细胞测序数据等)。由于是开放给作者上传高通量数据,所以即便是同一个平台(或者同一个GPL平台号)的数据中,包含的数据情况也是各式各样的,因此可能会存在有数据缺失的情况。
下面让我们来共同学习如何利用仙桃工具进行GEO数据库的一站式数据挖掘!
仙桃工具挖掘演示
首先,进入仙桃学术工具(https://www.xiantao.love)→点击【数据集检索】
点击进去后页面是这个样子的,我们可以根据个人需求来进行检索
以GPL570为例,检索结果提供了一些数据集基本信息以及一些常用的跳转链接,还包括常用的GEO2R ~ 如果是可以添加到样本库的,右下角还会有「选择样本」的按钮可以点击并选择样本~
数据集检索目前收录了 GPL570平台下的6-200个样本量的数据集,大约有5400个数据集,这些都是能直接添加到自己的样本库做后续的分析的。后续还会持续收录其他平台的数据集~
如果想要只看能直接进行分析的数据集,就把左边过滤条件中的「样本库」对应的「未收录」给勾掉,然后重新检索就知道有没有能直接分析的数据集了。
如果数据集右下有一个「选择样本」,说明这个数据集是可以进行样本添加的。点开这个「选择样本」,就能选择对应数据集的样本。
选择完样本后,点击右下的「添加到样本库」就能添加到自己的样本库中,后续可以在样本库中进行分组以及进行下游分析 ~
进入到「我的样本库」,页面是这个样子的。中间一个大表格里面有个人专属的样本库内容,有刚刚添加的样本,右边是分析参数以及提交分析的按钮。
首先要在样本库中进行分组,先选中一些样本,然后点击左下角的「加入参考组」或者「加入实验组」,把样本库中想要分析的样本分成两个组。添加好分组后,就可以点击右边的「提交分析」
选择好分组后,就可以提交分析了,点击提交分析后,下面的历史记录中会出现一条分析记录,点击右上角的刷新可以刷新分析任务的进度情况。(一般分析都是很快就能完成的~)
当分析完成后,就可以下载结果内容了。
仙桃学术一次性提供了很多的结果内容,包括 箱式图、PCA图、UMAP图、火山图、差异分析结果表格等,以及结果分析报告。
「说明」中有丰富的分析说明和结果展示,结果都提供了直接下载以及细节修改的跳转链接。细节修改的内容目前是只有基础版或者高级版才有,部分模块也是只有高级版才有。这些细节修改包括调整配色,样式等等,让结果更加个性化。调整了细节的结果还可以进行保存,用生信工具的拼图工具直接拼图,真正做到一站式出发表级分析结果~
点击【细节修改】,即可跳转至以下界面,选中刚刚分析的数据结果,在配色方案中选择一个想要的配色,就能直接出来一个个性化的结果内容。
以上就是有关如何利用仙桃工具来进行GEO数据库一站式数据挖掘的全部介绍,下面让我们来实战演练一下!
实战演练
我们来看一篇2018年12月发表在“Scientific reportsIF= 4.379)杂志上的一篇文章。题名为“Transcriptomic and functional network features of lung squamous cell carcinoma through integrative analysis of GEO and TCGA data”。
期刊简介
使用工具
仙桃学术(https://www.xiantao.love
文章复现
进入仙桃学术(https://www.xiantao.love)→点击【数据集检索】
我们选取GSE33532数据集进行示范:
在搜索框中输入我们想要进行分析的数据集GSE33532,可以看到该数据集中数据已被工具收录,可以进行分析。
该数据集共包含100例样本,从实验设计描述中可以看到其中包含20例Normal样本和80例Tumor样本,选择全部样本后,点击“添加到样本库”。
进入样本库,根据“Source name”将样本分别加入参考组和实验组中,可以看到界面下方显示的样本信息:参考组:20个;实验组:80个。点击界面右侧“提交分析”。
提交分析后,可以在历史记录中进行结果下载。
点击下载:
 部分结果展示 
箱式图:
PCA图:
好啦,本期有关如何利用仙桃工具在GEO数据库中进行一站式数据挖掘的相关内容就介绍到这里,希望对大家的科研工作有所帮助。我是小洋,我们下期再见~
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
END

撰文丨小   洋
排版丨四金兄
主编丨小雪球
继续阅读
阅读原文