一文学会肿瘤药敏及多组学分析GDSC数据库使用方法
嗨,小伙伴们大家好!这里是每周一弘毅专栏,我志向用小小文字助力你的SCI发表之路。这期给大家带来的是GDSC肿瘤药物敏感性基因组学数据库,各位做肿瘤药物相关研究的小伙伴不要错过呦~!
关于GDSC数据库
阻断细胞内信号转导的靶向分子疗法在肿瘤研究领域方兴未艾,该策略基于对致癌基因和肿瘤进展相关基因的功能研究,以及肿瘤患者基因组特征与药物治疗反应之间相关性的临床观察,对肿瘤患者带来极大希望。GDSC(Genomics of Drug Sensitivity in Cancer)肿瘤药敏基因组学数据库,网址:https://www.cancerrxgene.org/),是由英国Wellcome Sanger研究所和美国Massachusetts General Hospital Cancer Center分子治疗中心合作资助,整合肿瘤细胞系抗癌药物敏感性数据和细胞系基因组学数据,致力于发现肿瘤药物治疗靶点、药物敏感性基因型及其他可能预测抗癌药物疗效的biomarkers,无论是对我们做肿瘤治疗的基础科研还是指导肿瘤治疗临床工作都有极大帮助。
进入GDSC官网主页,该数据库提供三种检索方式,分别是药物名称、基因名称和细胞系名称。
页面下拉,可见GDSC中收录518种抗癌化合物信息,涉及24条信号通路,共包含446146个剂量反应曲线和570161个基因组学关联性分析结果,分别点击蓝色字体链接可进入化合物、细胞系和肿瘤基因组学特征,以及剂量反应曲线和组学关联分析功能页面。
右侧栏为数据库更新信息,也可点击News查看,最近一次更新为2020年6月的8.3版本,目前包含988种肿瘤细胞系相关的518种抗癌化合物的446146个药物剂量反应IC50值和AUC值。GDSC数据库平均每年更新一次,有时一年内会有几次小的数据更新,不满足质控标准QC阈值的数据将被剔除,同时增加新的肿瘤细胞系药物敏感性数据。
另外,右侧栏可见GDSC数据库是由GDSC1和GDSC2两个子数据库构成,点击Documentation再点击Screening,页面下拉可见两个子数据库详细情况。GDSC1子数据库收录2010-2015年间的检测数据,最新版GDSC1包含987个细胞系相关的367个抗癌化合物的310904个药物剂量反应IC50值。GDSC2收录2015至今的数据,最新版GDSC2包含809个细胞系相关的198个抗癌化合物的135242个药物剂量反应IC50值。二者的差别在于技术更新,GDSC重复检测了部分来自GDSC1的实验,官方推荐GDSC2。
点击Documentation再点击Publication可见该数据库相关文献,页面下拉,分别是背景知识阅读和已发表的引用该数据库的文献。
点击FAQ,展示该数据库使用过程中可能遇到的问题,小伙伴们使用过程中不要忘记了这个小贴士哦~!
GDSC数据库核心功能及操作演示
一、Compounds功能板块
点击Compounds进入抗肿瘤化合物数据查询功能板块,包含细胞毒性化疗药物和靶向治疗药物信息,展示化合物别名、药物靶点、靶向的通路、药物ID和数据来源机构,以及该药物在GDSC1或GDSC2子数据库中对应细胞系的数目,右侧检索框可检索感兴趣的化合物,右上角可下载表格文件。
以5-Fluorouracil为例,点击药物名可链接至可视化界面,该部分数据来自于GDSC1子数据库,点击Tissue specific analysis在下拉菜单中可选择不同肿瘤进行组织特异性分析或泛癌分析。
Overview提供IC50和AUC值,绿色曲线对应细胞系敏感的5-Fluorouracil治疗浓度,红色曲线对应细胞系耐药的5-Fluorouracil治疗浓度。
页面下拉可见5-Fluorouracil在不同细胞系中具体的IC50和AUC值,提供不同细胞系对应的组织类型、亚型和TGCA分类,点击绿色细胞系名称可连接到GDSC细胞系信息板块。右下角可下载表格文件。
IC50 by tissue展示5-Fluorouracil在不同类型肿瘤组织中的IC50数据分布箱图结果,单击箱图可显示散点,双击散点可显示箱图,鼠标悬浮在某个散点可见对应的细胞系名称和IC50值,点击可进入GDSC细胞系信息板块。页面下拉为列表信息,基本同前。
Volcano Plot展示基因组学特征和5-Fluorouracil药物敏感性间相关性的ANOVA分析结果,Tissue analysis为不同肿瘤组织间差异分析,Combined analyses为所有肿瘤的泛癌分析。火山图的散点大小代表细胞系数量,散点颜色代表统计学差异(满足p<0.001且FDR<25%被认为具有显著性差异),其中绿色代表敏感并对应X轴右侧,红色代表耐药并对应X轴左侧,灰色代表无显著差异。鼠标悬停在散点,可显示详细信息,具体在下方表格展示。
Scater plot展示突变型和野生型细胞系中5-Fluorouracil药物IC50值,点击Select Feature可选择基因突变特征,以药物敏感性相关的EWSR1.FLI1突变为例,点击得到EWSR1.FLI1突变型和野生型的不同细胞系5-Fluorouracil药物IC50值散点图结果,不同颜色代表右侧表格中不同细胞系,鼠标悬停在散点可查看详情并连接至GDSC细胞系信息板块,右侧表格显示突变组有17个细胞系,野生组有862个细胞系,可选择感兴趣的细胞系展示在散点图中,相应的的MWW(Mann Whitney Wilcoxon)检验p值<0.05表明组间存在显著差异,即SATG2突变与5-Fluorouracil治疗敏感显著相关。
Compare compound展示两种化合物IC50和AUC值的相关性点图,点击Select Compound可选择与5-Fluorouracil比较的化合物,此处以A-443654为例,分别提供Person和Spearman相关系数,二者IC50值具有较弱的正相关关系。
二、Features功能板块
点击Features进入肿瘤基因突变特征查询功能板块,左上角下拉菜单可选择泛癌分析或感兴趣的肿瘤类型,右上角检索框可输入感兴趣基因名,点击基因突变类型的蓝色字体可链接到该突变类型与药物敏感性分析的可视化结果,包含火山图和散点图,散点图可选择感兴趣的药物,其余内容基本同前。
三、Cell Lines功能板块
点击Cell Lines进入不同肿瘤细胞系药物敏感性查询功能板块,展示细胞系的名称、细胞模型passports、cosmic ID和TCGA分类,以及组织类型和亚型等信息。点击细胞系名称可链接至GDSC可视化页面,信息基本同前。点击Cell Model Passports和COSMIC ID目录下蓝色字体均可连接至细胞模型相关数据库查看详情。
第一列:基因名称

①列打“√”的基因表示被OncoKB收录有注释信息,标“信封”的表示可点击信封标志申请添加注释信息;
②列为肿瘤学功能,TSG为抑癌基因,Ocongene为癌基因;
③列为注释信息来源
④列为数据来源的总数。各列标题右下角的小箭头均可点击进行排序,表格右上角提供检索功能。
Actionable Genes为OncoKB核心功能模块,点击进入功能页面,可以看到依次有Level 1~4和Level R1/R2级别的数据,提供以肿瘤类型、药物和突变基因名三种方式进行检索。
以乳腺癌为例,在Search Tumor Type栏输入或下拉选择Breast cancer,回车可得到检索结果,共有21个基因及对应的37种药物注释信息,其中Level1~4包含的基因分别为6、2、4和11个,LevelR1~2包含的基因分别为0和2个。页面下拉可以看到不同级别对应的基因名称、突变类型和相关药物。
以ERS1为例,点击进入查看详情,首先可以看到ERS1为癌基因,还有其别名、基因组位置信息、背景介绍和不同肿瘤中的突变情况。
页面下拉,可以看到该基因常见的突变位点及功能注释的结构图,点击Legend查看图标注释,鼠标悬浮查看序列片段位置,右上角选项可供用户个性化设置,然后下载图片,使用时别忘记引用参考文献(Zehir et al., Nature Medicine, 2017)。
说明:目前OncoKB合并到cBioPortal数据库,该部分内容也可以在cBioPortal实现,方法参见之前关于cBioPortal数据库的使用方法介绍,或本文末文献单图复现。
页面再往下拉,分别是该基因在乳腺癌,以及其他不同肿瘤中的所有突变类型和对应的注释信息。
在Actionable Genes目录检索不到的基因,表示暂无该基因临床可干预靶点信息,返回官网主页,输入目标基因,下拉菜单点击可进入详情页面,内容同前。
文献单图复现
1

文献案例一:PMID: 31417239,IF=3.216分
本文旨在筛选etoposide治疗敏感的肺癌细胞系,Figure1ab展示GDSC数据库中54个肺癌细胞系的etoposide治疗IC50值,其中35株细胞对etoposide治疗敏感,19株细胞对etoposide治疗耐药。
单图复现如下:
进入GDSC官网,检索框输入etoposide得到一条检索结果,点击进入详情页面,右侧栏选择肺癌,Overview展示的即为原文Figure1a,再点击IC50 by tissue,即得到原文Figure1b。
2

文献案例二:PMID: 31139560,IF=4.848分
本文旨通过GDSC数据库挖掘PTEN基因突变阳性的肾透明细胞癌(KIRC)患者治疗敏感的化疗药物,Figure2de展示PTEN突变与药物敏感性的泛癌分析结果,其中d图表示突变型和野生型的各肿瘤细胞系之间GSK690693药物IC50值存在显著差异,e图表示PTEN突变的多种肿瘤细胞对GSK690693药物治疗敏感。Figure2f展示PTEN突变与GSK690693药物敏感性的KIRC特异性分析结果,即与野生型细胞系相比,PTEN突变阳性KIRC细胞系IC50值显著降低,表现为PTEN突变阳性的KIRC患者对linsitinib治疗敏感性好。
单图复现如下:
进入GDSC官网,检索框输入PTEN,检索到一条结果,突变类型为coding variant,点击进入详情页面,Volcano Plot火山图即原文Figure2e,显示PTEN突变的多种肿瘤细胞对GSK690693药物治疗敏感。
点击Scatter plots,再点击Select Drug选择GSK690693药物,得到药物敏感性的泛癌分析结果,即原文Figure2d,表示各肿瘤细胞系突变型和野生型之间GSK690693药物IC50值存在显著差异。
点击左侧栏Tissue specific analysis下拉菜单选择肾透明细胞癌,得到PTEN突变与GSK690693药物敏感性的KIRC特异性分析结果,即原文Figure2f。
有趣的是,以上结果是在GDSC1子数据库中的分析结果,而在GDSC2子数据库中未收录GSK690693药物敏感性相关信息,小伙伴在使用该数据库时候注意根据时间段对进行两个子数据库选择哈,弘毅的经验是两个子数据库都过一遍。
3

文献案例三:PMID: 31871844,IF=2.379分
本文Figure3展示TP53突变膀胱癌细胞系对丝裂霉素C(mitomycin-C)、阿霉素(doxorubicin)及吉西他滨(gemcitabine)三种药物治疗敏感性的膀胱癌特异性分析结果。
单图复现如下:
进入GDSC官网,检索框输入TP53,检索到两条药物结果和两条基因组特征结果,选择TP53突变,突变类型为coding variant,点击进入详情页面,右边下拉菜单选择膀胱癌,Volcano Plot火山图即原文Figure3a,显示TP53突变的膀胱癌细胞系对mitomycin-C、doxorubicin和gemcitabine三种药物治疗敏感性信息,P值均小于0.05。
点击Scatter plots,再点击Select Drug选择药物,以mitomycin-C为例,得到药物敏感性的泛癌分析结果,即原文Figure3b,表示各肿瘤细胞系突变型和野生型之间药物IC50值无显著差异。
点击左侧栏Tissue specific analysis下拉菜单选择膀胱癌,得到TP53突变与mitomycin-C药物敏感性的膀胱癌特异性分析结果,即原文Figure3c。

投我以桃,报之以李,开发并维护数据库不易,小伙伴们使用GDSC时,别忘记引用参考文献(Nucl. Acids Res.2013 Database issue. PMID:23180760)哦!~

写在结尾
我有双份的快乐,一份留给我的family members,一份留给不经意间看到的你!好啦~关于GDSC数据库加餐就到这里啦!欲知更多生信知识,我们相约“挑圈联靠”公众号~下期再见了~~!
欢迎大家关注解螺旋生信频道-挑圈联靠公号~

继续阅读
阅读原文