PCAT数据库
基于转录组数据的小儿肿瘤基因变异、药物应答及临床相关性信息数据库
嗨,小伙伴们大家好啊!前面给大家介绍过Treehouse儿童肿瘤样本数据库,为奋战在小儿肿瘤相关研究领域的小伙伴们提供很大帮助,新的一周带领大家再学习一款基于转录组数据的小儿肿瘤基因变异、药物应答及临床相关性信息数据库——PCAT数据库,一起来嗨吧~!
期刊信息
数据库概览
PCAT数据库(http://pedtranscriptome.org/?home)由Greehey儿童肿瘤研究所于2021年1月发布在Nucleic Acids Res杂志,当前版本PCAT数据库收录324个肿瘤患者来源的细胞模型(Patient Derived Xenograft, PDX)及其相关基因表达、突变和拷贝数变异信息,收录自2008年以来发布的68个PDX对79种药物应答临床前测试数据,以及基于TARGET项目的肿瘤基因表达与临床相关性信息,为基于转录组水平探讨小儿肿瘤发病及其药物治疗相关机制研究提供极大便利。
右上角点击Portal进入数据库功能页面,提供数据检索、单基因分析和多基因分析功能。点击Documentation查看数据库相关介绍,提供常见问题答疑。
数据库核心功能及操作演示
 1 
Resources模块
Resources模块用于检索324个肿瘤患者来源的细胞模型(Patient Derived Xenograft, PDX)及其相关基因表达、突变和拷贝数变异信息,以及小儿肿瘤相关融合基因信息。
1)PDX Search
点击PDX Search进入检索页面,Choose a variant部分选择clinical,再选择感兴趣疾病,以检索神经母细胞瘤Neuroblastoma相关信息为例。表格展示PCAT数据库中神经母细胞瘤样本信息,提供样本ID、组织类型、性别、疾病阶段、年龄和肿瘤部位等信息。可选择多个感兴趣的样本,表格下方提供数据下载功能。以sample_id为COG-N-424x样本为例,点击查看详细信息。
Patient Detail部分展示样本COG-N-424x来源的患者详细信息,提供较详细的疾病诊断、复发及生存时间等信息。
Sample Detail部分展示样本COG-N-424x详细信息,提供肿瘤原发部位、取材部位、疾病分期、风险分组、药物治疗和细胞系等信息。
Mutation部分为样本COG-N-424x检测到的基因表达、突变和拷贝数变异等信息。
样本COG-N-424x暂无融合基因和药物应答信息。以样本CHLA-79为例,在Preclinical部分展示肿瘤药物应答情况,表格提供药物名称及别称、药物反应等级、药物作用机制及其参考文献等信息。
关于肿瘤药物应到反应情况,分为六个级别:疾病进展1(PD1)、疾病进展2(PD2)、病情稳定(SD)、部分反应(PR)、完全反应(CR)和维持完全反应(MCR)。关于每个级别的具体描述如下:
在PDX Search检索页面,Choose a variant部分还可以选择mutation或fusion检索具体某个基因,或选择drug检索某种药物。
2)Fusion Search
点击Fusion Zoom-In进入检索页面,Choose a database部分选择数据库,再选择感兴趣donor和acceptor基因,检索基因融合信息。以Target数据库中BRAF作为donor基因为例。表格展示样本ID、疾病、donor及acceptor和融合基因信息。点击View查看融合基因细节,以及donor和acceptor基因共表达散点图。
点击表格中sample_id,可查看样本TARGET-10-PANYGB-09A中全部融合基因信息。点击donor或acceptor基因名,查看BRAF、NDUFB2相关融合基因信息。
 2 
Single Gene Analysis模块
Single Gene Analysis模块提供目标基因的单基因分析功能,如基于临床特征的表达差异分析、生存分析、共表达分析、突变/基因拷贝数、药物应答反应等。
Clinical Parameters部分,基于临床特征的表达差异分析,侧边栏选择数据库、感兴趣的疾病、目标基因和分组,调整图形参数即可出图,箱图下方可直接下载图片,或原始数据。
Survival Rate部分提供单基因生存分析、多因素分析及可视化功能,同样在侧边栏选择数据库、感兴趣的疾病、目标基因、cutoff值方法和协变量,调整图形参数即绘制生存曲线图和森林图,图形下方可直接下载图片,或原始数据。
Co-Expression部分提供基因共表达分析功能,侧边栏选择数据库、感兴趣的疾病、相关性分析方法,可以进行某疾病Top共表达基因分析,或进行某两基因相关性分析。还可以对Top共表达基因进行通路富集分析。
Mutation/Copy Number部分可检索目标基因突变/拷贝数变异信息;Drugs Response部分展示基因表达与药物反应相关性。
 3 
Multiple Genes Analysis
Multiple Genes Analysis部分提供目标基因列表分析功能,如表达差异热图、功能富集分析、配对相关性和ssGSEA富集分析。
Heatmap Visual部分提供目标基因列表热图绘制功能,侧边栏选择数据库、疾病,输入目标基因列表,选择基因聚类、样本聚类,再选择分组特征,即可绘制热图。
Functional Enrichment部分提供目标基因列表富集分析功能,以示例数据为例(数据库总是报错,推测是服务器问题,小伙伴们可以改天再试试/捂脸)。
Pairwise Correlation部分提供目标基因相关性分析功能(数据库也总是报错,小伙伴们可以改天再试试/捂脸)。
接下来是ssGSEA富集分析,single sample GSEA是单样本GSEA分析的方法,原理与GSEA是类似的,根据表达谱文件计算每个基因rank值,再进行后续统计分析。该模块使用方法与前述类似,不再赘述。
 总结 
当前版本PCAT数据库收录324个肿瘤患者来源的细胞模型(Patient Derived Xenograft, PDX)及其相关基因表达、突变和拷贝数变异信息,68个PDX对79种药物应答反应数据,以及基于TARGET项目的肿瘤基因表达、突变和拷贝数变异与临床相关性信息,为基于转录组水平探讨小儿肿瘤发病及其药物治疗相关机制研究提供极大便利。
以上就是PCAT数据库全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下文献哦~!
Yang J, Li Q, Noureen N, Fang Y, Kurmasheva R, Houghton PJ, Wang X, Zheng S. PCAT: an integrated portal for genomic and preclinical testing data of pediatric cancer patient-derived xenograft models. Nucleic Acids Res. 2021 Jan 8;49(D1):D1321-D1327. doi: 10.1093/nar/gkaa698. PMID: 32810235; PMCID: PMC7778893.
Nucleic Acids Res 精选系列
 LncRNA/CircRNA系列 

小白实战课堂开课啦!手把手教你转录因子与靶基因预测操作~!
 引药生变数据库系列传送门(完结) 
 甲基化数据库系列传送门(完结) 
END

撰文丨弘   毅
排版丨四金兄
主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文