TcoFBase数据库
转录辅助因子综合信息数据库
嗨,小伙伴们大家好啊!新的一周我们继续Nucleic Acids Research(NAR)杂志数据库追新。之前讲了太多转录因子及其靶基因缠绵悱恻故事的话本,这周我们换个口味,来讲讲转录辅助因子及其功能注释数据库,TcoFBase数据库,提供转录辅助因子综合信息,一起来看看吧~!
期刊信息
数据库概览
转录辅助因子(TcoF)本身不与DNA结合,作为转录复合物的组件部分发挥转录调节功能。TcoFBase数据库(http://amigo.geneontology.org/amigo/landing)于2021年10月发布在Nucleic Acids Research杂志,基于人类和小鼠的500余种组织或细胞类型中收集2322个TcoF和6759个TcoF相关ChIP-seq数据,提供TcoF结合区域丰富遗传注释信息,如超级增强子、增强子、TFBS、甲基化位点、常见SNP、风险SNP、eQTL(expression quantitative trait locus)、组蛋白修饰和染色质相互作用等。
同时,TcoFBase数据库支持TcoF调控关系及功能注释,包括基因表达、Pathway、GO术语、蛋白质相互作用(PPI)、肿瘤标志、生存和其他疾病信息。还嵌入了5种TcoF调控分析,即TcoF基因集富集、TcoF结合基因组区域注释、TcoF调控网络分析、TcoF-TF co-occupancy分析和TcoF调控轴分析。另外,TcoFBase数据库界面友好,适用于查询、浏览、分析和可视化TcoF相关信息,在探索疾病和生物过程中TcoF潜在功能及调节机制方面提供极大便利。
菜单栏Help部分提供数据库介绍及各个功能模块使用指南。
数据库核心功能及操作演示
 1 
Browse功能
Browse功能模块支持以物种、TcoF家族及证据等级进行数据浏览。以人类为例,表格展示人类1244个TcoF信息,提供Gene symbol、Gene ID、Ensembl ID、证据级别、基因描述、TcoF家族和ChIP-seq数目等信息,右上角可以检索感兴趣基因,左上角可以下载表格数据。
说明:TcoF相关信息证据等级分为三类:
Class HC表示转录调节作用及核定位信息都来自于实验证据;
Class 1表示仅转录调节作用信息来自于实验证据;
Class 2表示核定位信息来自于实验证据;
Class 3表示转录调节作用及核定位信息都来自于非实验证据。
以ChIP-seq num降序排列,再以Class降序排列,选择第一个TcoF即BRD4点击查看详细信息。TcoF overview部分提供BRD4基本信息,及其与靶基因调控网络,网络图支持自定义方法和展示权重,权重表示TcoF与Target gene调节关系可靠性。
ChIP-seq based regulatory details部分展示BRD4 ChIP-seq数据样本信息,即细胞系、样本名称、GSM ID、组织类型和数据来源。
Sample ID以TcoF_00_40722为例,点击后展示样本详细信息,提供ChIP-seq peak注释及可视化结果。
ChIP-seq peak ID以TcoF_00_4072200054为例,点击后提供ChIP-seq peak注释基因及期相关性,在启动子、超级增强子、增强子、TFBS和SNP等注释情况。
Downstream target genes部分展示BRD4下游靶基因信息,有2847个实验证实及潜在的靶基因,表格提供证据来源及权重信息。
Upstream regulatory details部分提供TcoF上游遗传调控信息。
Upstream regulatory details部分以Promoter为例。eQTL即expression quantitative trait locus,在Wikipedia是这么解释的“Expression quantitative trait loci (eQTLs) are genomic loci that explain variation in expression levels of mRNAs”,表示解释mRNA表达水平变化的基因组信息。表格提供BRD4基因启动子序列所在位置、SNP位点、SNP ID及氨基酸信息、上游调节基因、组织类型和顺式或转录调节作用等信息。TFBS部分即调节BRD4的转录因子及转录因子结合位点信息。还有常见SNP(Common SNP)、风险SNP(Risk SNP)和地区特异性SNP(East Asian, African, European, Ad Mixed American, South Asian),以及DNase I hypersensitive signals(DHS)、Chromatin interaction和甲基化修饰(450K、WGBS)等信息。
Upstream regulatory details部分Enhancer和Super enhancer与Promoter目录下的内容基本类似,不再赘述。MirRNA部分提供靶向调节BRD4的miRNA信息。
Protein-protein interaction部分展示BRD4及其相互作用基因之间的分子交互关系。
Annotation部分展示BRD4在Pathway、GO和Hallmark的相关功能注释信息。GO结果提示BRD4存在与RNA polymerase II结合结构域。
TCGA cancer survival map部分提供基于TCGA数据库的BRD4生存分析结果,可选择感兴趣的肿瘤,绘制生存曲线、表达差异箱图和HR风险系数热图等。
Expression部分展示不同数据库中BRD4在不同肿瘤组织、细胞系、正常组织和原代细胞的表达情况。
Disease information部分展示BRD4相关的疾病信息。
 2 
Search功能
Search功能模块支持以TcoF名称、基因组位置、靶基因和TcoF家族进行检索,以人类BRD4为例,结果与前述类似,不再赘述。
 3 
Analysis功能
Analysis功能板块提供5种TcoF调控分析,即TcoF基因集富集、TcoF结合基因组区域注释、TcoF调控网络分析、TcoF-TF co-occupancy分析和TcoF调控轴分析。
以TcoF gene set enrichment为例,输入示例基因列表,选择物种为人类,设置p-value或FDR,点击Analyze进行分析。
列表展示输入基因列表与TcoF调节关系注释结果,提供TcoF symbol、注释到的基因及基因数、富集分数、TcoF靶基因数、富集分数、P value、FDR、和Bonferroni调整P值,点击TcoF可以查看详情,点击Veen展示交集结果。
再以TcoF binding genomic region annotation的示例数据为例,输入TcoF结合位点序列的列表,选择物种,设置阈值,点击Analyze得到分析结果,列表Details展示该序列详细的注释信息。
TcoF regulatory network analysis功能与前述类似,示例数据分析结果如下,网络图和表格展示输入基因与TF及TcoF转录调控关系。
TcoF-TF co-occupancy analysis用于TcoF-TF互作分析,示例数据分析结果展示了转录辅助因子MED1与转录因子TF的ChIP-seq峰值重叠情况。
TcoF regulatory axis analysis功能与前3个类似,示例数据分析结果展示基于TcoF的目标基因功能富集分析结果。
 4 
Genome-Browser功能
Genome-Browser功能模块与UCSC类似,左侧选择感兴趣的track,右侧检索框输入目标基因序列,点击GO即可。输入目标基因启动子序列chr2:223,975,045-224,041,286,以AFF1、SOX2、SOX4的TFBS_ChIP-seq track为例,加载后展示上述3个转录因子在该基因启动子区域的TFBS信息,AFF1有1个,SOX2有3个。
最后Download部分提供TcoF information、TcoF ChIP-seq data information、TcoF elements of all samples、TcoF downstream target genes等数据下载。
数据库应用场景分析
1、Search:已知TcoF,查询其的靶基因;或已知靶基因,查询转录调控其表达的TcoF。
2、TcoF gene set enrichment:已知表达差异基因,探索DEGs在TcoF方面的功能注释信息。
3、Genome-Browser:已知靶基因启动子序列,探索该序列TFBS、TF及TcoF。
4、Browse:获取人类或小鼠TcoF基因列表。
5、TcoF regulatory network analysis:“TcoF-TF-靶基因”转录调控网络分析。
6、TcoF-TF co-occupancy analysis:TcoF-TF互作关系信息查询。
7、Browse:TcoF在疾病中的功能注释信息及肿瘤预后分析。
8、Browse:TcoF上游调节因素分析,如TF、SNP、甲基化修饰和miRNA等。
9、Browse:基于ChIP-seq峰注释信息探索TcoF-TF互作及优化靶基因预测TF的结果。
嘿嘿~弘毅能想到的就是这些了,欢迎小伙伴们留言补充~!
 总结 
目前TcoFBase数据库收录人或小鼠的2322个TcoF和6759个TcoF相关ChIP-seq数据,提供TcoF结合区域丰富遗传调控信息,以及TcoF调控关系及功能注释信息,嵌入了5种TcoF调控分析工具,界面友好,适用于查询、浏览、分析和可视化TcoF综合信息,在探索疾病和生物过程中TcoF潜在功能及调节机制方面提供极大便利。
以上就是TcoFBase数据库全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下文献哦~!
Zhang Y, Song C, Zhang Y, Wang Y, Feng C, Chen J, Wei L, Pan Q, Shang D, Zhu Y, Zhu J, Fang S, Zhao J, Yang Y, Zhao X, Xu X, Wang Q, Guo J, Li C. TcoFBase: a comprehensive database for decoding the regulatory transcription co-factors in human and mouse. Nucleic Acids Res. 2022 Jan 7;50(D1):D391-D401. doi: 10.1093/nar/gkab950. PMID: 34718747; PMCID: PMC8728270.
 往期传送门 
小白实战课堂开课啦!手把手教你转录因子与靶基因预测操作~!
 引药生变数据库系列传送门(完结) 
 甲基化数据库系列传送门(完结) 
END

撰文丨弘   毅
排版丨四金兄
主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文