STITCH:化合物与靶基因互作关系
嗨,小伙伴们大家好!新的一周我们继续聚焦引药生变的话题。检索Pubmed不难发现近5年,网络药理学在传统中草药机制研究中是如火如荼如日中天。与传统意义上针对单一靶点的单一药物治疗策略不同,作为天然的“组合式”治疗策略,中草药在网略药理学研究中占有天然优势。前面几期给大家伙儿介绍了不少中草药研究神器,今天我们聚焦一个网络药理学研究面临的共性问题,即如何查找药物的靶基因!蛋白互作领域大名鼎鼎的STRING数据库想必大家不会陌生,那么其兄弟数据库STITCH呢?提供化合物与靶基因互作关系信息,一起来康康吧~!
‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍引药生变系列传送门 
数据库概览
点击网址(http://stitch.embl.de/)进入STITCH数据库主页,该数据库最早于2008年发布,至今更新至5.0版本,数据来源有,DurgBank、GLIDA、Matador、TTD和CTD等人工注释数据库,KEGG、PID、Reactome和BioCyc等通路数据库,以及ChEMBL、PDSPKi和PDB等实验结果数据库。当前版本收录来自2031个物种的43000个化合物和9643763个蛋白之间相互作用信息,并与STRING数据库共享蛋白交互数据。STITCH数据库中的每个化合物与蛋白互作关系都对应一个分值,指示其相互作用概率或结合亲和力,并提供与目标药物相似的化合物及其相似分数。
点击Help,点击侧边栏Getting started,可见该数据详细使用指南;点击Database,展示该数据库各种参数/名词含义解释。
数据库核心功能及操作演示
 1 
Item by name
进入数据库,点击Item by name进行单个药物或基因检索,检索框可输入化合物或基因名称,物种可选择自动识别,以检索丁酸盐(butyrate)为例,点击Search,勾选butyrate,点击Continue得到检索结果。首先映入眼帘的是butyrate与基因互作关系网络图,下方是各个功能选项。
点击Legend查看网络图注释:
(1)Notes目录下展示节点含义:每个节点表示单个编码基因位产生的所有蛋白质;小节点代表蛋白三维结构未知,大节点展示蛋白三维结构或预测的三维结构;彩色节点表示一级交互点,白色节点表示二级交互点。
(2)Edges目录下展示连线含义:连续粗细代表低、中、高和最高4个程度的交互评分。
(3)Your Input目录下提供输入的butyrate相关描述。
(4)Predicted Functional Partners目录下提供每个蛋白质功能描述,按交互评分降序排列。
(5)Your Current Organism目录下提供当前数据所属的物种。
点击其中某个节点,如CKD2,查看详细注释信息、结构和功能域信息,Actions中提供5个功能选项,分别是以该因为核心重构网络、添加其为输入基因扩充网络、展示该基因蛋白序列和查找其他物种同源蛋白,以及该基因在GeneCards数据库中通路、功能和来源信息。
点击Setting进行个性化设置:
(1)Basic Setting目录下,可选择显示的连接方式、连线代表的含义、连线数据来源、展示的最小交互评分和最大交互数,设置完成后点击UPDATE刷新。
2)Advanced Setting目录下,可选择是否显示组织特异性交互,是否显示蛋白三维结构。
点击Analysis展示GO/KEGG富集分析结果,按FDR值从小到大排列,页面底部提供下载链接。
点击Tables/Exports查看上述交互网络结果表格形式,并提供位图、矢量图和表格数据下载,以及蛋白序列和注释信息下载。
点击More在当前基础上显示更多节点,点击Less在当前基础上显示更少节点。
上述信息为Viewers目录下Network结果。点击Experiments,展示实验支持的butyrate与基因交互信息;点击Databases,展示各种数据库来源的butyrate与基因交互信息;点击Textmining,展示文献挖掘中butyrate与基因交互信息;点击Coexpression,展示蛋白共表达信息。上述结果的下方功能选项基本同前。
接下来以检索SOX2基因为例,点击Search,勾选Homo sapiens,点击Continue得到检索结果,展示SOX2基因相关蛋白交互网络,该结果与STRING数据库类似,不再赘述。同样地,Protein sequence(s)检索功能与STRING数据库结果类似,不再赘述。
 2 
Multiple names
进入数据库,点击Multiple names进行药物或基因列表检索,检索框可输入化合物或基因名称列表,物种选择自动识别,以检索乙酸盐、丙酸盐和丁酸盐为例,点击Search,勾选Homo sapiens,点击Continue得到检索结果。映入眼帘的是3种化合物与基因互作关系网络图,下方各个功能选项与前文类似。
 3 
Chemical structure(s)
进入数据库,点击Chemical structure(s)以药物化学结构式检索,检索框输入化合物SMILES结构式,以丁酸的CCCC(O)=O为例,自动识别物种,点击Search,勾选butyric acid sodium salt,点击Continue得到检索结果,与前文类似。
Tips:SMILES(Simplified Molecular Input Line Entry System)以单行文本表达化合物结构的线性符号,由David Weininger于1986年开始采用及Daylight Chemical Information Systems开发并共同创建。那么如何获得丁酸的SMILES结构式?
根据SMILES规则自行书写往往容易出错,可以借助网站完成。点击(http://www.swissadme.ch/index.php)进入SwissADME网站,以丁酸为例,在绘图面板绘制丁酸结构式,点击双箭头,右侧可显示其SMILES结构式。该网站还提供丁酸ADME信息,即药代动力学数据,机体对外源化学物吸收(absorption)、分布(distribution)、代谢(metabolism)和排泄(excretion)相关信息。
数据库附带功能
 1 
CancerHSP
点击Database下CancerHSP进入功能页面,该子数据库包含2439种抗癌中草药的3575种抗癌化合物成分的832个靶基因信息,提供每种化合物的分子结构和ADME参数,以及基于492种不同肿瘤细胞系的化合物抗癌活性,有助于揭示天然抗癌药物的分子机制和抗癌药物的开发。该模块使用方法比较简单,可参考侧边栏功能导航自行探索。
 2 
CVDSP
点击Database下CVDSP进入功能页面,该子数据库提供心血管疾病相关中草药及其所含化合物成份药理学信息,包含已知的254种心血管药物的206种治疗靶基因,以及98种心血管疾病及268种心血管疾病基因,有助于心血管疾病相关药物机制研究和药物研发。
 3 
PreDC
点击Database下PreDC进入功能页面,即Predict Drug Combination,提供预测和实验验证的药物组合疗效信息。其中951种药物的1,571种已知组合信息来源于DCDB、TTD和文献报道数据。另有8,686种组合的预测结果,具有两个P值,P值1表示成为有效组合的概率,P值2表示对该组合产生不利影响的概率。该模块目前在维护中。
文献应用案例
该数据库自2014年发布以来,目前引用533次,其中不乏高分文献。
文献案例:PMID: 33963245,IF=3.996分
本文拟探讨穿心莲抗炎治疗的潜在分子机制。作者基于TCMSP和ECTCM数据库获得穿心莲23种生物活性化合物,以口服生物利用度(OB)≥30%和药物相似性(DL)≥0.18为筛选标准获得13中化合物,展示在Table1。而后,从TCMSP和BATMAN-TCM数据库获得与上述13中生物活性化合物相关的283个靶基因,并基于此使用Cytoscape3.7.2构建PPI网络。之后,从OMIM数据库共获得742个炎症相关基因,与上述283个穿心莲潜在靶基因取交集,并基于String数据库PPI网络分析获得5个Hub基因,包括IL-6、TNF-α、MMP-9、PTGS2和VEGFA。GO/KEGG富集分析表明,上述基因与肿瘤(胰腺癌)、免疫学(T细胞受体信号通路、B细胞受体信号通路、Toll样受体信号通路和NF-κB信号通路)和炎症过程(TNF信号通路和TRP炎性介质调节)相关。此外,分子对接表明大多数穿心莲生物活性成分对预测的Hub基因表现出很强的结合能力。而后细胞实验证实,川新莲提取物抑制炎性介质的产生,质谱、PCR和Western检测结果与预测Hub基因结果类似。
Table1复现如下:进入TCMSP数据库主页,下拉菜单选择Herb name,检索框输入穿心莲或汉语拼音,点击Search,结果中点击拉丁文名称Isatidis Radix进入详情页面。
Ingredients部分展示穿心莲化合物成分信息,设置口服生物利用度(OB)≥30%和药物相似性(DL)≥0.18,结果获得24种化合物成分。
分别摘录Molecular name、OB (%)、DL和Degree of node in network,点击化合物名称下载Structure,整理即可得到本文Table1。
更多文献案例可以参考:PMID 34040346、33995004和33986915,小伙伴么可以自行安排学习和复现哈~!
以上就是TCMSP数据库的全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下参考文献!
Ru J, Li P, Wang J, et al. TCMSP: a database of systems pharmacology for drug discovery from herbal medicines. J Cheminform. 2014;6:13. Published 2014 Apr 16. doi:10.1186/1758-2946-6-13
 往期传送门 
小白实战课堂开课啦!手把手教你转录因子与靶基因预测操作~!
END

撰文丨弘   毅
排版丨四金兄
主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文