PubChem:药物信息综合数据库
嗨,小伙伴们大家好!引药生变的话题到目前已连续更新两个月,这周给大家带来这个系列最后一趴,属于NCBI旗下的一款权威药物信息综合数据库PubChem,提供化学信息学、化学生物学和药物化学等研究关键信息,一起来康康吧~!
 引药生变系列传送门 
数据库概览
进入PubChem主页(https://pubchem.ncbi.nlm.nih.gov/),该数据库属于NCBI旗下,目前更新至2021年,收录11100万种化合物结构信息存储于PubChem Compound子数据库,27100万种用户上传的化合物数据存储于PubChem Substance子数据库,29800万种实验结果或文献支持的化合物生物活性数据存储于PubChem BioAssay子数据库,还有3200万篇相关文献和250万相关专利,以及90426个靶基因、96561个靶蛋白和23915条通路信息,上述数据来源总计799个。PubChem数据库包含大量化合结构信息、理化性质及生物活性、毒性和安全性数据,并提供详实的文献或专利支持,广为生物医药与生物化学交叉领域的科研人员所青睐。
点击主页菜单栏About,该页面展示数据库详细介绍。值得注意的是,该数据更新之后不再提供PubChem Entrez检索功能,取而代之的是一个统一的检索界面,如果对新界面不熟悉仍可以旧版本界面来访问,或者在主页检索框下方勾选use Entrez,不过目前在旧版本的Entrez检索结果不支持后来添加到PubChem的内容,例如专利信息。
另外需要关注的是,该页面What’s in PubChem部分有各种数据类型的详细介绍,各个数据类型访问链接如表所示。
点击主页菜单栏Blog,该界面展示PubChem数据库近期的数据更新信息,在右侧栏RECENT POSTS预览。
数据库核心功能及操作演示
PubChem数据库数据检索功能有三种方式:关键词检索、结构式检索和批量检索。
 1 
关键词检索
在主页检索框输入关键词进行快速检索,检索词支持输入化合物名称、化学式、CAS ID号、SMELE和InchI表达式,或基因名,并提供Covid-19专题检索功能。
以阿司匹林aspirin为例,检索结果有121条化合物结构信息,包括阿司匹林单体和混合药物,有25条通路数据,1998条药物活性数据,近7万文献或专利。
点击Compounds目录下第一条查看详情。首先映入眼帘的是aspirin信息概览,包括PubChem CID、化合物结构、化学安全分类、分子式、同义词、分子量和数据更新时间,并提供aspirin药理功能注释和肝毒性信息,提供NCI Thesaurus、LiverTox和DrugBank数据库链接。右侧栏为该页面所展示的信息目录。
接下来介绍各部分详细信息:Structure部分展示aspirin的2D、3D和晶体结构,右上角可下载结构信息文件或保存图片,可在数据库检索结构类似的化合物。
Names and Identifiers部分展示aspirin的各种表达式、别名和标识符。IUPAC Name为2-乙酰氧基苯甲酸(2-acetyloxybenzoic acid),InChI=1S/C9H8O4/c1-6(10)13-8-5-3-2-4-7(8)9(11)12/h2-5H,1H3,(H,11,12),SMILES:CC(=O)OC1=CC=CC=C1C(=O)O,并提供CAS、EC、ICSC和UNII等数据库ID,以及各种同义词。
Chemical and Physical Properties部分展示aspirin理化性质,比如溶解度。
Spectral Information部分展示aspirin的光谱信息,包括核磁共振谱、质谱、红外紫外光谱和拉曼表面光谱等。
Related Records部分,可查看aspirin相关研究进展,
Chemical Vendors提供aspirin供应商信息。
Drug and Medication Information部分展示aspirin的临床信息,包括适应症、WHO指南信息、药物成分、临床试验和某些药物特性及使用注意事项等信息。
Pharmacology and Biochemistry部分展示aspirin的药理学性质,ADEM药代动力学和药物作用机制。
Toxicity部分展示aspirin的毒理学特征,包括肝毒性、致癌性、中毒症状及急救措施。
Associated Disorders and Diseases部分展示来自CTD数据库的aspirin相关疾病信息。
Literature部分展示aspirin的相关文献。
接下来比较重要的一部分:Biomolecular Interactions and Pathways,展示aspirin的靶基因、靶蛋白及结构、通路、药物相互作用和药物食物相互作用等信息。
再然后,Biological Test Results部分展示药物活性信息。
另外,在上一级检索结果页面,点击Similar Structures Search可以检索与aspirin结构类似的化合物,结果中点击Setting可设置相似度对结果进行筛选。
 2 
以结构式进行检索
点击Draw Structure进入检索界面,以检索阿司匹林为例,绘制结构图,可以点击下方Help查看绘图指南。检索结果包括同一性、相似性、子结构和上层结构,进入各化合物详情页面,内容基本与前文类似。
 3 
批量检索
点击UPLOAD ID LIST进入检索界面,下载示例数据,选择数据类型,上传示例数据文件,点击Search Pubchem With This List,得到检索结果,右侧可批量下载。
新版PubChem功能展示
1. Periodic Table,点击进入元素周期表,可整体上浏览各元素信息,点击任意元素查看详情,内容基本与前文类似。
2. Knowledge panels,为了方便快速找到化合物、基因和疾病之间的交互关系,引入Knowledge panels知识面板,分为Chemical–chemical co-occurrences、Chemical–gene co-occurrences和Chemical–disease co-occurrences三个子板块,可直接点击下面网址访问。
3. PubChem Pathway,提供与某通路相关的化合物、蛋白质、基因和疾病交互信息,替代了不再更新的NCBI BioSystems数据库功能。

PubChem数据库功能强大,应用范围极为广泛,在此提供两篇案例文献供大家学习:PMID 33918209 IF=4.410;PMID 33927214 IF=4.371。

以上就是PubChem数据库的全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下参考文献!
写在结尾
Kim S, Chen J, Cheng T, et al. PubChem in 2021: new data content and improved web interfaces. Nucleic Acids Res. 2021;49(D1):D1388–D1395. doi:10.1093/nar/gkaa971
 往期传送门 
小白实战课堂开课啦!手把手教你转录因子与靶基因预测操作~!
END

撰文丨弘   毅
排版丨四金兄
主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文