来源:生物世界
作者:王聪
刚刚,蛋白质设计先驱 David Baker首次使用生成式人工智能(generative artificial intelligence)从头设计出了全新的抗体,这是一个里程碑时刻,标志着AI从头设计蛋白开始进入千亿美元的抗体药市场
抗体(Antibody)是蛋白质疗法的主要类型,目前全球已有超过160种抗体药获批上市,预计在未来五年内市场价值将达到4450亿美元。尽管制药行业对此非常感兴趣,但治疗性抗体的开发仍然依赖于动物免疫或筛选抗体库来识别与目标靶点结合的候选分子。这些方法耗时耗力,并且可能无法产生与治疗相关表位相互作用的抗体。
近年来,人工智能(AI)在预测蛋白质结构,以及从头设计全新蛋白等领域取得了许多突破性进展。然而,使用AI从头设计结构精确的抗体仍然难以实现。
这项研究代表了将AI蛋白质设计工具应用于制造全新抗体的重要一步。研究团队表示,AI能够简化当前昂贵且耗时耗力的抗体药开发工作,让抗体设计的能力民主化。十年后,AI将成为我们设计抗体的方式。
扩散模型(diffusion model)是一种生成式模拟方法,已经在图像和文本生成建模方面取得了相当大的成功,近年来爆火的AI绘画,就是基于扩散模型。而且,扩散模型似乎也适用于蛋白质设计。然而,扩散模型在应用于蛋白质建模时成功率却并不高,产生的序列基本不能折叠成目标结构,这可能是由于蛋白质主干几何形状和序列结构关系的复杂性。
2023年7月11日,David Baker 团队在 Nature 期刊发表了一篇题为:De novo design of protein structure and function with RFdiffusion 的重磅研究论文【2】
他们开发并描述了一种用于从头设计全新蛋白质的深度学习方法——RFdiffusion,该方法能生成各种功能性蛋白质,包括在天然蛋白质中从未见过的拓扑结构。 
RFdiffusion是对当前的蛋白质设计方法的一次综合改进,能从头设计总长度达600个氨基酸残基的蛋白,且实现了前所未有的复杂性和准确度。更重要的是,RFdiffusion可以设计出与目标蛋白结合的蛋白。但这种结合几乎完全依赖于规则二级结构(螺旋或链)与目标蛋白表位的相互作用,所以这些结合蛋白并不能算作抗体,RFdiffusion也无法从头设计抗体
为了克服这一点,David Baker团队对RFdiffusion模型进行了进一步修改。他们使用数千个经过实验确定的抗体结合到目标抗原蛋白的结构以及其他的抗体样分子的相互作用对RFdiffusion模型进行训练,在此基础上进行微调
使用调整后的RFdiffusion模型,研究团队设计了数千个抗体,这些抗体可以识别多种细菌和病毒的抗原蛋白的特定区域并与之结合,包括呼吸道合胞病毒(RSV)的F蛋白site III、流感病毒的血凝素、新冠病毒的S蛋白RBD、艰难梭菌的TcdB,以及几种癌症治疗药物的靶蛋白(例如Her2、PD-L1、IL7Ra)。然后,他们在实验室中合成了其中一些设计的抗体,并进一步测试了这些抗体是否可以与靶蛋白正确结合。
试验结果显示,大约1%的从头设计的抗体可与目标蛋白成功结合并发挥作用,研究团队使用冷冻电镜技术进一步确定了其中一种流感病毒抗体的结构,其设计达到了原子级精度,并发现它识别了靶蛋白的预期部分。
目前,已有少数几家公司(例如Generate:Biomedicines开始使用生成式人工智能来帮助开发抗体药物。David Baker希望RFdiffusion模型可以帮助解决具有挑战性的药物靶点,例如目前最主要的药物靶点类别——G蛋白偶联受体(GPCR)。但需要指出的是,目前用RFdiffusion模型从头设计的抗体距离进入临床还有很长的路要走,这些设计的抗体与其靶蛋白的结合不是特别强。
任何用于治疗的抗体都需要对其序列进行修改,以使其类似于天然的人类抗体,以免引发免疫反应。该研究所设计的抗体是所谓的“纳米抗体”,类似于在羊驼和鲨鱼中发现的抗体,而不是当前绝大多数获批上市的抗体。纳米抗体天然缺失轻链,只包含一个重链可变区(VHH)和两个常规的CH2与CH3区,结构更简单,因此也更容易设计和研究。
最后,研究团队表示,这是一项原理证明工作,该工作的初步成功为从头设计抗体药物铺平了道路,这像是一个里程碑时刻,证实了使用生成式人工智能从头设计全新抗体是可行的,有望开启基于结构的人工智能抗体设计新时代。
论文链接
1. https://www.biorxiv.org/content/10.1101/2024.03.14.585103v1
2. https://www.nature.com/articles/s41586-023-06415-8
继续阅读
阅读原文