AI精准预测蛋白质结构,结构生物学何去何从? | 返朴
撰文 | 龚海鹏、龚新奇、李赛、王宏伟、颜宁、张鹏、张阳、周强
by Asier Sanz | https://asiersanz.com/
张阳
(ITASSER创造者,美国密歇根大学教授)
龚新奇
(中国人民大学数学科学研究院教授,清华大学北京结构生物学高精尖中心合作研究员)
- 不少结构的预测精确度跟实验晶体结构相当,可以替代晶体结构;
- 一些含有多个结构域的复杂超长的单链结构也达到了可以跟实验结构比较的程度;
- 帮助解析了竞赛中涉及到的、实验多年没拿到的X射线晶体和cryo-EM冷冻电镜结构,比如T1058的膜蛋白是用了Alphafold2的预测模型之后,才跟原有晶体学数据综合成功解析了结构。
- 工程化明显,依赖于强大的GPU计算资源和代码优化团队;
- 谷歌公司几乎可以收集全球所有网络信息,虽然看起来AlphaFold2的自动化程度很高,但他们在人工操作中使用了哪些信息值得关注;
- 预测对了结构,但不等于明白了蛋白质折叠过程和原理。
生物实验科学家也有不少看法:
- 算出结构只是生物学规律发现的第一步;
- 计算的多个models中,有时打分排序不准;
- 开放AlphaFold2的server之后,使用效果不一定那么好;
- 只是在已有蛋白质结构数据集上训练得到的模型,尚不能计算其它构象或其它类别的分子结构。
颜宁
(美国普林斯顿大学雪莉·蒂尔曼终身讲席教授,美国科学院外籍院士)
看到结构本身、知道你的研究对象长啥样,倒也可以称之为发现,但我刚刚说的“发现”,特指那些超乎想象的、通过结构才揭示出来的、自然界里神奇的存在或者令人叹为观止的机理。我讲课最喜欢举的例子之一就是施一公组的剪接体结构。为啥呢?因为它集合了结构生物学发现里几乎所有的精彩要素和挑战。
第一,在剪接体结构出来之前,有很多剪接体的组分甚至是未知的。不同于传统的结构生物学,先知道你要研究对象是啥,再吭哧吭哧地去把它们的结构解出来——剪接体的电镜分析是看到了密度图之后,完全不晓得这是啥,需要通过质谱等手段去鉴定组分。我从2015年就预测:电镜与质谱组合,将会变成一个重要的生物学研究发现手段。在电镜时代,这样的例子越来越多。比如清华大学隋森芳老师组的那个巨大的藻胆体结构,靠质谱都不够了。为了搞明白组分,他们甚至先做了基因组测序。
第二,几十上百个蛋白如何众星捧月地把那么几条貌似简单的RNA掰成与几个小小的金属离子配合的核酶反应中心,在茫茫碱基中,在正确的时间正确的地点牵线搭桥,剪掉intron(内含子),连接exon(外显子)?就为了这一“剪子”一“钩针”,为了几毫秒的过程,这么个庞然大物的几十上百个组成部件却要分分合合,这个过程是真神奇。
也许是受到我自身专业领域的局限,AlphaFold迄今带给我的震撼还赶不上冷冻电镜的革命,后者将我们从技术挣扎中解放出来,可以专注于结构带来的生物学发现本身。
AlphaFold目前最成功的预测是针对单链分子,当然将来预测复合物的高精结构也应该不在话下。相比于对蛋白折叠的贡献,我倒是更希望AI能够助力Molecular Dynamics Simulation(分子动力学模拟)
。对结构生物学而言,这个领域才是亟需进步的。
我个人认为生命是地球上最神奇的存在,那么多未知要探索,任何一次技术进步都是契机。该考虑的是如何把新技术为我所用,去问出、去探索更有意思的问题。
最后,当AI能够成功预测我们正在孜孜以求的生物大分子动态、原位高分辨率结构的时候,那失业的一定不止是结构生物学家、或者生物学家了。
但是,现实中的冲击不会那么大。这是因为,AlphaFold2模型的创新性非常高,其中结合的2D transformer和3D equivariant transformer都是AI领域的前沿技术,模型的训练难度很大。DeepMind的训练方法在学术界很难复现,估计学术界要花几年的时间才能跟上,因此短期内AlphaFold2对结构生物学的影响会比较有限。DeepMind可能会和个别实验室合作,预测蛋白质结构。
AlphaFold为结构生物学家提供了除晶体学、冷冻电镜、NMR以外的另外一种手段,用于揭示生物大分子发挥作用的分子机制。
——王宏伟(cryo-EM专家,清华大学结构生物学高精尖创新中心执行主任,清华大学生命科学学院院长)
——周强(cryo-EM专家,西湖大学生命科学学院特聘研究员)
蛋白质体系越大,结构的解析越难仅依赖计算方法。Cryo-ET (冷冻电镜断层成像) 技术擅长解析体外难表达的大分子机器结构、细胞中的原位蛋白结构等复杂体系,因此很难被脱离实验手段的方法取代。目前,由于体系过于复杂,使用分子动力学模拟整颗病毒尚未实现,要模拟细菌、细胞、组织,还要很长的路要走。
——李赛(Cryo-ET专家,清华大学结构生物学高精尖创新中心研究员)
背景简介:本文2020年12月3日年发表于微信公众号 返朴 (颜宁等点评:AI精准预测蛋白质结构,结构生物学何去何从?),风云之声获授权转载。 责任编辑:祝阳
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。