关注风云之声
提升思维层次
导读
中国科大团队的工作在蛋白质设计这一前沿科技领域实现了关键核心技术的原始创新,为工业酶、生物材料、生物医药蛋白等功能蛋白的设计奠定了坚实的基础。
视频链接:
西瓜视频:
https://www.ixigua.com/7078491028478820902
本视频发布于2022年3月25日,播放量已达6万
精彩呈现:
2022年2月10日,中国科学技术大学在国际顶级期刊《Nature》连中三元,分别在超导体(https://www.nature.com/articles/s41586-022-04493-8)、量子模拟(https://www.nature.com/articles/s41586-021-04297-2)和蛋白质设计(https://www.nature.com/articles/s41586-021-04383-5)方面取得重要进展。真是麻烦啊,我介绍重要成果的速度都要赶不上成果增加的速度了!当然,这是一种甜蜜的烦恼。
在这三篇论文中,我觉得最优先需要向公众介绍的是蛋白质设计的这篇,因为它属于“关键核心技术的原始创新”。此文的作者是科大生命科学与医学部刘海燕教授和陈泉副教授等人,标题是《用于蛋白质设计的以骨架为中心的神经网络能量函数》(A backbone-centred energy function of neural networks for protein design)。听这个标题是不是莫名其妙?科大主页上的新闻标题就容易理解多了:《中国科大建立新的蛋白质从头设计方法》(http://news.ustc.edu.cn/info/1055/78363.htm)
上过高中的人,都知道蛋白质是生命的基础,蛋白质是由氨基酸组成的,蛋白质中的氨基酸总共有20种。给定一个氨基酸序列,如何确定它的空间结构,然后如何确定它的功能?这是正向的问题,即蛋白质结构预测。也可以反过来问:我们希望实现某种功能,希望得到某种空间结构,请问什么样的氨基酸序列会产生这样的结构?这是逆向的问题,即蛋白质设计。
对实用来说,显然蛋白质设计比结构预测更加有用,同时也更加困难。比如说一个蛋白质有100个氨基酸,每一个位置有20种可能,总的序列数就是20的100次方,这是个天文数字。你怎么知道这20的100次方个氨基酸序列中,哪一个能实现某种功能?挨个穷举等到太阳爆炸都穷举不完,必须寻找快速的算法。
我的朋友、二氧化碳合成淀粉的第一作者、中国科学院天津工业生物技术研究所副研究员蔡韬博士,就对蛋白质设计充满期待。因为他们的工作依赖于寻找合适的酶催化剂,酶就是蛋白质。如果能快速设计出能催化某种反应的酶,他们就可以进一步提高二氧化碳合成淀粉的效率,或者创造更多的奇迹。
蔡韬跟我说过,希望量子计算机能帮他们实现这个目标。我告诉他,量子计算机还远没有实用呢。现在好消息来了,在量子计算机实用之前,刘海燕等人的方法就有望把蛋白质设计推进一大步!
下面我向大家来解读一下这篇论文(https://www.nature.com/articles/s41586-021-04383-5)。蛋白质骨架指的是由肽键即-CO-NH-连接的主链,即不包含残基的那部分。不同的氨基酸只会带来不同的残基即侧链,而不会影响主链的化学组成。但是不同的氨基酸序列确实会影响主链的空间结构,例如有些倾向于α-螺旋,有些倾向于β-折叠。如果一个骨架结构不能由任何氨基酸序列得到,那么显然我们没法设计出这样的蛋白质。而如果一个骨架结构可以由很多种氨基酸序列得到,我们就把它称为可设计的。显然,天然蛋白质都是可设计的。但反之则不然,可设计的蛋白质不一定是天然的。
世界上为什么会存在可设计的骨架结构?可以想到,这是因为决定它的相互作用是与侧链无关的或者对侧链不敏感的。这就提示我们,可以构造出这样的能量函数,它完全由骨架结构决定,而与侧链无关。具体的实现方法,是神经网络。现在大家明白,《用于蛋白质设计的以骨架为中心的神经网络能量函数》这个标题是啥意思了吧?
刘海燕等人提出的能量函数叫做SCUBA,它是Side Chain-Unknown Backbone Arrangement的缩写,即“侧链未知的骨架安排”。他们还提出过一个模型叫ABACUS,这个词是“算盘”的意思,但在这里是A Backbone Based Amino Acid Usage Survey的缩写,即“一种基于骨架的氨基酸使用调查”。
SCUBA是在不限骨架的情况下,找出哪些骨架可设计。ABACUS是在给定骨架的情况下,找出哪些氨基酸序列对应这个骨架。两者结合起来,就构成了一条全新的蛋白质从头设计路线。
这条路线有什么好处?跟传统的做法对比一下就知道了。传统的做法叫做RosettaDesign,它是由美国北卡罗来纳大学教堂山分校的科学家设计的一种方法。回顾一下,天然蛋白质都是可设计的,但反之则不然。他们的思路就是尽量利用天然蛋白质的信息,把天然蛋白质结构作为模板拼接起来。这样相当于只在浅水区游泳,安全是能保证了,但有大量的地方到不了。
刘海燕等人到达了深水区。他们从头设计了9种蛋白质,测量了它们的高分辨晶体结构,确认它们的实际结构与设计模型一致。最妙的是,其中5种蛋白质具有天然蛋白质中尚未观察到的新型拓扑结构。如果你用传统方法,你永远都不会找到这些结构的!
所以《Nature》的审稿人评论:“与现有方法不同,现有方法要么使用参数方程来描述预定义螺旋结构的空间,要么基于片段组装的方法依赖于已知蛋白质片段。SCUBA方法原则上允许人们探索任意主链结构,然后填充序列,允许人们设计比自然界中观察到的更广泛的蛋白质几何结构。”新闻报道:中国科大团队的工作在蛋白质设计这一前沿科技领域实现了关键核心技术的原始创新,为工业酶、生物材料、生物医药蛋白等功能蛋白的设计奠定了坚实的基础。大家体会到这些词的分量了吧!
最后我想说,20多年前我读博士的时候就见过刘海燕老师,当时他的头发已经花白了。在最新的团队照片中,他的头发已经全白了。其实刘老师出生于1969年,今年才53岁而已。从这一头白发,就能看出他是个多么用功的人。
我读博士的时候也见过他们团队的开创者施蕴渝院士,她是我国物理学前辈施士元先生的女儿。施士元是居里夫人为中国培养的唯一的物理学博士,也是“中国的居里夫人”吴健雄的老师。他们三四十年代时的条件非常艰苦,施蕴渝老师开辟科大的计算结构生物学方向时条件也很有限。几代人的艰苦奋斗才能结出硕果:宝剑锋从磨砺出,梅花香自苦寒来。
扩展阅读:
作者简介本文袁岚峰,中国科学技术大学化学博士,中国科学技术大学合肥微尺度物质科学国家研究中心副研究员,中国科学技术大学科技传播系副主任,中国科学院科学传播研究中心副主任,科技与战略风云学会会长,“科技袁人”节目主讲人,安徽省科学技术协会常务委员,中国青少年新媒体协会常务理事,中国科普作家协会理事,入选“典赞·2018科普中国”十大科学传播人物,微博@中科大胡不归,知乎@袁岚峰(https://www.zhihu.com/people/yuan-lan-feng-8)。
责任编辑杨娜
继续阅读
阅读原文