首页 互联网 > 正文

人工智能在解决蛋白质结构方面取得胜利

人工智能(AI)解决了生物学中的一个重大挑战:预测蛋白质将如何从氨基酸的线性链卷曲成3D形状,从而使它们能够执行生命任务。今天,两年一度的蛋白质折叠大赛的主要结构生物学家和组织者公布了英国AI公司DeepMind研究人员的成果。他们表示,DeepMind方法将产生深远的影响,包括大大加快新药的开发。

欧洲生物信息研究所名誉主任珍妮特桑顿(Janet Thornton)表示,“DeepMind团队的成就令人瞩目,这将改变结构生物学和蛋白质研究的未来。”“这是一个50年前的问题,”马里兰大学Shady Grove的结构生物学家John Moult补充道,他是比赛的联合创始人,也是蛋白质结构预测(CASP)的关键评估。“我从没想过这辈子会看到这一幕。”

人体使用数千种不同的蛋白质,每种蛋白质包含几十到几百种氨基酸。这些氨基酸的序列决定了它们之间无数的推拉相互作用如何产生蛋白质复杂的3D形状,进而决定了它们的功能。了解这些形状将有助于研究人员设计能够留在蛋白质口袋和缝隙中的药物。合成具有所需结构的蛋白质可以加快酶的发展,酶可以生产生物燃料和降解废塑料。

几十年来,研究人员一直使用实验技术,如X射线晶体学或冷冻显微镜来破译蛋白质的三维结构。然而,这种方法可能需要几个月或几年,而且并不总是有效的。在生命形式中发现的2亿多种蛋白质中,只有大约17万种结构得到了分析。

20世纪60年代,研究人员意识到,如果他们可以计算蛋白质序列中所有的个体相互作用,他们就可以预测其三维形状。每种蛋白质都有数百个氨基酸,每对氨基酸可以以多种方式相互作用。然而,每个序列中可能的结构数量是天文数字。计算科学家开始着手解决这个问题,但进展缓慢。

1994年,莫尔特和他的同事发起了每两年举行一次的CASP。参赛者获得了大约100个蛋白质的氨基酸序列,它们的结构是未知的。一些小组计算每个序列的结构,而另一些则通过实验来确定。然后,组织者将计算的预测结果与实验室结果进行比较,并为预测结果提供全局距离测试(GDT)分数。Murt说,从零到100分,90分以上就相当于实验方法。

即使在1994年,小而简单的蛋白质的预测结构也能与实验结果相匹配。但是对于更大和更具挑战性的蛋白质,计算出的GDT分数约为20,这是“一场彻底的灾难”,马克斯普朗克发育生物学研究所的CASP法官和进化生物学家Andrei Lupas说。到2016年,竞赛组最难的蛋白质分数已经达到40左右,主要是通过从与CASP目标密切相关的已知蛋白质结构中获得的见解。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。