AI接近成为神?谷歌AlphaFold 3直接预测生命过程
邮箱|[email protected]
当人们还在呼唤GPT-5、辗转于各种聊天机器人争夺战时,Google已经把人工智能模型与现实世界的距离又拉近了一大步。
Google DeepMind负责人Demis Hassabis 隆重官宣了这项革命性成果:
Google Deepmind与Isomorphic Labs共同推出新一代AI模型AlphaFold 3,将技术扩展到蛋白质折叠之外,能以前所未有的精度准确预测蛋白质、DNA、RNA、配体等生命分子的结构及相互作用。
团队发表在《自然》杂志的论文称,与现有方法相比,AlphaFold 3预测蛋白质与其他分子的作用至少改进50%,预测一些重要的相互作用类别准确性甚至翻倍。
我们知道,每个动植物和人体细胞内都存在着数十亿台由蛋白质、DNA等构成的“分子机器”,但任何一种分子都无法单独工作。也就是说,AlphaFold 3通过观察它们如何相互作用、组合成数百万种不同类型,能帮助我们真正理解万物的生命过程!
除此以外,Google DeepMind 还基于AlphaFold 3推出了一个易于使用的免费平台——AlphaFold Server,供全世界的科学家利用它进行非商业性研究。
不仅是精确预测结构,在这里,研究人员还能借助AlphaFold 3的强大功能对包含蛋白质、DNA、RNA以及一些配体、离子和化学修饰的结构进行建模,提出大胆的问题,加速工作进程。
这意味着什么呢?
以往通过实验来预测蛋白质结构大概需要四五年时间,且耗资数十万美元。而现在科学家们只需点击几下,就能轻松看到细胞系统的全部复杂性,包括结构、相互作用和修饰。进而了解这些连接如何影响生物功能——比如药物作用、激素产生和维持健康的 DNA 修复过程等。加速药物设计和基因组研究,开启人工智能细胞生物学的新时代,真正地造福人类。
同时,这种惊人的能力也让不少人感慨,AI正在接近成为可以预测和理解生命的“神”?
背后是Evoformer模块和Diffusion技术
根据DeepMind团队介绍,只要给定一系列分子的输入,AlphaFold 3就可以生成它们的联合3D结构,并揭示它们如何相互契合。它不光能模拟如蛋白质、DNA和RNA等大型生物分子,还能模拟包括许多药物类化合物在内的小分子配体。
例如下面的7R6R - DNA结合蛋白:由AlphaFold 3模拟的蛋白质(蓝色)与DNA双螺旋(粉色)结合,跟通过复杂实验发现的真实分子结构(灰色)几乎完美匹配。
不仅如此,AlphaFold 3还能模拟这些分子上的化学修饰。这些修饰控制着细胞的正常功能,一旦受到干扰就可能导致疾病。也就是说,通过模拟分子的化学变化,AlphaFold 3可以预测疾病的发生。
AlphaFold 3的这些能力来源于其新一代架构和涵盖生命体内所有分子的训练。模型核心是改进版的Evoformer模块——一种AlphaFold 2采用的深度学习架构。
在处理输入后,AlphaFold 3使用类似于AI图像生成器的扩散网络生成预测结果。整个过程从一团模糊的原子云开始,经过多个步骤,逐渐去噪,最终形成具体的分子结构。在预测类药分子相互作用方面,AlphaFold 3达到了前所未有的精确度,是真正以全局方式计算整个分子复合物的单一模型。
AlphaFold 3引领药物发现
当这个革命性成果引入物理世界,为药物创新设计带来的贡献将不可估量。
在PoseBusters基准测试中,AlphaFold 3无需任何结构信息输入,就以高于最优传统方法50%的准确率成为首个在生物分子结构预测方面超越物理学工具的人工智能系统。它在预测蛋白质与配体以及抗体与其靶标蛋白结合上的能力,对于理解人体各类免疫反应和研发新的抗体疗法至关重要。
下图中,AlphaFold 3准确预测了感冒病毒OC43的尖峰蛋白与抗体和糖分子的相互作用,有助于我们深入理解冠状病毒,提升对COVID-19等疾病的治疗效果。
据悉,为了发挥AlphaFold 3在药物设计方面的潜力,Isomorphic Labs已经开始与制药公司合作。结合自主开发的一套辅助AI模型,尝试攻克未解决的新靶点,以期最终开发出能改变患者生活的新疗法。
AlphaFold的前世今生
此次的新模型AlphaFold 3是建立于Google在2020年发布的上一代AlphaFold 2基础之上。后者的最大创新点在于实现了通过端到端的方式,直接从蛋白质序列学习其三维结构,避免了传统方法中的信息丢失问题。
到目前为止,全球已经有数百万研究人员借助AlphaFold 2在包括疟疾疫苗、癌症治疗和酶设计等许多领域取得巨大进展。AlphaFold被引用超过2万次,Demis Hassabis和共同开发者John Jumpe也于2023年获得有“科学界奥斯卡”之称的生命科学突破奖和“诺奖风向标”拉斯克奖,以表彰他们为基础医学研究做出的突出贡献。
但是,AlphaFold 2仍存在一些不足,比如算法的系统偏差和对动态结构变化预测能力有限等。而今天问世的AlphaFold 3比起上一代来,在预测范围、精度和应用领域上都有了飞跃式提升:
与此前局限于蛋白质结构不同,AlphaFold 3还能预测 DNA 和 RNA 等分子结构及其完整的相互作用,覆盖更多类型的生物分子,并且具备原子级精度,展现细节显著提升。
这实际是一个重大的技术突破,使得 AlphaFold 3 可以更好地理解疾病机制,解锁更多科学发现,从开发生物可再生材料到加速药物设计和基因组学研究,应用也更为广泛。
可以说,Alphafold 3的推出,给人们带来的振奋程度远甚于刷新大模型榜的benchmark。
英伟达高级研究经理Jim Fan把AlphaFold-3形容为“人工智能在生物学领域最大突破的最新迭代版本”,并激动地说:
“我们生活在这样一个时代,Llama和Sora等模型的学习成果可以为生命科学研究提供信息和加速发展。这种广泛的通用性简直令人难以置信。同一个transformer+diffusion架构不仅可以生成精美的像素,只要你将数据相应地转换为浮点数序列,它也可以想象出蛋白质分子。我们还没有达到单一的AGI模型,但我们已经成功构建了一系列通用的人工智能方法,可以跨领域转移训练数据和神经网络架构。理论上这是行不通的,但谢天谢地它奏效了!”
有人看到了AlphaFold-3模型除生物医药以外,在材料科学领域带来的应用前景。
有人强调这是第一个在精确度上超越基于物理模拟的模型,并且它免费获取,易于使用。“你有很多理由讨厌谷歌,但这绝对不是其中之一。如果让它开源,你将看到奇迹般的化学作用。”
还有评论说这是继ChatGPT发布后最令人兴奋的新闻,“这才是AI造福社会的正确打开方式”。
也是所谓真正意义上的——“有效加速”。
Google表示,AlphaFold 3和AlphaFold Server平台将赋能科学家们加快在生物学未解之谜和新研究路线上的发现。“我们才刚开始探索AlphaFold 3的潜力,对今后的发展无比期待。”
一直以来,人类的梦想簿上书写着许多伟大的愿望:攻克癌症、研发新疫苗、战胜罕见病....科学家们前仆后继,一代又一代地努力着。
而现在,人工智能真正化身利器,为人类与时间和疾病的竞速赛跑增添战斗值。对于无数患者而言,更少的时间与科研成本,也意味着更多人能更快速地获得创新药物,带来更多生的希望。
这也许就是AGI的终极奥义。
微信扫码关注该文公众号作者