谷歌DeepMind祭出蛋白质设计新AI，有望攻克癌症！蛋白亲和力暴增300倍-技术圈

新智元报道

编辑：编辑部

【新智元导读】今天，DeepMind又发布了Alpha模型家族的新成员，堪称是「专精版」的AlphaFold，专注于设计蛋白质结合剂，将大幅减少所需的实验室工作，提升开发效率。

DeepMind「阿尔法」家族，再迎新贵。

谷歌开发者负责人Logan昨日的一句话，勾起了全网好奇心。

「如果你认为AI进展正在放缓，那就说明，你并没有密切关注它」。谷歌究竟有着什么大事，等着我们？

刚好今天，谷歌DeepMind祭出了AI设计蛋白的新模型——AlphaProteo，再次在AI圈里掀起海啸级地震。

它可以为不同的目标蛋白，设计新的蛋白结合剂，能够为癌症、糖尿病并发症相关的VEGF-A。

这也是，AI工具首次能够为VEGF-A，设计出成功的蛋白结合剂。

在7种靶标蛋白测试中，AlphaProteo比现有的方法，实现了3-300倍的蛋白结合亲和力。

它还大幅提升了研究效率，将实验室数年工作，压缩至几天甚至是几周之内。

AlphaProteo的意义在于，可以预防病毒感染，设计抗癌，等各种治愈疾病的药物。

通过蛋白结合剂紧密附着在「病毒」、「癌细胞」上，阻止它们之间的信号传递，扰乱其功能，最终走向死亡。

网友们纷纷感慨道，AI+生物学又一次突破，对于挽救人类生命来说意义重大。真不知道，医疗保健在未来5-10年，会是什么样子？

在AI4Science上，谷歌DeepMind只会投入更多。

「阿尔法」家族的进阶

今年5月，DeepMind刚刚发布了AlphaFold 3，能够以前所未有的原子级精度，预测所有生物分子的结构和相互作用，登上Nature头版。

AF3的诞生，意味着将会开启更多变革性的科学研究，比如基因组学研究、加速药物设计、新材料开发、培育作物等等。

要知道，2020年发布的AlphaFold 2已经引起了科学界的轰动。

由于在蛋白质结构预测上取得了根本突破，全球目前有数百万研究人员使用AF2来研制疫苗、治疗癌症或设计蛋白酶。

而走出「蛋白质世界」，能够预测所有生物分子的AF3，预计会给各领域的科学发现带来更大的变革。

尽管AlphaFold系列模型已经取得了这些成就，团队领导人John Jumper还是经常被「催更」。

比如，有人希望扩展AlphaFold的预测功能，直接针对能改变蛋白质功能的修饰，让模型更好地辅助药物设计、疾病理解等领域。

虽然Jumper在采访中经常表示「很无奈、做不到」，但DeepMind显然看到了这一层需求。

最新发布的模型AlphaProteo，就是瞄准了这些领域的实际应用，旨在设计出能成功结合目标分子的蛋白质。

博客地址：https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/

学习蛋白质的相互结合

从细胞生长到免疫反应，人体的每一个生物过程都依赖于蛋白质的之间的相互作用。

蛋白质的结合具有一个重要性质——特异性，就像钥匙和锁。「锁齿」对不上，蛋白质就无法结合并发挥作用。

关于这类过程的原理和机制，AlphaFold等结构预测工具可以为我们提供很多见解，但还不能创造出新的蛋白质来直接操纵这些相互作用。

想创造出能结合目标分子的蛋白质，这项工作目前还只能交给科学家完成。

这类「蛋白质结合剂」可以加速许多领域研究的进展，包括药物开发、细胞和组织成像、疾病理解和诊断，甚至是提升作物抗虫性。

尽管机器学习方法在蛋白质设计方面取得了重大进展，但这一过程仍然繁琐且复杂，传统方法耗时费力。

不仅设计过程本身难度很大，需要多轮的广泛实验测试；结合剂被成功制造出来之后，还需要进行额外的实验来优化结合亲和力，以便能和目标蛋白结合得足够紧密、发挥作用。

而今天推出的AlphaProteo就是专门用于设计高强度蛋白质结合剂，有助于药物发现、开发生物传感器等应用

实验发现，AlphaProteo适用于多种目标蛋白，比如与癌症和糖尿病并发症相关的VEGF-A，这是AI工具首次为VEGF-A成功设计出蛋白结合剂。

此外，在测试的其他7种目标蛋白上，相比之前的最佳方法，AlphaProteo的实验成功率更高，且蛋白质的结合亲和力有3～300倍的提升。

团队同时放出了一篇论文，详细介绍了湿实验的流程与验证结果。

论文地址：https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/Protein_Design_White_Paper_2024.pdf

AlphaProteo的训练数据包括Protein Data Bank（PDB）和AlphaFold生成的超过1亿个预测结构。

通过训练，AlphaProteo学习到了蛋白质分子相互结合的方式。给定目标分子的结构以及优先结合位点，模型就能生成在相应位点结合的候选蛋白质。

预测的蛋白结合剂与目标蛋白质相互作用的示意图，蓝色部分为AlphaProteo生成的蛋白结合剂结构，黄色部分为目标蛋白质，即SARS-CoV-2刺突受体结合域

但遗憾的是，博客和文章都没有提到AlphaProteo的模型架构或具体训练方法，目前也没有放出代码或模型权重。

成功结合关键蛋白

为了测试AlphaProteo，团队在7种目标蛋白质上进行了测试，包括：

- 2种与感染有关的病毒蛋白：BHRF1和SARS-CoV-2刺突蛋白受体结合域SC2RBD

- 5种与癌症、炎症和自身免疫性疾病有关的蛋白质：IL-7Rɑ、PD-L1、TrkA、IL-17A和VEGF-A

结果显示，AlphaProteo具有极高的结合成功率和同类最佳的结合强度。

它成功地在计算机模拟中生成了候选蛋白质，并在实验中实现了与目标蛋白质的紧密结合。

AlphaProteo为以上7种蛋白质生成了结合剂，蓝色是在湿实验室中测试的结合剂示例，黄色部分是目标蛋白质，深黄色部分突出显示了预期的结合区域

对于病毒蛋白BHRF1，候选分子成功结合的比例高达88%，比现有的最佳设计方法高出10倍。

候选蛋白的结合成功率提高，意味着需要更少的测试，就能找到成功的结合剂，可以大大缩短实验周期，降低研发成本。

AlphaProteo对7个目标蛋白质的输出结果在体外实验中的成功率

对于另一个目标蛋白TrkA，AlphaProteo设计出的结合剂甚至胜过了先前最佳的、经过多轮实验优化的结合剂。

在没有实验优化的情况下，AlphaProteo对7个目标蛋白质设计结果的最佳亲和力，较低的亲和力意味着与目标蛋白结合得更紧密

验证结果

除了自己开展的实验，DeepMind还邀请了英国王牌研究中心、欧洲最大的生物医学研究机构——弗朗西斯·克里克研究所（Francis Crick Institute）来进行验证。

在不同的实验中，团队更深入地研究了两种目标蛋白，SC2RBD和VEGF-A的结合剂。

结果显示，这些结合剂的结合相互作用确实与AlphaProteo的预测相似，并且具备有效的生物功能。

例如，SC2RBD的蛋白结合剂被证明可以阻止SARS-CoV-2及其部分变种对细胞的感染。

然而，由于AI的局限性，AlphaProteo对一种目标蛋白无能为例，即与类风湿性关节炎等自身免疫性疾病相关的TNFɑ。

但值得注意的是，计算分析显示针对TNFɑ设计结合剂极具挑战性，而这也是DeepMind用它来进行测试的原因。

通常来说，实现强结合只是设计蛋白质结合剂的第一步，在研究和开发过程中还有许多生物工程障碍需要克服。

而AlphaProteo可以大幅减少初步实验所需的时间，并适用于广泛的应用。

蛋白设计是一项快速发展的技术，在多个领域都具有很大的科学潜力，比如理解疾病的致病因素、在病毒爆发中加速诊断测试的开发、支持可持续的制造工艺，甚至清除环境污染物等方面。

DeepMind提出，未来不仅会与学界合作，利用AlphaProteo解决具有影响力的生物学问题并了解其局限性，而且还会和Isomorphic Labs合作，探索药物设计方面的应用。

同时，团队还将将继续提高AlphaProteo算法的成功率和亲和力，扩大其可以解决的设计问题范围，并与机器学习、结构生物学、生物化学和其他学科的研究人员合作，开发出负责任且更全面的蛋白设计方案。

参考资料：

https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/