谷歌DeepMind祭出蛋白质设计新AI,有望攻克癌症!蛋白亲和力暴增300倍
共 4424字,需浏览 9分钟
·
2024-09-06 20:53
新智元报道
新智元报道
【新智元导读】今天,DeepMind又发布了Alpha模型家族的新成员,堪称是「专精版」的AlphaFold,专注于设计蛋白质结合剂,将大幅减少所需的实验室工作,提升开发效率。
DeepMind「阿尔法」家族,再迎新贵。
谷歌开发者负责人Logan昨日的一句话,勾起了全网好奇心。
「如果你认为AI进展正在放缓,那就说明,你并没有密切关注它」。谷歌究竟有着什么大事,等着我们?
刚好今天,谷歌DeepMind祭出了AI设计蛋白的新模型——AlphaProteo,再次在AI圈里掀起海啸级地震。
它可以为不同的目标蛋白,设计新的蛋白结合剂,能够为癌症、糖尿病并发症相关的VEGF-A。
这也是,AI工具首次能够为VEGF-A,设计出成功的蛋白结合剂。
在7种靶标蛋白测试中,AlphaProteo比现有的方法,实现了3-300倍的蛋白结合亲和力。
它还大幅提升了研究效率,将实验室数年工作,压缩至几天甚至是几周之内。
AlphaProteo的意义在于,可以预防病毒感染,设计抗癌,等各种治愈疾病的药物。
通过蛋白结合剂紧密附着在「病毒」、「癌细胞」上,阻止它们之间的信号传递,扰乱其功能,最终走向死亡。
网友们纷纷感慨道,AI+生物学又一次突破,对于挽救人类生命来说意义重大。真不知道,医疗保健在未来5-10年,会是什么样子?
在AI4Science上,谷歌DeepMind只会投入更多。
「阿尔法」家族的进阶
今年5月,DeepMind刚刚发布了AlphaFold 3,能够以前所未有的原子级精度,预测所有生物分子的结构和相互作用,登上Nature头版。
AF3的诞生,意味着将会开启更多变革性的科学研究,比如基因组学研究、加速药物设计、新材料开发、培育作物等等。
要知道,2020年发布的AlphaFold 2已经引起了科学界的轰动。
由于在蛋白质结构预测上取得了根本突破,全球目前有数百万研究人员使用AF2来研制疫苗、治疗癌症或设计蛋白酶。
而走出「蛋白质世界」,能够预测所有生物分子的AF3,预计会给各领域的科学发现带来更大的变革。
尽管AlphaFold系列模型已经取得了这些成就,团队领导人John Jumper还是经常被「催更」。
比如,有人希望扩展AlphaFold的预测功能,直接针对能改变蛋白质功能的修饰,让模型更好地辅助药物设计、疾病理解等领域。
虽然Jumper在采访中经常表示「很无奈、做不到」,但DeepMind显然看到了这一层需求。
最新发布的模型AlphaProteo,就是瞄准了这些领域的实际应用,旨在设计出能成功结合目标分子的蛋白质。
博客地址:https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/
学习蛋白质的相互结合
从细胞生长到免疫反应,人体的每一个生物过程都依赖于蛋白质的之间的相互作用。
蛋白质的结合具有一个重要性质——特异性,就像钥匙和锁。「锁齿」对不上,蛋白质就无法结合并发挥作用。
关于这类过程的原理和机制,AlphaFold等结构预测工具可以为我们提供很多见解,但还不能创造出新的蛋白质来直接操纵这些相互作用。
想创造出能结合目标分子的蛋白质,这项工作目前还只能交给科学家完成。
这类「蛋白质结合剂」可以加速许多领域研究的进展,包括药物开发、细胞和组织成像、疾病理解和诊断,甚至是提升作物抗虫性。
尽管机器学习方法在蛋白质设计方面取得了重大进展,但这一过程仍然繁琐且复杂,传统方法耗时费力。
不仅设计过程本身难度很大,需要多轮的广泛实验测试;结合剂被成功制造出来之后,还需要进行额外的实验来优化结合亲和力,以便能和目标蛋白结合得足够紧密、发挥作用。
而今天推出的AlphaProteo就是专门用于设计高强度蛋白质结合剂, 有助于药物发现、开发生物传感器等应用
实验发现,AlphaProteo适用于多种目标蛋白,比如与癌症和糖尿病并发症相关的VEGF-A,这是AI工具首次为VEGF-A成功设计出蛋白结合剂。
此外,在测试的其他7种目标蛋白上,相比之前的最佳方法,AlphaProteo的实验成功率更高,且蛋白质的结合亲和力有3~300倍的提升。
团队同时放出了一篇论文,详细介绍了湿实验的流程与验证结果。
论文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/Protein_Design_White_Paper_2024.pdf
AlphaProteo的训练数据包括Protein Data Bank(PDB)和AlphaFold生成的超过1亿个预测结构。
通过训练,AlphaProteo学习到了蛋白质分子相互结合的方式。给定目标分子的结构以及优先结合位点,模型就能生成在相应位点结合的候选蛋白质。
成功结合关键蛋白
验证结果