离美归国因AI抢走饭碗?颜宁本人长文回应

数据森麟

共 4095字,需浏览 9分钟

 ·

2022-11-14 09:36

ce8c26376751cfa1739b16c28143bf4a.webp

刚决定离美归国不久的颜宁,再度发声。

事实上自她宣布“归去来兮”后,喧嚣与争议都没停过。

这其中最匪夷所思的,就是关于回来原因的讨论——工作被AI替代了,所以在美国混不下去了。

6c61d6bc3f38d224367fa292c83e674f.webp

于是在深圳“忙到现在”的颜宁,终于给出回应:

Alphafold仍停留在我们5年前水平,与AI团队合作迄今预测无一正确。

还罗列出了各种目前AI在结构生物学还无能为力的方面。

不少网友表示:不懂这行,但听到颜老师这么说,就放心了

550b78074acabbfe24748a183d3b93c4.webp

“Alphafold仍停留在我们5年前水平”

颜宁离美归国创办深圳医学科学院,是在11月1日官宣的,一时备受关注,圈内圈外不少人都表达了夸赞和期待。

但一些质疑声也随之而来。

个中话题,涉及其私人经历,人事变动,甚至论文引用规范……最为引人关注的,还是——这位科学家之所以回国,因其研究方向已被AI取代。

对此,颜宁的回应可以概括为三个方面。

其一,自己没被AI取代,还远着呢;其二,AlphaFold专注于折叠,但对结构生物学领域,有三大理解问题,AI无能为力;其三,作为科研工作者,当然乐于拥抱技术进步。

777ada6521da90e3aac05341ab81842b.webp

具体来说。

颜宁所专注的电压门控钠离子和钙离子通道有几个关键问题(electromechanical coupling, ion selection, MOA of drugs and toxins),AlphaFold在我们过去解析的诸多结构的基础上,于2021年预测结果达到了他们2017年的水平;

但一年过去,AlphaFold依旧停留在5年前(这里仅针对Nav/Cav)。

为证明这点,她还摆出自己2021年8月及今年11月的两次「AlphaFold局限性」主题报告PPT封面,称自己除日期外,内容一字也无需改。

d4147b7c61a80af95958e4e00610fb99.webp

此外,她还拿自己的亲身经历作为补充,本来已与专门做结构预测的AI团队合作,测试新型小分子与蛋白的相互作用。但迄今为止预测无一正确。

接着,科普博主颜宁从专业的角度探讨了AlphaFold与结构生物学之间的关系。

一言以蔽之,AlphaFold属于蛋白质预测模型,专注于折叠,但对结构生物学来说,在折叠之外,有三大理解问题,AI无能为力。

  • 理解蛋白质的动态变化

  • 理解与其他生物大分子或者调节小分子的相互作用

  • 理解在细胞原位里的状态。

目前上述领域缺乏足够数据对AI进行训练,因此模型无法对其提供正确预测。

一个典型的例子,就是去年他们团队发表了Cav2.2结构的成果。这是一种神经组织N型电压门控钙离子通道,与人体痛觉传导有关。解析其结构有助于了解通道调控机理,也为相关止痛药设计研发提供思路。

因为发表晚了一步,没有放到数据库给到AlphaFold训练。于是经由它预测出来的结构,就与实验结果严重不符。

f983e9d7e03745d5e9be0488fcb7df53.webp

最后,颜宁还谈了谈对AlphaFold这些新技术的态度。

她表示:

真正的研究者都乐于拥抱技术进步,善用各种技术去探寻、解答自己感兴趣的问题。事实上,我期待AI越来越强大,如果它真的可以强大到把我上述提的三个理解都实现,那我们真可以正儿八经从化学角度研究生命起源了。

AlphaFold以及AI究竟能否取代计算生物学?颜宁此次发声无疑是给下明确的回答。事实上,自Alphafold诞生之日起,这种争议就一直存在。

AlphaFold能做什么

蛋白质结构预测,这是大家对于AlphaFold第一印象。一年时间它能从成功预测人类92.5%蛋白质,到全球已知所有的蛋白质结构都能预测。

如此速度和精确度,不免让人担心它会替代一批生物学家,正如当年AlphaGo一样。首当其冲就是结构生物学家,其研究涉及生物大分子的三级结构(包括构架和形态),如何获得他们的结构以及结构如何影响功能。

于是网络上就有相关问题的讨论:像施一公颜宁、David Baker这些致力于该领域的科学家会不会深受打击,甚至因此失业?

b8b83ed3ed207151ca59f4135cbd3f03.webp

但事实是,蛋白质结构预测只是结构生物学的一个分支,也算不上一个新学科。在AlphaFold出现之前,就已经有科学家就已经尝试用算法通过序列来预测三维结构。

更严格意义上来讲,只是其中一种工具之一。

以往常用的实验手段包括,质谱法、X射线晶体学、冷冻电镜等,他们解析出来的分辨率高、错误率低。尤其是冷冻电镜的发明,直接让解析结果上升到了新高度。但碍于成本高昂,依赖设备,于是就有科学家另辟蹊径,来做结构预测。

据颜宁早前采访时表示,蛋白质结构预测与实验结构生物学融合度越来越高。在冷冻电镜时代,用软件预测结构模型,再根据实验数据调整,就已经是常规操作。

其实也就是当下热议的 干湿实验闭环 ——计算生物在科研领域的典型价值。

18d3904e79a580fa7fcbd6a1b3bd2bf2.webp

图源:量子位智库《计算生物产业报告》

颜宁曾这样定义结构生物学:它的主语是生物学,是理解生命、是做出生物学发现

结构只是开始,生物学功能、机理才是终点。而且光结构解析这一项,也需要多个手段联合协作。

最典型如施一公团队的RNA剪接体机理研究。他们曾在Science封面连发两篇背靠背文章。

团队首先通过冷冻电镜解析了酵母剪接体近原子分辨率的三维结构。接着就是在这个结构基础上进行质谱等手段去详细分析,最终揭示了剪接体对前体信使RNA执行剪接的基本工作机理。

放在当时在学界属于首次,为与剪接体相关疾病的发病机理奠定了基础。

如果将结构当做分析机理的手段,那么AlphaFold更是生物学发现的起点。

除了蛋白质结构,事实上在结构生物学领域还有更多的问题还没有解决,比如动力学问题,蛋白质折叠的中间态等,依然是现有实验手段无法揭示的。

网友:多喝凉茶不要上火

此番回应之下,一方面解释了关于「研究方向被AI取代」的质疑,另一方面也从中理解了此次颜宁回国的价值和意义。

有网友表示:

综上预测软件基于大数据的数学和概率 ,同样的电镜等设备上的软件也是基于测算物理的光的数据自动绘制出来的 。
回忆一下初中物理和大学数学的知识,分析一下二者不同和相同,你就能判断颜宁这件事是怎么回事以及她做的事情的意义。

6bc4b2a373af2528f451705959b13ce5.webp

而对于这一波直率而幽默的回应,网友表示:这脾气爱了爱了。

ae203a68e5a321392d5c442707cd3c49.webp

既讲明白了问题,还暗戳戳针对了一些人。

8a5fc4e1604983b1ee160297af2cf86c.webp

当然,还有网友建议:既然到了广东,多喝凉茶,不要上火

嗯,确实很贴心了。

参考链接:
[1]https://weibo.com/1656918431/Mes5tanma?type=repost#_rnd1668230651180

[2]https://zhuanlan.zhihu.com/p/330067710
[3]https://www.theregister.com/2022/09/08/deepmind_alphafold_performance/

      
            

麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的                             

          
              

8d65b6ab1da8137bd3685affde6e605a.webp



                

数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容, 还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。


管理员二维码:



浏览 35
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报