米兰-复旦教授马剑鹏：AI已绕不开，宜从娃娃抓起—新闻—科学网

2024-10-14

“我全部职业生活生计一向在做这个工具，但心里很清晰，同业也这么认为——在我们有生之年，‘卵白质的折叠’问题是不成能解决的，特别是卵白质布局猜测问题。成果AlphaFold出来了！” 10月9日，博士生导师、国际闻名计较生物学家、复旦年夜学复杂系统多标准研究院院长马剑鹏传授告知彭湃科技。

本地时候10月9日，瑞典皇家科学院公布，将2024年诺贝尔化学奖授与三位科学家，此中，一半授与美国华盛顿年夜学的戴维贝克 (David Baker)，以表扬其在计较卵白质设计方面的进献，另外一半则配合授与英国伦敦人工智能公司谷歌DeepMind公司的丹米斯哈萨比斯（Demis Hassabis）和约翰乔普（John M. Jumper），以表扬其在卵白质布局猜测方面的进献。

这是继10月8日两位人工智能前驱被授与2024年诺贝尔物理学奖以后，人工智能科学家们再次被授与诺贝尔奖。

2021年，复旦年夜学复杂系统多标准研究院院长马剑鹏团队合作颁发基在主链的卵白质侧链猜测算法（OPUS-Rota4 算法)，针对谷歌团队AlphaFold的软肋，年夜年夜晋升了卵白质侧链布局测试精度。

据介绍，上述猜测算法“今朝已迭代至OPUS-Rota6，精度比AlphaFold 2/3都高”。

复旦年夜学复杂系统多标准研究院院长马剑鹏传授。

对2024年诺贝尔化学奖，马剑鹏认为，固然人们迷惑又有人工智能范畴的科学家拿诺奖，但这其实分两个问题：一是卵白质布局的猜测，该不应拿诺奖；二是人工智能在这方面的进献值不值得拿诺奖。

“这也是为何给他们这个奖。其实这个问题并没有完全解决，但已往进步了一年夜步，已超出了我们有生之年的期望。此刻已可使用了。”马剑鹏说。

他认为，正如复旦年夜学公布将推出最少100门AI范畴课程一样，AI已绕不开，你纷歧定需要会写算法，但最少要会用。他建议，“从娃娃抓起”，会用AI。

复旦年夜学复杂系统多标准研究院院长马剑鹏传授。

他还强调，为何谷歌Deepmind公司能获得AlphaFold如许的冲破？这个问题对中国极具实际意义。

“王冠上的明珠”：一个老得不得了的极难的科学问题

卵白质为何主要？

“在你身体的每一个细胞内，数十亿个微型机械——卵白质——正在尽力工作。”

有人乃至说，几近生命的一切特点都跟卵白质有关。

简直，卵白质是每一个生物体中每一个生物进程的根本，它是生命的基石。没有卵白质，生命就没法存在。布局是如斯主要，卵白质复杂而多样的布局，对应了各类惊人的功能，从而促进了生命的丰硕多彩。其布局背后是生命的奥秘。

“我给学生上课，头一件事就是要注释为何卵白质的布局猜测如斯坚苦、如斯复杂？”马剑鹏说。

一个个氨基酸相连“串成”多肽，而长链一样的多肽折叠构成不变的空间三维布局，成为一个有功能的卵白质。按照一个氨基酸序列猜测出响应卵白质终究的“折叠布局”（folded structure），这就是卵白质布局的猜测问题。它被视为现代份子生物学“皇冠上的明珠”。

马剑鹏说，“这不是个新问题。而是个老得不得了的问题，但是这个问题是如斯的难。”

他举例，100个氨基酸构成的卵白质很是小，但假设此中的每一个氨基酸只有两个态——折叠态和非折叠态（但现实上它有没有穷个态），那末这个卵白质就有2的100次方个态。

“这个数字是如斯庞大，假如用人类的任何计较机一个一个穷举过来，或来检索，寻觅此中一个准确谜底，需要的时候乃至比宇宙寿命还长。可是卵白质刹时就可以完成折叠。”马剑鹏说。

科学家经由过程X射线晶体学或冷冻电镜等尝试手艺来测定卵白质布局，但耗时吃力。

剑桥年夜学的研究人员约翰肯德鲁和马克斯佩鲁茨在20世纪90年月末获得了冲破性的发现，他们成功地利用了一种叫做x射线晶体学的方式，展现了第一个卵白质的三维模子。为了表扬这一发现，他们在1962年被授与诺贝尔化学奖。

“2020年，AlphaFold解决了50多年来最年夜的科学挑战之一。”Deepmind官网称，“获得了卵白质布局猜测方面的底子性冲破”。

到今朝为止，AlphaFold已猜测了跨越2亿种卵白质的布局——几近所有科学界已知的卵白质，并帮忙科学家领会生命份子若何彼此感化。

AlphaFold 软件已发布过三个首要版本。2018年12月，一个利用 AlphaFold 1的研究小组在第13届布局猜测要害评估(CASP13) 的整体排名中名列第一。2020 年11月，一个利用AlphaFold 2的团队在CASP14比赛中再次名列第一。

2021年7月15日，关在AlphaFold 2的研究论文在国际学术期刊《天然》（Nature）上在线颁发，论文题目是《利用 AlphaFold 进行高精度卵白质布局猜测》（Highly accurate protein structure prediction with AlphaFold）。John Jumper和Demis Hassabis是配合通信作者。

AlphaFold 3在2024年5月8日发布。它可以猜测卵白质与DNA、RNA、各类配体和离子构成的复合物的布局。相干研究论文也在统一天在线颁发在国际学术期刊《天然》（Nature）上。

Deepmind官网介绍，迄今为止，全球数百万研究人员已利用 AlphaFold 2在疟疾疫苗、癌症医治和酶设计等范畴获得发现。AlphaFold 3让人们超出卵白质，进入更普遍的生物份子范畴。这一奔腾可以开启更多变化性科学，从开辟生物可再生材料和更具弹性的作物，到加快药物设计和基因组学研究。

马剑鹏说，“假如纯洁从卵白质布局的建模上，或说制药业的药物设计上来看，Alphafold的精度（正确度）远远没有到达抱负的精度。可是，它比之前的东西不知道好到哪去了！”

布局猜测是手艺，设计是艺术

马剑鹏介绍，卵白质的布局猜测问题现实上触及两个具体问题——卵白质折叠的进程和终究的布局猜测。“一个是卵白质究竟是怎样折叠起来的？其实就是适才那一百个氨基酸的多肽折叠起来的全部进程。在出发点和终点之间，怎样走？这个问题到此刻也没有解决。可是从生物学家的角度，他们可以绕开第一个问题，我不care（在意）究竟是怎样折叠的，给你一个卵白质序列，你只要能告知我终究的卵白质布局就好了。底子不看路径。现实上路径（问题）更烦。”

与猜测布局比拟，马剑鹏暗示，设计一个新卵白更难。前者是解题，猜测一个天然界已存在的卵白的布局，后者是缔造一个不曾存在的布局。“所以，我一向说弄折叠是个手艺，弄设计是个艺术。”

2024年的三位诺贝尔化学奖得主之一戴维贝克（David Baker）在加州年夜学伯克利分校师从兰迪谢克曼取得生物化学博士学位，并在加州年夜学旧金山分校师从年夜卫阿加德进行生物物理学博士后研究。他此刻是华盛顿年夜学生物化学传授、华盛顿年夜学医学院卵白质设计研究所所长。贝克尝试室开辟卵白质设计软件，并操纵它来建立份子，以解决医学、手艺和可延续性方面的挑战。他比来的工作之一是开辟用在生成功能性卵白质的壮大机械进修方式。

贝克仍是华盛顿年夜学基因组科学、生物工程、化学工程、计较机科学和物理学的兼职传授。他颁发了600多篇研究论文，配合开办了21家公司，并取得了100多项专利。

马剑鹏介绍，贝克做卵白质布局猜测更早，在AlphaFold呈现之前，他屡次是CASP角逐的冠军。他猜测的正确率到达了百分之四十几。“贝克凸起的长处就是，他不但管帐算，会猜测，他还会做尝试，做设计。他自己是做尝试身世，他的团队是一个很是典型的“干湿”连系的团队，所以特殊成功。”

上世纪90年月末，戴维贝克最先开辟可以或许猜测卵白质布局的计较机软件罗塞塔(Rosetta)。研究小组绘制了一种具有全新布局的卵白质，然后让罗塞塔计较：哪种氨基酸序列可以发生所需的卵白质。事实证实，罗塞塔确切可以构建卵白质。研究人员开辟的卵白质Top7几近跟他们设计的布局完全不异。

不言而喻，人们可以用这类软件设计想要的卵白质，用作药物、疫苗、纳米材料和微型传感器。

人生无处不AI：已绕不开，宜从娃娃抓起，不克不及再不懂

“我有一个不雅点，我认为，Alphafold的成功，对AI范畴、计较机科学范畴的影响，可能比对卵白质布局猜测的影响更主要。”马剑鹏。

这类不雅点源自他持久的不雅察：1997年，“深蓝”计较机（Deep Blue）曾打败过国际象棋的世界冠军加里卡斯帕罗夫（Garry Kasparov）。那时就有人感觉天要塌下来了，世界要被电脑倾覆了，成果甚么工作都没产生；人们认为国际象棋的棋盘那末小，可以被打败，但围棋是不成能被电脑打败的。2016年3月，阿尔法狗（AlphaGo，阿尔法围棋）以4：1比分克服韩国围棋九段高手、世界冠军李世石。又有人感觉天要塌了。但也有人认为，那只是个游戏，围棋游戏罢了。直到Deepmind公司不吝价格，把AlphaFold做出来。

“计较机科学AI范畴的人一看，连这么难的卵白质布局猜测都能做出来，人脸辨认、主动驾驶还算事儿吗？成果真的酿成‘人生无处不AI了’。”“固然Alphafold不完善，但真的可以用了，它可以加快科研。”马剑鹏说，Alphafold的成功催生了一个此刻每天能听到的名词——AI for science，用AI这个东西辅助科学研究。

复旦年夜学2024年招生培育政策发布会上发布的信息称，从2024年秋季学期最先，复旦年夜学将在2024-2025学年推出最少100门AI范畴课程。AI年夜课将纳入所有复旦学生的学业放置。“要从娃娃抓起，你不克不及再不懂AI，不克不及再不会用AI。” “不需要每一个人每天专门做算法，但泛博科技工作者哪怕是做尝试的，也最少得会用。”马剑鹏说，AI算法确切很是壮大，Alphafold已真正有适用价值了，不像之前弄理论自娱自乐。Alphafold这类手艺的存在，使得包罗颜宁、施一公等科学家在内的做尝试的人，他们解析卵白质布局的速度可能更快了,但不是说不消做尝试了。“它还代替不了尝试。最少到今天为止，‘金尺度’还得靠尝试。假如哪一天猜测手艺正确到，算出来的布局必然是对的，那世界又变了。”

为何谷歌Deepmind公司能获得AlphaFold如许的冲破？是由于算力吗？

马剑鹏说，“这个问题对我们国度，特别此刻，长短常成心义的。”

他暗示，起首算力很主要，但要害仍是算法。其次是问题的选择——你有无设法，对准卵白质布局猜测问题。

马剑鹏说，“更主要的一个启迪是，你有无留意到此刻年夜部门冲破都是公司做出来的？”

他暗示，它是典型的“年夜兵团作战”。公司和高校的区分在在，在高校里面，你再有经费，仍是单一的一个团队。但在公司里，可以雇各类各样的人，在一个领头人的负责下，为了统一件事尽力。“（公司里）不需要你发nature或发science等论文。你的使命就是把这个工作做出来。这是一种范式上的改变。团队作战，最年夜的特点就是必然要有一个强有力的‘领头羊’，把各类各样的人连合在一路。理论上，这很合适在我们国度，我们也有如许的经验，集中气力办年夜事。”

（原题目：诺奖解读｜马剑鹏：AI已绕不开，不克不及再不懂，宜从娃娃抓起）

特殊声明：本文转载仅仅是出在传布信息的需要，其实不意味着代表本网站不雅点或证实其内容的真实性；如其他媒体、网站或小我从本网站转载利用，须保存本网站注明的“来历”，并自大版权等法令责任；作者假如不但愿被转载或联系转载稿费等事宜，请与我们联系。

米兰-BPO行业整合方案提供者

米兰-复旦教授马剑鹏：AI已绕不开，宜从娃娃抓起—新闻—科学网