快捷导航
科技信息

AI卷翻科研!DeepMind长篇陈诉:全球实行室被“AI科学家”指数级担当

新智元报道编辑:编辑部 Hhj【新智元导读】OpenAI科学家Jason Wei推测,未来一年内,AI重点将从推广大众需求转为促进科学发现,无独有偶,DeepMind刚刚发布的36页陈诉也揭示出:全球实行室AI使用正在指数级增长,AI



新智元报道

编辑:编辑部 Hhj
【新智元导读】OpenAI科学家Jason Wei推测,未来一年内,AI重点将从推广大众需求转为促进科学发现,无独有偶,DeepMind刚刚发布的36页陈诉也揭示出:全球实行室AI使用正在指数级增长,AI for Science真正的黄金期间即未来临。

已往两年,AI主打用户增长,乐成实现了平凡化遍及。毕竟,拉新才是贸易王道。
然而,现在AI一样寻常的应用已经快卷到天花板了。对于天下上绝大多数人的平凡查询,许多LLM都能给出相当不错的答复。
速率、流通性已经富足满意绝大多数用户的需求。即便再优化,提升空间也有限——毕竟这类标题的技能难度不高。
大概,未来真正值得关注的是科学和工程范畴。
OpenAI科学家Jason Wei近来发帖推测:在接下来的一年内,AI的关注意点可能会从一样寻常使用转向科学范畴。

他以为,未来五年,AI关注的重点将转向硬核范畴——用AI加速科学和工程。由于这才是真正推动技能进步的引擎。
平凡用户的简朴标题,改进空间已经不大了。
但每个科学前沿范畴都有巨大的改进空间,而AI恰恰可以发力,去致力于办理那些能推动科技飞跃的「1%的顶尖标题」。
AI不仅有答复这些标题的潜力,还能引发人们去思考更大的挑战。
而且,AI的进展还能加速AI本身的研究,资助本身变得更强。AI的进步是复利的,可谓是正反馈之王。
说白了,未来五年就是「AI科学家」、「AI工程师」的期间。
DeepMind近来发的一篇论文也暗示了这一趋势:全球各地的实行室里,科学家们对AI的使用正以指数级增长。

陈诉地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Assets/Docs/a-new-golden-age-of-discovery_nov-2024.pdf

AI加速科学创新发现的黄金期间


现在,每三位博士后研究员中就有一位使用大语言模子来协助完成文献综述、编程和文章撰写等工作。
本年的诺贝尔化学奖也出乎了所有人的意料,颁发给了AlphaFold 2的发明人Demis Hassabis和John Jumper。同时,这也启发了大量科学家将AI应用到本身的科学范畴中,以求得更多的创新性发现。

已往半世纪,科学家人数猛增,仅美国就翻了七倍多,但科技带来的社会进步却放缓了。
原因之一是,现代科学家面对的规模和复杂性挑战越来越棘手。
不过,深度学习擅长搞定这种复杂局面,还能大幅压缩科学发现的时间资源。
比如,传统X射线晶体学花几年、烧10万美元搞定一个卵白质结构,而AlphaFold直接免费给你2亿种推测,秒杀传统方法。

五大机遇

对于在差别科学研究阶段难以突破研究瓶颈的科学家们来讲,把握住使用AI的关键机遇,大概就能促进诞生强有力的新发现。

五个能够使用AI来促进科研的机遇

1. 知识——改变科学家获取和通报知识的方式

科学家要想推动新发现,必须掌握一套日益专业化且指数增长的知识体系。
这种「知识负担」让颠覆性发现越来越倚重年长科学家和顶尖大学的跨学科团队,同时也导致小团队独立撰写论文的比例一连下滑。
而且,大多数科学结果仍以晦涩难明、英语为主的论文情势分享,限定了政策制定者、企业和公众的关注与爱好。
现在,科学家和公众都能借助LLM破局。
比方,有团队用谷歌Gemini一天内从20万篇论文中提炼出相干见解;平凡人也可用LLM轻松摘要和问答,获取专业学术知识,瞬间拉近与前沿科学的间隔。

2. 数据——天生、提取和标注大型科学数据集

尽管我们处于数据爆炸期间,许多天然和社会范畴中,科学数据却严峻匮乏,如土壤、深海、大气层和非正式经济。
AI正助力改变这一近况。它能减少在DNA测序、检测样本中详细细胞范例或捕捉动物声音时可能发生的噪声和错误。
科学家们还可以使用LLM越来越强的多模态本领,从科学出书物、档案文件以及视频图像等资源中提取非结构化的科学数据,并将其转化为结构化数据集,以做后续研究。
AI还可以资助为科学数据添加科学家所需的辅助信息。比方,至少三分之一的微生物卵白质在实行功能中的细节未能被可靠地注释。
经过可靠性评估验证的AI模子也可以作为新的合成科学数据的泉源。比方,AlphaProteo卵白质操持模子是在AlphaFold 2中高出1亿个AI天生的卵白质结构以及卵白质数据库中的实行结构上举行训练的。

3. 实行——模仿、加速并引导复杂实行

科学实行常因资源高昂、复杂且耗时难以实行。另有一些实行由于研究职员无法得到所需的办法、人力或实行质料而无法举行。
核聚变就是一个典范例子。它有望提供一种险些无穷、无排放的能源泉源,并可能支持诸如海水淡化等高能耗的创新性大规模应用。但控制等离子体所需的托卡马克反应堆复杂昂贵。ITER原型从2013年制作,预计2030年代中期才开始实行。
AI可通过模仿加速实行历程。
一种方法是使用强化学习智能体来对物理体系举行模仿。比方,研究者与洛桑联邦理工相助,用强化学习控制托卡马克等离子体外形,这一方法还可用于粒子加速器、望远镜等办法。
在差别砚科中,使用AI模仿实行的方式可能各不类似,但一个共同点是,这些模仿通常用于引导和优化现实实行,而非完全替代它们。
以基因研究为例,平凡人平均有9000多个错义变异,大多无害,但少数会致病。现实中,仅能逐个测试卵白质的影响。而AlphaMissense能快速分类7100万潜伏变异中的89%,资助科学家聚焦高风险变异,加速疾病研究。

AlphaMissense对所有可能的7100万个错义变体的致病性的推测

4. 模子——建模复杂体系及其组件之间的相互作用

1960年,诺贝尔奖得主物理学家Eugene Wigner感叹数学方程在模仿天然征象(如行星运动)中「出乎意料的有用性」。

但面对生物学、经济学、天气等复杂体系,传统方程模子渐显乏力,由于这些体系充满动态性、随机性,还常伴涌现和混沌,难以推测和控制。这些方程能提供非常有用但并不完善的近似,且运行这些方法也须要高昂的盘算资源。
AI却能从复杂数据中发掘规律。比方,谷歌的深度学习体系能快速推测未来10天天气,速率与精确性双杀传统数值模子。

同时,AI还能帮减缓天气标题,如用AI推测湿润地区的出现时间和位置,资助飞行员避开会加剧全球变暖的凝结尾迹。
即便AI非常强大,它更多是丰富而非代替传统的复杂体系建模。
比方,基于智能体的建模通过模仿个体行为者(如企业和斲丧者)之间的交互,来明白这些交互怎样影响更大、更复杂的体系(如社会经济)。
在传统方法中,科学家须要事先规定这些智能体的行为方式。
现在,科学家可以使用大语言模子创建更机动的天生式智能体,这些智能体能够举行沟通和办法,比方搜刮信息或购买,同时还能对这些办法举行推理和影象。
科学家还可以使用强化学习研究这些智能体如安在更动态的模仿中学习和调解其行为,比方对于新的能源代价或疫情相应政策的反应。

5. 办理方案——为大规模搜刮空间标题提出办理方案

许多告急的科学标题都陪同着许多险些无法明白的潜伏办理方案。
比如,生物学家和化学家须要确定分子(如卵白质)的结构、特性和功能,才气操持出用作抗体药物、降解塑料的酶或新型质料的一些新分子。
然而,要操持一种小分子药物,科学家须要面对高出10^60种潜伏选择;要操持一种由400种标准氨基酸构成的卵白质,则须要面对20^400种选择。
这种大规模搜刮空间不仅限于分子,还广泛存在于许多科学标题中,比如探求数学标题的最佳证明、盘算机芯片的最佳操持架构等。
传统上,科学家依靠直觉、试错法、迭代或暴力盘算的某种组合来探求最佳分子、证明或算法。然而,这些方法难以充实遍历巨大的搜刮空间,从而无法发现更优的办理方案。
现在,AI能够更好地探索这些巨大的搜刮空间,同时更快地聚焦于最有可能可行且有用的办理方案。
本年7月,AlphaProof和AlphaGeometry2乐成办理了国际数学奥林匹克比赛中六道标题中的四道。它们使用Gemini大语言模子架构,为给定的数学标题天生大量潜伏办理方案,并团结基于数学逻辑的体系,迭代地实现靠近最可能精确的候选办理方案。

AI科学家还是AI赋能的科学家?

即便AI体系的本领在不断提升,其最大的边际效益仍旧会源于将其应用在能够突显其相对上风的场景之中。
比如快速从海量数据会合快速提取信息的本领,以及资助办理科学进步中的真正瓶颈标题;而非操持让人类科学家已擅长的任务实现自动化。
随着AI推动科学变得更经济高效,社会对于科学和科学家的需求也会随之增长。
和其他行业差别,科学的需求险些是无穷的,而科技也并不会低落对科学家的需求。新的进展总会在科学的版图上开辟出全新的、难以推测的范畴,AI亦是云云。
正如司马贺所设想的那样,AI体系自身也是科学研究的对象,科学家会在评估和阐释其科学本领以及开辟新型人类-AI 科学体系方面起到主导作用。

关键要素


这一部分,文章深入探究了实现「AI for Science」的几个关键因素,并将其归纳为一个「AI for Science生产函数」的模子。
模子展示了怎样使用AI推动科学研究和创新的差别阶段以及须要关注的焦点内容。
从科学研究的标题选择(Problem selection)、模子评估(Evaluations)开始,通过盘算资源(Compute)和数据(Data)这些基础办法的支持,在开展研究过程中注意构造模式操持(Organizational design)和跨学科(Interdisciplinarity),形成结果,并终极通过采取(Adoption)将研究结果转化为现实影响。底部的相助(Partnerships)、安全与责任(Safety & responsibility)贯穿始终,确保整个流程高效且符合道德规范。

固然许多要素看起来直观,但DeepMind的论文揭示了一些在实践中告急的经验辅导。

1. 标题选择

科学进步的关键是找到真正值得办理的标题。
在DeepMind,科学团队通常会先评估一个研究标题是否富足告急,是否值得投入大量时间和资源。
DeepMind的CEO Demis Hassabis提出过一个思维模子:将整个科学视为一棵知识之树。
那么,最告急的是找到树的根——像卵白质结构推测、量子化学这些基础性的「根源标题」,它们一旦得到办理,就能开枝散叶,解锁全新的研究和应用。
而在这些标题当中,要判定AI是否能带来增益,我们须要探求具备特定特性的标题,比方巨大的组合搜刮空间、大量数据,以及可用于衡量性能的明白目标函数。
许多近来的突破,就来自于告急科学标题和成熟AI方法的碰撞。
比方,DeepMind在核聚变研究的进展就得益于新发布的强化学习算法——最大后验策略优化(maximum a posteriori policy optimization)。
选对标题很告急,但标题的难度也得刚好。一个得当AI的标题,通常是能够产生中心结果的标题。
假如标题太难,就没法产生富足的反馈推动进展。要做到这一点,须要靠须要直觉与实行的团结。

2. 模子评估

科学AI研究中,模子的评估方法也很告急。
科学家常常通过基准测试、指标和比赛等评估方法来评估AI模子的科学本领。
假如操持得当,这些评估方法不仅可以用来跟踪进展,还能引发方法创新,激活研究职员对科学标题的爱好。
差别的环境须要差别的评估方法。
比如,DeepMind的天气推测团队最初用基于几个关键变量(如地表温度)的「进展指标」来提升模子表现。
当模子到达肯定性能水平时,他们采取了一个更全面的评估方法,其中包罗1300多个指标。这些指标的操持受欧洲中期天气预报中心(ECMWF)评价评分卡启发。
团队也发现AI模子偶尔会在某些指标上「作弊」,比如「双重处罚」标题——「含糊」推测(如推测降雨在较大地理地区内发生)比「精准」推测(如推测狂风雨的位置略微偏离现实位置)受到的处罚更少。
为进一步验证,团队还评估了模子在卑鄙任务中的实用性,比方推测气旋路径的本领,以及表征可能导致洪水的「大气河道」(会合湿气的狭窄带)的强度。
最具影响力的科学AI评估方法通常是社区主导的,比如卵白质结构推测比赛(CASP)。
该比赛自1994年由John Moult教授和Krzysztof Fidelis教授发起,每两年举行一次。CASP的目标是通过测试各参赛团队的卵白质结构推测方法的精确性,推动相干范畴的技能创新,并加深对卵白质折叠和结构的明白。
不过,这也带来了基准可能「泄露」到AI模子训练数据中的风险,让模子「作弊」,从而低落基准用于跟踪模子进展的效用。
「作弊」标题暂时没有完善的办理方案,但至少须要定期更新基准,鼓励更开放的第三方评估和比赛。

3. 盘算资源

盘算资源是AI和科学发展的焦点引擎,但也是节能减排的焦点之一。
AI实行室和政策制定者须要从久远视角平衡模子需求与服从提升。
比如,卵白质操持模子小巧高效,而大语言模子训练时盘算麋集,但微调和推理时所需盘算量则比力少;通过优化数据或将大模子「蒸馏」成小模子,也可以进一步低落盘算资源。
同时,也须要对比AI与其他科学方法的资源斲丧。
比方,AI驱动的天气推测模子尽管训练泯灭资源,但团体服从可能优于传统方法。实证数据的一连跟踪可以资助明白这些趋势,并为未来盘算需求的规划提供依据。
别的,盘算战略不应仅关注芯片供应的富足性,更需优先建立关键基础办法和提升工程技能,以保障资源访问和体系可靠性。然而,学术界和公共研究机构在这些方面每每资源不敷,须要更多支持。

4. 数据

像盘算资源一样,数据是科学AI发展的基础办法,须要一连开辟、维护和更新。
人们常着眼于政策制定者推动的新数据集创建。
比方,2012年奥巴马当局启动的质料项目绘制了无机晶体图谱,为DeepMind近来的GNoME项目推测220万种新质料提供了数据支持。
但许多科学AI突破每每来自更有机的数据涌现,这些数据得益于有远见的个人或小团队的积极。
像其时Broad研究所的Daniel MacArthur领导开辟的gnomAD遗传变异数据集,为DeepMind的AlphaMissense项目提供了基础。
另有,数学工具Lean最初由Leonardo de Moura开辟,现在已成AI数学模子(如AlphaProof)的告急训练资源。
这些案例分析,除了自上而下的战略规划,还须要鼓励研究者在数据收集、整理和共享中扮演更积极的脚色。
当前,许多湿实行室的实行数据因缺乏资金支持而被扬弃;而卵白质数据银行(PDB)的高质量数据则受益于期刊要求和专业数据整理员制定的同一标准。相比之下,基因组数据的整理因标准不一,则常需额外整合和洗濯。
别的,另有许多高质量数据集完全未被使用,比如因允许限定无法公开的生物多样性数据,或几十年核聚变实行的汗青数据。这些瓶颈无论是由于缺乏资源、时间,还是由于数据禁运期,都会拦阻AI在科学范畴的潜力开释。

5. 构造模式操持

学术界偏自下而上,工业界偏自上而下,但顶尖实行室每每能找到二者间的平衡。
像贝尔实行室和施乐帕洛阿尔托研究中心的黄金年代,就以自由探索的研究模式著称。这也为DeepMind的建立提供了灵感。
近来,一批新兴科学机构试图从这些例子中罗致经验,复刻这种研究模式。它们渴望推动更多高风险、高回报的研究,减少官僚主义,为科学家提供更好的鼓励。
这些机构致力于办理一些科学中规模过大、学术界无法负担,但在工业界又不敷盈利的标题,比方扩展Lean证明助手,这一工具对AI数学研究至关告急。
这些机构的焦点目标在于,将自上而下的和谐与对科学家自下而上的赋能相团结。既不能完全依靠科学家自由发挥(可能导致服从低下或研究方向分散),也不能强行控制每一步(会扼杀创造力)。
抱负状态下,机构为科学家提供清楚的目标、资源和支持,但详细的研究方法和过程由科学家本身主导。
找到这种平衡不仅能吸引顶尖研究领导者,也是乐成的关键。Demis Hassabis称之为和谐尖端研究的焦点法门。
这种平衡同样实用于详细项目。比如在DeepMind,研究常在「探索」状态(团队探求新想法)和「使用」状态(团队专注于工程和性能扩展)两种模式间切换。
掌握模式切换机遇和调解团队节奏,是一门艺术。

6. 跨学科

跨学科相助是破解科学困难的钥匙,却常被学科壁垒卡住。
科学AI的研究每每须要多学科起步,但真正的突破来自跨学科的深度融合。这不仅是把人凑在一起,而是让团队共同开辟共享的方法和头脑。
比如,DeepMind的Ithaca项目用AI修复受损的古希腊铭文。为了乐成,AI研究负责人要研讨铭文学,而铭文学家也须要明白AI模子,由于直觉对这一工作至关告急。
作育这种团队动态须要精确的鼓励机制。团队能做到这一点,靠的是专注于办理标题,而不是抢论文署名——这也是AlphaFold 2乐成的关键。
这种专注在工业实行室更易实现,也凸显了长期公共研究资金的告急性——它须要摆脱对发表压力的太过依靠。
为了实现真正的跨学科相助,构造还须要为能够资助融合学科的人创造脚色和职业路径。
在DeepMind,研究工程师推动研究与工程的良性循环,项目经理增强团队协作并连接差别项目。DeepMind还优先招募擅长发现学科交织的人,并鼓励科学家和工程师定期更换项目。
关键是打造一种文化——好奇心驱动、恭敬差异、敢于争论。经济汗青学家Joel Mokyr称这种文化为「争议性」(contestability):差别配景的研究者能公开探究,相互批评又共同进步。
这种文化的实践可以通过定期举办跨学科研讨会、开放讨论平台以及鼓励团队表里互动来实现。

这段修复的铭文(IG I3 4B)记载了一项与雅典卫城相干的法令,时间可追溯至公元前485年至484年

7. 采取

科学AI工具如AlphaFold既专业化又通用:它们专注少量任务,却服务广泛科学界,从研究疾病到改进渔业。
然而,科学进展转化为现实应用并不简朴。比方,疾病的病原理论(germ-theory)从提出到被广泛担当履历了漫长的时间,而科学突破所催生的卑鄙产物(如新型抗生素)也常常由于缺乏符合的市场鼓励而未能得到充实开辟。
为了促进模子的落地应用,我们在科学家采取与贸易目标、安全风险等因素之间探求平衡,并设立了一个专门的影响力加速器(Impact Accelerator),以推动研究的落地应用,并鼓励社会公益方向的相助。
要让科学家更轻易用上新工具,集成流程必须简朴。
在AlphaFold 2开辟中,我们不仅开源代码,还团结EMBL-EBI创建数据库,供盘算资源有限的科学家轻松查询2亿种卵白质结构。
AlphaFold 3进一步扩展了功能,但推测需求激增。为此,我们推出AlphaFold Server,科学家可按需天生结构。
同时,科学界还自觉开辟工具如ColabFold,表现对多样化需求的器重及作育科学界盘算本领的告急性。

迄今为止,来自全球190多个国家的高出200万用户已访问AlphaFold卵白质结构数据库,欣赏了700多万个结构
科学家书任AI模子,才会用它。推广关键在于明白模子的用途和范围。
比如,在AlphaFold开辟中,我们操持了不确定性指标,通过直观可视化展示模子对推测的信心,并与EMBL-EBI相助推出培训模块,引导怎样解读置信度并用现实案例强化信托。
类似地,Med-Gemini体系在健康问答上表现优秀。它通过天生多条推理链评估答案分歧盘算不确定性。当不确定性高时,自动调用网络搜刮整合最新信息。
这种方法既提升了可靠性,也让科学家对决定过程一目了然,信托倍增。

Med-Gemini-3D能够为CT扫描天生陈诉,这比标准X光成像复杂得多。在此示例中,Med-Gemini-3D的陈诉精确地包罗了原始放射科大夫陈诉中遗漏的一处病变(用绿色标出)

8. 相助

科学AI离不开多范畴协作,公共和私营部分的相助尤为关键。
从数据集创建到结果共享,这种相助贯穿项目全程。
比如,AI模子操持的新质料是否可行,须要资深质料科学家的评估;DeepMind操持的抗SARS-CoV-2卵白质,能否如预期团结目标,也需与克里克研究所相助举行湿实行验证。以致在数学范畴,FunSearch办理Cap Set标题,也得益于数学家Jordan Ellenberg的专业引导。
鉴于工业实行室在推动AI发展中的焦点作用,以及对丰富范畴知识的需求,公共与私营部分的相助在推动科学AI前沿发展方面的告急性将日益凸显。为此,必须加大对公私相助的支持,比如为大学和研究机构与企业的团结团队提供更多资金。
但相助不简朴。各方需尽早就目标和关键标题告竣划一:研究结果归属、是否发表论文、数据和模子是否开源、实用的允许协议等,都可能引发争议。这些分歧通常反映了两边差别的鼓励,但乐成相助每每建立在清楚的代价互换之上。
比如,AlphaFold卵白质数据库能覆盖200万用户,正是由于团结了我们的AI模子与EMBL-EBI的生物数据管理专长。这种上风互补式相助,不仅高效,还能让AI潜力最大化。
参考资料:
https://deepmind.google/public-policy/ai-for-science/
https://x.com/_jasonwei/status/1861496796314493376
收藏 邀请
上一篇:德媒:我们在这些质料上依赖中国下一篇:传OpenAI获软银15亿美元新投资,答应员工在收购要约中出售股份
我有任务需求要发布
专业服务商主动承接
快速解决你的需求

专注IT众包服务

平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全

交易资金托管平台,保障资 金安全,确认完成再付款

实力商家

优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管

交易过程中产生纠纷,官方100%介入受理,交易无忧

  • 微信访问
  • 手机APP