快捷导航
科技信息

专访智源院长王仲远:当模子参数凌驾万万亿级别 就可能逾越人类大脑

注意,人机共存的期间不远了!可当AI无所不能,人类做什么?访谈丨薛芳 对话整理丨嘉林编辑丨薛芳出品丨深网·腾讯新闻小满工作室“叔叔,如果人工智能什么都能做了,我们未来能做什么?”一个小姑娘站起来问智源研

注意,人机共存的期间不远了!可当AI无所不能,人类做什么?

访谈丨薛芳 对话整理丨嘉林编辑丨薛芳

出品丨深网·腾讯新闻小满工作室

“叔叔,如果人工智能什么都能做了,我们未来能做什么?”一个小姑娘站起来问智源研究院院长王仲远。去年3月,王仲远去北京的一所小学讲了一堂人工智能的课,小朋侪们发现他们的课程作业人工智能都能回答得非常好。

这个标题击中了王仲远的心灵,一直在AI前沿的他心田并没有很明白的答案。2023年2月,王仲远履新智源研究院院长。王仲远发言语速适中,气质沉稳而内敛。他过往的工作履历,十年磨一剑,霜刃未曾试。

此前,他曾担任过微软亚洲研究院的主任研究员,负责知识图谱项目和对话机器人项目;也曾入职Facebook ,担任盘算机科学家;2018年,王仲远入职美团,用半年就向导团队构建出天下上最大的知识图谱“美团大脑”。

他重新做出了选择——从研究院到公司,再从公司回到研究院,用了十五年时间,他从最初知春路的希格玛到如今五道口的智源大厦,隔断2.7公里。固然,这种选择的背后是王仲远看到了整个AI范畴未来已来。

过去这些年,AI三次引发了公众的关注。1997年,IBM的超级盘算机深蓝克服国际象棋天下冠军卡斯帕罗夫;第二次则是2016年3月,AlphaGo在围棋人机大战中击败围棋天下冠军李世石;第三次是2023年直到一家叫OpenAI的公司打开了通往未来的星际之门。

“大模子带来的技能突破,彻底办理了过去几十年一直都无法攻克的一个困难——天然语言明白与逻辑推理。以2023年为界限,之前是弱人工智能期间,而之后很有可能进入通用人工智能期间,这内里有许多技能标题须要突破。”王仲远叙述。

可以想象王仲远心田的震动和兴奋。他一直以来的空想就是渴望能推动人工智能技能的发展。那么,智源研究院无疑是在谁人时间节点最能实现空想的地方。“智源是一家非营利性机构,定位是做高校做不了,企业不乐意做的事变。”王仲远叙述。

2018年,北京智源人工智能研究院创建。智源研究院是中国最早开展AI大模子研究的机构之一,也被称作“AI大模子的黄埔军校”。智谱AI首创人唐杰、月之暗面首创人杨植麟、面壁智能团结首创人刘知远、以及行业内的大模子领军人物或技能骨干不少等都曾到场过智源研究院的大模子项目。

去年 3 月,微软总裁Brad Smith在采访中说举世有三家顶尖的AI机构, Open AI,Google和北京智源人工智能研究院。智源研究院的首创人张宏江和前院长黄铁军的珠玉在前,成为如许一家机构的掌舵人,对于1985年出生的王仲远来说,肩上担子并不轻。

王仲远不但仅是一个科学家,智源研究院的负责人,他更像一个创业者。

“智源研究院致力于成为人工智能创新引领者,那么怎样做出突破性的效果?我们的技能门路判定是否正确?怎样汇集最精良的人才?人工智能造福人类的同时怎样做到安全可控?怎样获取可连续发展的资源和算力?”这些都是王仲远一直在思考的标题,也是他要办理的标题。

整个过程中,焦急是存在的。在王仲远看来,人在对抗焦急的过程中才会有进步,焦急往往会转化为他前行的动力。对他来说,“我自己会冥想、听音乐、旅游,与人互换,用开放的心态去对抗焦急。”

焦急,仅仅是一种感情。谁人小女孩的提问一直在王仲远脑海里萦绕,“我不能说有比较明白的答案,但我感受到了的责任。这个责任是既要促进人工智能的发展,为各行各业赋能,同时,要确保人工智能充足的安全,不会伤害人类。”

天下模子肯定是未来的技能发展的路径

《AI光年》:2024诺贝尔物理学奖获得者、“AI教父”Geoffrey Hinton(杰弗里·辛顿)传授以为,在AI范畴,生物智能终极克服了机器智能,您怎么看?

王仲远:本年 3 月智源研究院举行的北京 AI 安天下际对话上,辛顿传授分享,他终于想明白了为什么数字智能肯定会逾越生物智能。人类大脑的神经网络不能直接复制给别的一个人,每个人学习所形成的神经网络都是独一无二的。不能把一个高智商的人的参数复制给别的一个人,使其具备同样的智能,但机器可以复制。

如果不思量能耗的情况之下,机器智能有它独特的上风。当我们练习出一个非常强大的人工智能神经网络,它存在数字天下里,可以非常轻易复制,每一个模子可以继承练习变得更精良。只要模子的性能还可以大概连续提升,复制服从和学习服从比人类高得多。人类的学习服从着实非常低,我们只能读几千本、几万本书,但是机器可以把人类汗青上的全部的书籍都阅读完。未来当人工智能写的书籍比人类书籍质量还高时,这种合成的数据就可能反哺智能进一步的提升。

《AI光年》:OpenAI的草莓如今似乎部门地办理了大模子的幻觉标题,你怎么看?

王仲远:幻觉是拦阻大模子财产化落地的一个标题。这个标题不会被消除,但是会被不停地改进,直到控制在肯定的范围内。

究竟上,岂非人类就没有“幻觉”标题吗,就能确保说的每句话都是正确的吗?关键照旧幻觉比例的标题,以及是否知道可能出现幻觉。财产界当前通过信息检索增强的方案来作为办理幻觉标题的解法之一,智源研究院所研发的 BGE 模子,它是一种检索增强的模子,近期登顶了举世AI开源社区Hugging Face月度模子下载量榜首,成为了在信息检索增强方向非常紧张的模子。当大模子须要回答法律、医疗大概产物的标题,必须有根有据。通过基于知识库的文档检索增强,增强模子回答的正确性,以是这是一个非常紧张的根本模子。

Open AI的草莓模拟的是人脑的思考过程,会反思,纠正自己的错误,直到找到一个可能的答案。如许的双体系(快体系和慢体系)未来会徐徐成为主流。检索体系也是一种路径。正常回答标题时,如果知道这个答案就直接回答,不知道可能就会去搜索、查资料再往返答这个标题,搜索和查资料就是检索增强。

《AI光年》:ChatGPT 被以为是大脑的模拟器,Sora被称为物理天下的模拟器。多模态会不会是未来的趋势?

王仲远:人工智能的研究都会参考人脑的工作机制。人脑固然有差别的分区,但它是一个团体的结构。人脑不但仅处理文字信息,还处理许多模态的信息,声音、图像以致更复杂、更多元的信号。以是我们信任,同一原生的多模态大模子肯定是未来的技能发展路径。

当前多模态技能仍旧没有收敛,行业在做多模态的明白与天生所使用的技能门路是完全不一样的。智源研究院在研究一套可以大概将二者同一的原生多模态天下模子的技能门路。行业如今多模态天生模子基本上走的是 Diffusion Transformer 如许的 DiT 根本门路,明白模子通常都是以语言模子为核心,再把视觉信号、其他信号映射到语言模子如许的一条技能门路。这种图像天生和视频天生的效果确实非常惊艳。

但是两者须要合为一吗?差别的科学家有差别的观点。不外,我们信任,多模态天生模子和多模态明白模子是要同一的。由于人的大脑是有视频天生本事的,我们每一天都在做梦,大脑每一天都在产生各种各样的画面和场景。这种天生本事也很可能会成为校准明白本事的信号,从而进一步提升明白本事。末了的天下模子是更靠近人脑的,不但要明白、推理天下,还要能跟这个天下交互。

《AI光年》:你刚才谈到了两种技能门路,这两种技能门路有没有难易之说?

王仲远:不是这两种技能门路的难易,而是我们要走一条全新的技能门路,叫原生多模态天下模子的技能门路,国内没有几个团队在尝试这条技能门路,由于它确实非常难。

智源研究院在过去半年的时间里攻克了一个又一个的根本难关,直到本日依然不能说完全攻克,但终于将差别的模态,将天生和明白的本事压缩在了一起。渴望做到World in one,One for world。这是我们一个技能路径的选择。这个路径的选择,从创业的维度来讲,有可能会失败。没有失败的科研就不是真正的创新。失败也是创新的情势之一,是必经路径。但永久要有信心,技能理想。

10月21日,智源研究院基于下一个token推测,发布了原生多模态天下模子Emu3,无需扩散模子或组合方法,即可完成文本、图像、视频三种模态数据的明白和天生。下一个token推测为构建多模态AGI提供了一条远景广阔的门路。

国内文生视频范畴没有跳脱旧模式

《AI光年》:本年国内的文生视频范畴比较卷,你怎么对待这种征象?

王仲远:天下模子和文生视频模子是两码事。当前的 DiT 架构可否走到天下模子,从技能路径判定上是有争议的,由于它的天花板是有限的。Autoregressive 的技能门路天花板高许多。过去的这段时间,文生视频模子国内发布的越来越多,有点像去年大语言模子,由于已经有一个机构验证了这条技能路径。国内许多企业去跟进,这种跟进也有价值和意义。但国内所发布的文生视频模子并没有跳脱旧模式,依然是技能跟随。

《AI光年》:这么卷有没故意义?

王仲远:短视频赛道在过去几年非常火,文生视频肯定找得到它的业务产物和商业模式。当这条技能路径效果非常好的时间,值得去做,由于有商业需求,但是它并不肯定是到达 AGI 的技能门路。从实现AGI的角度,当前文生视频的技能门路不肯定是完善的技能门路。

《AI光年》:去年卷大模子,本年卷文生视频,一级市场一直有声音,如今出来了AI 泡沫论,你怎么看?

王仲远:任何一项技能,任何一个范畴,有争论是一件功德。当前的技能本事、商业模式是否足以支持资源投入和市场盼望?这中央存在分歧。如果仅从技能门路上来看,2023 年是一个迁移转变点,是一个通往通用人工智能期间的分界限,很有可能是第四次的工业革命。任何一次工业革命的周期会很长,技能突破到财产化须要周期,我信任这一次人工智能技能的发展和突破自己不是泡沫。AI 泡沫论是相对的。原来可能须要 5 - 10 年发生的事变,各人渴望在一年内发生,那么这就是泡沫。

《AI光年》:我之前问过一个闻名投资人,这是不是意味着社会资源的浪费?他说是,但也没办法。如今大模子似乎依然重复这条路径,似乎也是没办法。你怎么看?

王仲远:这证实在中国的这个市场上有了更加充实的竞争,人才济济。我们须要的是可以大概突破核心技能的顶尖大模子,如许会更利于应用和产物的到来。大模子是对于算力资源、人才密度要求都非常高的赛道,以是我们渴望终极可以大概收敛为几个根本大模子,如许会更利于生态的发展。

《AI光年》:你怎样对待技能和财产的关联?

王仲远:回顾互联网信息技能、人工智能技能的发展,我们会发现每一次重大技能革命都有周期性。当年的互联网出现之后,要有根本办法建立的过程,反面才会有像流派网站、电子商务等应用形态和商业模式的诞生。从 2007年 iPhone1发布,到2010年 iPhone 4推出,移动互联网才真正进入到成熟期,再共同其时 4G 发展进入到消费级,移动互联网的应用开始大规模涌现。

大模子也类似,前几年智源研发的悟道系列大模子,其时还处在一个实验室阶段。到过去这两年,以 OpenAI 为代表的举世 AI 公司在大模子技能上埠孟创新迭代,使其开始进入到财产界。未来当基座大模子进入到相对成熟阶段时,基于大模子的应用就能迎来蓬勃的发展。岂论是过去照旧如今,这都是正常的发展阶段。

《AI光年》:如果投资ChatGPT 、大语言模子或文生视频模子,怎样思量从投资到实现商业化所需的时间跨度?

王仲远:如果是关注模式、应用或产物创新的资源,应该看准时机再出手。如果是关注技能战略型的投资,如今正是好时间。

《AI光年》:AI隔断商用另有多远?

王仲远:在 B 端作为一个服从工具,已经在许多范畴有了明白的应用,比如,文章择要、聚会会议纪要,把非结构化的数据结构化,筹划、广告、电商等。各人更期待的是一个面向C端的杀手级应用的诞生,这须要天时地利人和。模子本事提升,资本降落,场景出现,需求办理,当这些条件同时满意的时间,基于大模子的超级应用才有可能会诞生。C 端用户对于体验非常敏感,对于很稍微的幻觉标题,都会感知猛烈,当这些都被办理,杀手级应用天然就出现了。

大模子本事提升会造成小模子的颠覆

《AI光年》:Sam Altman发起过一个7万亿的芯片筹划,您怎么看?

王仲远:传言也好,真实变乱也好,最大的标题照旧算力资本。纵观整个基于神经网络的人工智能发展历程,每一次大的发展都是算法、数据、算力加模子参数的提升,一次量级的提升就会带来模子效果的提升。这在过去一年被界说为Scaling law,广泛流传。

未来,模子要继承扩大十倍、百倍的参数规模,数据量须要十倍、百倍,算力资源也须要十倍、百倍,而当下的算力还开不敷以支持。单个芯片的性能以及集群规模都须要提升,当提升到肯定程度,很可能我们访问证新的人工智能发展阶段。

《AI光年》:大小模子之争是别的一个技能维度的标题,照旧卷大概竞争维度的标题?

王仲远:一方面我以为大模子会越来越大。10 年后很可能我们本日的模子就已经变成了小模子。2018 年 Bert 发布时,是亿级的参数目,在谁人时间险些就是天下上最大的模子,但在本日的时间节点来看就变成了小模子。以是未来 5 年、 10 年,算力、模子性能进一步提升,大模子会越来越大。

但另一方面模子要做小,满意性能和资本的要求,才气实现财产落地。将大模子做小,一种方式是通过技能的路径,把同样的性能压缩在一个更小的模子上,另一种方式是推动盘算性能自己的提升,让算力去承载大模子时资本充足低。

《AI光年》:一个大模子技能很强,做一些拆解和技能方面的切割,照旧市场全面着花,出现许多大模子?

王仲远:如果将大模子比喻为人脑,这个天下有 70 亿人,也就是70亿个大模子。大模子进入到各个范畴,各个行业,各个企业,肯定有他自己的范畴。这个标题一直有技能门路之争,在我看来,如果大模子的本事特殊强,可以通过 API 的方式调用,但是如果进入各行各业,每个行业都有自己独特的数据,须要对大模子进一步练习、对齐、Fine-tuning ,就会产生所谓的范畴模子。更有可能的情况是有一个很强的根本大模子,又压缩成小模子,然后进入到各个范畴进一步的练习,变成这个范畴内里最强的模子,但这仅仅是一个技能门路的推测和判定。

《AI光年》:那就是强大的通用天下模子,可以取代了各种垂类小模子?

王仲远:每一次根本大模子的本事提升确实可能带来小模子的颠覆。但如果类比人,纵然是博士毕业,他进入到一个企业工作,也依然有学习和顺应的过程。

《AI光年》:那是不是从某种意思来讲,只有通用模子才有很强的竞争力?小模子在中国这种市场情况照旧蛮脆弱的?

王仲远:要看这个小模子怎么界说。如果这个小模子是当年弱人工智能的产物,那它的竞争力肯定是不稳定的。如果这个小模子是基于大模子的一个产物,保留了大模子许多的推理本事,那么可能黑白常强的。

着实在 AI 1.0 期间,已经有许多小模子在各行各业里发挥作用,但是小模子由于参数目和练习语料的标题,本事的天花板是有限的。大模子将本事的天花板实现了重大提升,但不代表它在这个范畴内就能做得非常好,它进入到这个范畴依然须要去学习。就像我们从小学、中学、大学读到硕士、博士,但我们进入到企业依然也会继承企业的培训,再去顺应这个行业,顺应这个范畴。

《AI光年》:面向未来,有一个疑问,Scaling law失效了吗?下一代的模子性能可否有进一步的提升?

王仲远:我们来看数据、算力、这几个要素。数据方面,全互联网的文本数据已经被用来做模子练习,如果我们不能突破数据的范围,模子性能就会遇到瓶颈,如今在一些特定的范畴,比方编程,通过模拟器、编译器,它能验证效果,用合成的数据去模拟人类的思维找到确定答案反哺,也是在办理数据不敷的标题。别的,全天下的多模态数据是文本数据的百倍、千倍,怎样有用使用这些数据来进一步提升模子的本事,也是一个待解的标题。

算力方面,国外已经有 10 万卡级别的集群,如果我们的参数要继承扩大十倍、百倍以致千倍,10 万卡依然不够,算力进一步提升,集群规模进一步扩多数会是下一波模子重大提升的必备条件之一。参数方面,行业里广泛以为 GPT 4是 1.8 万亿参数,那么什么时间有十万亿、百万亿、万万亿的参数,当模子参数到万万亿级别就和人类的大脑容量相似,以致逾越人类大脑。如许参数的模子如果能被练习出来,数据被突破,算力被突破,它很有可能到达通用人工智能。

我们这一代人访问证AGI的诞生

《AI光年》:智源设有 AI 大模子安全研究中央,你怎么看 AI 安全标题?比如AI会不会失控?

王仲远:人工智能技能发展到本日,尤其大模子技能的发展,是有可能到达AGI的,这让AI安全尤其紧张。人类的汗青上,还没有其他生物体或机器智能到达大概逾越人类智能。当大模子可能在未来几年到几十年实现AGI 时,我们须要更早的开始思考它的安全性。作为一家非营利机构,智源有责任更早地思考,这也是我参加智源的初心之一。

我们这一代很有可能访问证 AGI 的诞生,我们的下一代很有可能会与 AGI 共存。那么怎样确保AGI 是安全可控的,是为人类服务而不是管控人类的?这是我们要办理的标题。当前的大模子技能已有可能对人类带来各种危害,比如大模子的语言本事可能带来不良的文字引导,文生图、文生视频的本事可能造成更多虚伪信息的泛滥, AI安全已经迫在眉睫。

智源研究院一直以来都非常关注AI安全。2023年智源大会,我们首次设立了 AI 安全的论坛,OpenAI CEO Sam Altman和图灵奖获得者Geoffrey Hinton传授(也是本年诺贝尔物理学奖获得者)到场了。2024年 3 月,智源举行了北京 AI 安天下际对话,我们首创理事长张宏江博士和图灵奖获得者Yoshua Bengio传授担任论坛主席,与会专家团结签署《北京AI安天下际共识》。2024年的智源大会上也继承设立 AI 安全论坛。这也反映了国际最顶尖的专家学者对于 AI 安全的思考和器重程度。我信任只要我们从如今开始努力,照旧有可能将 AI 控制在一个安全的,造福人类的范围之内。

《AI光年》:AGI 会完全替换哪些职业?如果 AGI 是一种赋能,未来会在哪些范畴落地和应用?

王仲远:这一波人工智能与以往最大的区别是越来越像人类的大脑,这就意味着全部人能做的事变,未来大模子大概人工智能都有可能发挥作用,险些会进入各行各业。有些行业可能进入得快一些,有些行业可能进入得慢一些。

之前网络上流传一个玩笑话,我们原本以为人工智能会先取代蓝领,没想到先取代的是白领,原本以为创造力是人类所独有的,效果天生式AI的创造本事比人类还强,想象力比人类还丰富。这一波人工智能的发展,不管有没有到达AGI,对各行各业都会产生赋能。

《AI光年》:人类应该怎样继承被AI取代,用什么样的心态去继承?

王仲远:如果我们看人类过去的发展历程,每一次重大的技能厘革最初是办理不了标题的,但是我们始终要去思考怎样让技能向善,这是我们这一代人的责任,尤其智源作为一个非营利性机构,更有责任去确保人工智能是安全的。这不是说人工智能肯定会失控,我信任它照旧可控的。在原子弹刚发明出来的时间,各人也担心天下要扑灭了,但人类社会黑白常故意思的群体,发展了几千年,每一次危急终极都得到了控制。

《AI光年》:可以给年轻人什么发起?

王仲远:肯定要选择自己热爱的事变。我回顾过去15年的工作履历,最紧张的是一直在做自己最热爱的事变。我之以是从企业又回到了智源研究院如许的一个偏科研性子的机构,是由于人工智能是我一直热爱的事变。让人工智能像人类一样明白天下,推理天下,实现真正的通用人工智能,是我心田一直以来的寻求。

《AI光年》:您刚才说我们这一代人可能访问证 AGI 的到来,下一代可能会和 AGI 共存。那么,人和 AI 未来应该是一个什么样的关系?

王仲远:如果 AGI 真的诞生,我渴望它与人类是良性互动和共存的,能为人类所用,造福人类。人类与动物的区别在于会发明和使用工具,人类汗青上,技能的突破和发明,终极都变成了人类的工具。

人工智能过去也一直都是人类的工具,但是当它的智能化程度靠近、到达大概逾越人类的时间,还能不能继承作为工具为人类使用?这是一个非常难以回答的标题,但我们渴望它是可控的。

《AI光年》:AGI何时到来?

王仲远:这个标题行业里一直有差别的观点。去年非常乐观的时间,各人以为 AGI 一两年内就能到来。GPT 5 迟迟没有发布,各人又开始对 AGI 是否有泡沫,这一波人工智能是不是已经见底睁开争论。

但如果我们回顾过去整个基于神经网络的人工智能发展,算力的提升,数据规模的提升,模子参数规模的提升,我以为 AGI 有可能在未来 5 ~ 20 年到来。这是为什么我以为我们这一代有可能访问证 AGI 的诞生,下一代很可能要与 AGI 共存。

收藏 邀请
上一篇:被疯狂替换的TI,怎么样了?下一篇:特朗普胜选,对我国半导体财产有何影响?
我有任务需求要发布
专业服务商主动承接
快速解决你的需求

专注IT众包服务

平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全

交易资金托管平台,保障资 金安全,确认完成再付款

实力商家

优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管

交易过程中产生纠纷,官方100%介入受理,交易无忧

  • 微信访问
  • 手机APP