导读 4月3日晚上,盘算机科学家、天然语言模子专家吴军,就人工智能和ChatGPT等当下热议的话题作了一次直播分享。 吴军,毕业于清华大学和约翰霍普金斯大学,盘算机专业博士,前Google高级资深研究员、原腾讯副总裁、硅谷风险投资人。 为何ChatGPT没有出如今中国?吴军表现,其“硬件本钱就要差不多10亿美元”,一样寻常的科研机构做不成,更不消说研究水平的标题。 吴 军|演讲 ChatGPT的出现,为什么会引起恐慌?我知道,近来ChatGPT这事儿在中国很火,很多人在讨论,但很故意思的是,着实这件事在美国,已经没有太多人去品评这个话题了。着实不光是ChatGPT,往前看十年,其时很多新技能出现的时间,我就发如今中国媒体上讨论的热度要远远高于美国。固然谁人技能着实重要出如今美国,但是中国人老百姓对此更关心。我以为这是一件功德,但也是一件坏事。 这个“坏”在于,这些技能实际上是被太过的炒作了,在这个过程中,有很多乘虚而入的人从中赢利。就比如说区块链,其时炒得那么热,但如今这个事已经很少有人讨论了,对吧?这是第一个。第二个就是元宇宙,如今美国只有 Facebook一家还在对峙做。那到了中国,很多人就在讨论说,我们是不是未来会生存在一个完全捏造的天下。末了,大概客岁底到本年初,Facebook在这个范畴几百亿美元投下去,一个响也没听着,末了开始了大规模的裁人。到了如今,被热炒的一个话题就是ChatGPT,有的人高兴,有的人恐惊,另有我如今也看到在中国另有很多人在乘虚而入,试图再割各人一次韭菜。 在讲ChatGPT是什么从前,我先给各人讲一个汗青故事,这汗青故事你听起来你就会发笑,但是你转头看,本日很多人的表现也是云云。 1503年,哥伦布的儿子记下来的这么一件事儿,哥伦布往西飞行,去往新大陆,效果飞行到中途,到了牙买加这个地方,船上就没吃的了。于是,哥伦布和海员只能寄盼望于本地人来提供饮食。但是,提供了几天以后,海员就跟本地人发生了抵牾——有些海员偷了本地人的东西,以是本地人就断了饮食的供应。 为了摆脱这个逆境,哥伦布想到了一个妙招。哥伦布其时随身带着一本万年历,在日历上标着说某年代日会出现日食、月食等等全部这些信息。哥伦布其时就把本地的部落首领找来,说你们不给我提供食品,已经得罪了天主,天主会发怒,玉轮就会变红,然后天主就会把玉轮收走。 固然,我们如今根本上都知道,在月全食发生的时间,也就是地球还没有完全挡住玉轮的时间,玉轮确实是红的,就是我们所谓的“血月”。但是,其时的牙买加人并不知道。效果,到了晚上,牙买加人就发现,玉轮果然变红了,然后逐步地就一点点消散了。本地人就陷入了恐慌,各人纷纷说,天重要处罚他们了。 这个部落首领匆忙去求哥伦布,允许允许哥伦布的全部条件。哥伦布就说,好,我去帐篷里向天主祷告,让他不处罚你们,但是我须要一点时间,然后哥伦布就走进了帐篷。着实,进了帐篷之后,哥伦布就是拿着一个沙漏,在看谁人计时。 本日咱们有天文学知识,肯定知道月全食的时间,也就会维持大概48分钟,到时间玉轮就会重新出现。但是,这些牙买加人不知道。他们看到的就是,哥伦布从帐篷里出来,玉轮也就出来了。然后哥伦布说,这是天主已经听了我的劝解,允许宽恕你们,但是你们必须要给我们好好地提供食品。以是,本地人千恩万谢,给他们不绝提供食品。 这个故事分析什么呢?月全食这件事,它的发生背后自有其缘故因由,但是在人们不知道这个缘故因由的时间,通常只能把这个天然征象归结为一个神的作用。而这个神,自己又是人创造出来的。也就是说,人自己创造一个神以后,然后趴在神的脚下,成为了他的奴婢。 这就是我为什么要给各人开《天下文明史》的课程。 着实这个文明的发展过程,就是人类不绝熟悉天然规律的过程。我们一点点的进步,为的就是让如今的我们不再像本地的土著人那样,盲目地信赖一个人向天主祷告真的可以制止玉轮消散。我们如今知道,在日食月食的背后,实际上是开普勒行星的三定律在起作用,然后在开普勒行星三定律背后是牛顿的万有引力定律。人类搞清晰这个缘故因由以后,对天然就不再仅仅是畏惧了,我们可以利用天然规律做很多很多变乱。 ChatGPT的技能底子是什么?从汗青回到如今,着实ChatGPT的情况也差不多,背后是一个叫做语言模子的一个数学模子在发挥作用。换句话说,ChatGPT的背后是一个数学模子。在本日,这项技能显得很强大的缘故因由重要是三个: 第一,它用到的盘算量很大; 第二,它的数据量很大; 第三,本日训练语言模子的方法比从前要好很多。 那么,语言模子是什么呢?大概说它是一个什么期间的产物? 它是1972 年,由我的导师贾里尼克(Fred Jelinek)领导团队研发的一项技能。详细地讲,是他其时在IBM带着人来完成的一项技能,是用来权衡一句话大概一个语言征象有多么的大概产生。那它有什么用?它最初的用处是做的语音辨认,厥后是做呆板翻译,再厥后是做盘算机问答,也就是我们本日熟悉的答复标题。 其时它就可以做择要,比如举一个例子,有一篇一万字的文章,那么你怎么择要出十句话能概括这一篇文章的内容,这对于做这个天然语言处置处罚的人来讲,就是一个数学标题。也就是说,你的条件是什么?条件是这一万个字,然后你想得到的效果是什么?效果大概就是十句话,一百个字。然后这里头有很多种组合,你可以恣意挑几个句子,也可以把有的句子拆成两段,把背面那些不太紧张的修饰大概形容的部门去掉。然后,你也可以把两个句子合成一个句子,那么你在合成一段文本的时间,这个盘算机就会盘算一个概率,哪些句子合成在一起的概率比力大,它会按照概率帮你合成。 而我们本日看到的ChatGPT,就是这个大的语言模子,它就是会挑一个概率最大的、最有大概发生的如许一个文原来给你看。以是总体来讲,ChatGPT天见效果的过程,是一个用大量的盘算资源来盘算的过程。它须要非常巨大的数据量来支持,有很多很多的GPU(电脑处置处罚器)。没有这些东西的话,ChatGPT是做不起来的。 而且本日这个ChatGPT,着实不光是技能,另有很多人工在背后。他们还雇了一家公司,专门负责考核ChatGPT产生的效果。比如说,ChatGPT产生了一百篇择要,都挺好,我已经分辨不出来了,那么这些人就负责帮我分辨一下,到底哪一篇更像是精确的择要。 那实际上,你可以看到,ChatGPT背后就是一个语言模子,而这一语言模子的技能是1972年就已经有了的。到如今,颠末了五十年,如今行业内着实各人并不以为它是一个什么了不得的东西。在此从前,这个语言模子着实已经做了很多的变乱。 提到“语言模子”(language model)这个词,最初是由我的导师贾里尼克提出来的。他大概在1993年的时间到了约翰霍普金斯大学,我是1996年到这个大学,然后成为他弟子。那么这个词的中文,也就是你看到的“语言模子”这四个字,则是我在20世纪90年代的时间发表论文时间创造出来的。其时,只有我们这些圈内的人知道它能做很多事,但是你不会想到说,哎,这个过厥后会被热炒。 你可以如许明白,“语言模子”之于ChatGPT,就相称于开普勒的这个行星三定律之于月食。 “语言模子”诞生之初是什么情况?那么在发明的其时,语言模子是一个什么情况? 着实,在20世纪90年代的时间,用简单统计方法得到的模子很不精确。这就相称于,我打个比方,你观察行星,但用的是托勒密的地心说来推测,是很不精确的。以是,其时间我们开始引入了语法、主题、语义的很多信息。然后,这个语言模子就变得很复杂了。复杂之后就又带来了一个很大的标题。 什么标题? 比如,我其时做过一个很复杂的语言模子,这个语言模子其时有多少参数?600万个参数,就是说,这个语言模子巨细根本上按这个参数来定。我其时间做的已经是谁人期间能做的最大、最复杂的语言模子了。我其时用的还不是PC机,而是20台超等服务器,然后大概算了三个月才训练出如许一个语言模子。以是你看,它的盘算量黑白常大的。那么,第一版ChatGPT,它用的语言模子参数是多少呢?大概是 2000 亿个参数,各人可以看到这些年的变革。 以是,本日很多人问,ChatGPT在美国出现了,中国研究机构什么时间能做ChatGPT?着实,中国的大部门研究机构是做不了的,不是说研究水平的标题,而是由于ChatGPT太耗资源。本日的ChatGPT,大概光硬件的本钱就要差不多10亿美元,这还没算电钱,以是本钱和耗资黑白常巨大的。以是,如果开完打趣,问ChatGPT的最大贡献是什么,我倒以为它对举世变暖是有很大贡献的。 以是,我想说的是,ChatGPT这件事,它的原理很简单,但是在工程上要想做到,着实是蛮困难的一件事。 盘算机善于答复什么标题?到了大概2010年前后,也就是13年前,语言模子能做到什么水平?我给各人看两个例子。这两个例子都是我在2014年脱离Google从前做的。其时我负责的是Google的自动问答体系,就是让盘算机答复标题。不外由于这个产物是英文的,以是在中文天下根本上没有太露脸。 我给你看一下谷歌答复的一个标题——为什么天是蓝色的,why is the sky blue? 它的答复是如许的:太阳光透过大气层到达地球时会发生折射,氛围中的气领会让差别颜色的光散射到各个地方,蓝光波黑白,比其他颜色折射率高,以是看上去天是蓝色的。 这是其时盘算机产生的一个答案。公平地讲,这个答案比我自己写一段答案写得要更好,由于要表明这征象,你要知道不少物理学知识,而且这个句子看上去也挺通情达理的。而本日人们利用ChatGPT的一个目的,就是让他答复标题。 这内里,我给各人做个拆分。 着实,我们问盘算机的标题可以分为两类,第一类叫做简单标题,第二类叫做复杂标题。简单标题就是关于究竟的标题,比如某某明星是哪儿人,哪一年生的。这都是一些容易的标题,由于它是究竟,有明白答案。 第二类是复杂标题,这也是各人以为 ChatGPT 非常惊艳的地方。它能整合信息,答复天为什么是蓝色的,似乎它自己有逻辑一样。再有一个,就是问过程的标题,比如说我怎么烤蛋糕,你能不把一步步写下来?本日我们问ChatGPT怎么烤蛋糕,它可以把这个过程给你写得很详细,多少杯水,加多少个鸡蛋,加多少面粉等等,它都可以告诉你。然后你根据它提供的答案,就真能烤出蛋糕,而且烤得大概还挺不错。 这是各人以为很了不得的地方。但是你要知道,这件事,在2014年着实盘算机已经做到了,而且做得很好。以是,这项技能自己并没有太多秘密的地方。 盘算机和人,谁更善于写作?如今,各人热议ChatGPT,另有一个缘故因由就是以为它能写作。比如说写一个工作简报,这是本日美国人用ChatGPT用得最多的地方。我这周干了1234567,这七件事,哎,你看我就不消自己费劲地写了,我让ChatGPT天生一个,然后再编辑一下子就可以了。 但是,盘算机写作这件事,着实你说难也难,说容易也容易,我可以给你举个例子。 在2014年我脱离Google之后,其时不太做编程了,不外其时间我另有一些盘算资源,以是我自己在空闲时间会写一些步调,做着玩。其时呢,我就让盘算机写了两首诗,各人可以读一下这两首诗。 第一首诗是个五言诗,这是用我的话说,叫做李白风格的一首诗,各人可以读一下。这首诗就是盘算机自己写的。实际上,你如果读一读,这个诗里还真有一些李白的这个特点。 那第二首诗,我也把图片放在下面了,你可以看一下。 先说一下,由于古诗都有平仄一说,但是我们如今的读音和其时的读音不一样,以是我们也没去管这个平仄到底合不合古,但是这个我们单从它的内容意境来讲,你读的会以为很顺畅。 好,那么话说返来。第一首诗怎么做的? 着实再简单不外了,你就把李白的诗放到盘算机里。李白诗一共1000 多首,也就一万来句话,这个对盘算机来讲太简单了。它写的时间,就是把句子分拆开来,拆成两个字、三个字一组,比如“空愁”这是一组,“忆长安”这三个字一组。然后它就去拼刚才我讲的语言模子,算概率,哪个概率最大;拆完了以后,我就跟他提一个要求,说要写一首忆长安的诗,它就分列组合,天生出这个《忆长安》,实际上就是这么拼集出来的。第二首诗稍微复杂一点。 但你知道这两个步调我写了多长时间?两天。这分析什么呢?分析你让盘算机写出一些还挺像样的东西,着实不是一件很困难的变乱,它没有你想得这么秘密,大概说盘算机写作自己没有这你想得这么秘密。 那为什么这两首诗看起来特殊好?由于这是唐诗,唐诗的格式是固定的。同样的原理,为什么用ChatGPT写周报写得好?由于周报的格式根本上是拉清单,那也是个固定的格式。包罗,如果你读《华尔街日报》中文版,这里头我跟你讲,90%的内容都是盘算机写的,只是你不知道。写完了以后人固然要给它一个主题,然后给它写的第一段话写个引子,然后给一个总结,起个标题,这是人要做的。 为什么写财经文章比力好?由于它有很多多少的事着实里头,格式也是固定的,以是这件事它做起来就很好。 我花这么长时间来讲ChatGPT的配景,实际上就是想说它并不秘密,不是一个什么很高深的呆板在背后。一方面,ChatGPT依赖的是一个数学模子,而这个数学模子1972年就有了,只是本日它的盘算本领非常强,靠蛮力盘算。 那么,ChatGPT训练一次要耗多少电?大概大概是3000辆特斯拉的电动汽车,每辆跑到20万英里,把它跑死,这么大的耗电量,才够训练一次,这个非常费钱的一件事。 ChatGPT对我们到底有什么影响?那么接下来讲讲,ChatGPT对人有什么影响。 这就要回到汗青上来看了,每一次技能革命,着实它对人都会有一些影响。不外,ChatGPT它不算是一项新的技能革命,由于这我刚才讲了,这个过程很长,从20世纪70年代到90年代,我们做了很多事,90 年代到如今又有很多人做了很多事。这里头最大进步着实不是这个语言模子自己,实际上是厥后2000年左右产生的深度学习,使得训练语言模子能比从前精确了,不是简单的做统计。 本日训练语言模子早已经不是简单做统计了,这才是ChatGPT能产生比力好的效果的一个缘故因由。 至于说ChatGPT对人能产生什么样影响,这个标题我先不直接答复你,我先问你,刚才给各人看这两首唐诗,你有没有发现一个什么特点?对了,这两首诗写得不错,但是你原来对唐朝相识,不会由于多了这两首诗会有更新的相识。由于,ChatGPT它某种水平上有点像鹦鹉学舌,你先要说一段话,它才华跟着学。它说出来的声音大概很好听,但是它并不提供更多的信息。 本日互联网上90%的内容都属于这一类——不提供更多的新信息,也不是原创内容,也不是自己的感悟,无非是东抄抄,西凑凑。如今,抖音、快手这类短视频,我以为99%的内容都属于这一类,没有营养,你读完以后大概以为挺故意思,但实际上你在上面读了再多,着实对你没有任何资助。 如果说ChatGPT真的威胁到了谁,我以为威胁到的就是这一类人的工作,就是说这个抖音上头谁人做短视频的,大概发布一些内容的,ChatGPT会做得比他们好很多。你就想如许一件事儿,假设说,有一群人每天把那唐诗三百首里头的句子翻来覆去的捯饬,也能捯饬出一些诗,那么ChatGPT捯饬起来肯定比人快得多,以是这项技能会对这一批人会有影响。 那么,什么人不会受到影响?就是内容创造的人不会受影响。 为什么我会这么讲?还记得刚才我说的“为什么是天是蓝色的”这个标题吗?Google为什么能答复这个标题? 由于在Google举行答复的时间,它大概把其时英语险些全部的像样的句子都做了分析,大概有1000 亿句英语句子。那么实际上你会发现,在一些大学的网站上和NASA的网站上,它就有这个答案,只是我们把它拼拼集凑,删删减减,就把它挑出来了。但是最早的物理学家做这项研究,把这个原理搞清晰,这个工作是故意义的,也是ChatCPT取代不了的。 以是,ChatGPT的工作相称于什么呢?举例子,托勒密创造出这个模子以后,那么每过一段时间,他们欧洲就会编一个大概几十年的一个日历,然后上面标上哪天有日食,哪天行星会怎么活动等等。那么人们根据这些规律,印很多多少本这个书,这个ChatGPT就相称于有很多多少本书,你拿着以后一看,说,喔,某年代日会发生月食,答案就会很清晰。但是,背后真正故意义的工作不是印这个书,而做托勒密的谁人研究。 以是我以为,从汗青上看ChatGPT着实不算是一次技能革命,它影响到的都是谁人比力懒的人,懒得动头脑,创造新东西的人。真正探索人类知识奥秘的人,是不会被取代的。 ChatGPT对我们到底有什么影响?很多人问说,ChatGPT有什么新机遇?坦率来讲,你没机遇,由于太耗资源了,你耗不起。那么什么人可以大概受益?那就是卖资源的这些人。 我可以打个比方,就是说在这个加州淘金热的时间,很多人蜂拥而至,去淘金,单我们到本日为止还不知道哪一个淘金者真的挣得着钱,没一个人把名字留下来。但是末了谁挣着钱了?是卖水的人和卖牛仔裤的人。ChatGPT也是一样的原理。各人跟着一起去淘金,着实你是挣不着钱的,但是在过程中,你还不绝地要买水喝,买牛仔裤穿,末了就是这两拨人挣到钱了。李维斯Levi's,就是其时间产生的这么一个公司,它就是做牛仔裤的。 那么末了你大概是给几家大的做云盘算的公司在交钱,这大概是一个效果。 好了,讲完了这个ChatGPT的汗青,我给你做一个简单的总结。 第一,不要恐惊。 本日是很多人恐惊ChatGPT,就犹如不要像当年哥伦布碰到的牙买加土著人恐惊月食,一样的原理。 第二,不要委曲去找所谓的机遇,该怎么工作就是怎么工作。 我看有同砚问我,说苹果为什么这个不做ChatGPT,我说这就对了!这就是为什么苹果是天下上最有钱的公司,利润最,市值最多。如今,很多所谓做这种人工智能的公司到如今都在亏钱。以是,这也是为什么很多同砚偶然候问很多太不着调的标题的时间,我就开顽笑地问他说,你的房贷还清了吗?你要没还清,你就好好归去工作,把工作做好,这才是对各人最故意义的变乱,从汗青上看也是云云。 第三,你要看透这些所谓的诡计家大概想割你韭菜的人的那些把戏。 就是说,如果再来一个人冒充哥伦布说他是神的代表,然后他能祷告上天能让这玉轮出来,你不要信。以是你须要相识ChatGPT背后的一些科学原理。最简单的一些原理,像本日我讲的这些,你还是须要有所相识。 注:本文来自吴军博士在“得到”上的分享。 |

专注IT众包服务
平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全
交易资金托管平台,保障资 金安全,确认完成再付款

实力商家
优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管
交易过程中产生纠纷,官方100%介入受理,交易无忧

微信访问
手机APP