快捷导航
科技信息

半导体资深分析师:英伟达就像“三头龙”,环球70%AI工作依靠其芯片

划重点:英伟达在AI工作负载市场占主导职位,这得益于其在硬件、软件和网络方面的“三头龙”战略。谷歌、亚马逊、Meta以及微软等巨头连续投资数据中央,表明“规模扩张”并未过期。英伟达依然在AI芯片范畴占据主导职

划重点:

  1. 英伟达在AI工作负载市场占主导职位,这得益于其在硬件、软件和网络方面的“三头龙”战略。

  2. 谷歌、亚马逊、Meta以及微软等巨头连续投资数据中央,表明“规模扩张”并未过期。

  3. 英伟达依然在AI芯片范畴占据主导职位,来自AMD、谷歌以及亚马逊的挑衅短期内难以撼动其王座。

  4. 帕特尔预计,2025年半导体市场将继续增长,但2026年存在不确定性,模子连续改进、资金连续涌入是关键因素。

半导体研究与人工智能范畴的着名分析师迪伦·帕特尔(Dylan Patel)

12月25日消息,在美国本地时间周二上线的Open Source双周对话播客中,半导体研究与人工智能范畴的着名分析师迪伦·帕特尔(Dylan Patel)担当了专访。访谈中,帕特尔谈到了英伟达在行业中的主导职位及竞争上风、在扩大AI预训练规模时所面对的挑衅、数据中央底子办法的发展与资源付出策略、合成数据的天生技能、推理时间盘算的本钱效益分析、英伟达当前所面对的挑衅,并对将来一至两年内的行业远景举行了预测。

(编者注:帕特尔是半导体研究与咨询公司SemiAnalysis的首创人兼首席分析师,在半导体范畴内具备广博的专业知识与广泛的行业影响力,他因对芯片产业透彻的洞察力和精准的预判能力而著称。SemiAnalysis专注于半导体供应链的研究,业务覆盖化学质料、芯片制造、晶圆厂运营、设计知识产权管理以及战略规划等各个环节。SemiAnalysis的子栈平台汇聚了约莫5万名用户,是环球第二大技能子栈。)

本文整理了迪伦·帕特尔主要观点如下:

01 英伟达就像三头龙

英伟达在环球人工智能工作负载范畴占据着压倒性上风,若不计入谷歌,环球98%的人工智能工作负载在英伟达芯片上运行。但在纳入谷歌后,该比例下降至约70%,这主要是由于谷歌在人工智能,尤其是生产工作负载范畴,占据了极大的市场份额。

英伟达之所以能在人工智能范畴占据主导职位,帕特尔以为可以将其比作三头龙。起首,相较于世界上其他半导体公司,英伟达的软件气力(CUDA生态)非常强大。其次,英伟达的硬件性能也远超多数偕行。英伟达之所以可以或许快速引入新技能,是由于他们始终致力于实现特定的生产目标,从芯片的设计构想到最终摆设,速率都远超竞争对手。末了,英伟达在网络范畴也显现出了强劲的气力,他们通过收购Mellanox,进一步强化了自身的网络能力。这三方面上风的团结,使得英伟达就像三头龙,让其他半导体公司难以望其项背。

值得一提的是,英伟达的竞争壁垒每每被低估。他们独创了NVLink架构,可以或许高效地将多个芯片毗连在一起。如今,英伟达的Blackwell体系备受瞩目,它不光是一个GPU机架,更是一个集成了成千上万电缆和复杂组件的巨大要系,重量高达三吨。

然而,英伟达也面对着挑衅。人工智能工作负载巨大且本钱高昂,对于大型客户而言,付出可能到达数十亿美元。这意味着客户有可能投入资源研究怎样在其他硬件上运行本身的模子。虽然在其他硬件上举行训练可能仍旧具有挑衅性,但在推理方面,客户可能更轻易找到替代方案。

02 “缩放定律”依然有效

帕特尔表明称,预训练的缩放定律原理相对直观:增长盘算资源并合理投入模子中,通常就能提升其性能。这一过程可细分为数据和参数两个维度,且存在一个最优比例以实现最佳缩放结果。

但在数据稀缺或难以获取的情况下,单纯增长模子参数并不能带来明显收益。从对数图来看,每次性能提升均需十倍投入。因此,在数据不敷的情况下,增长资源投入可能无法得到预期收益。然而,数据天生技能仍处于初级阶段,将来发展潜力巨大。

帕特尔预计,我们或将在将来六个月至一年内见证模子性能的明显提升,这得益于合成数据天生技能的快速发展。只管当前在盘算资源投入上已相当可观,但我们尚未将数十亿美元用于合成数据天生、功能验证和推理训练等范畴,目前仅投入数百万至数千万美元。

随着规模的扩大,新的资金投入方向将涌现。同时,测试时的盘算需求也将增长,即在推理过程中投入更多时间以得到更优结果。许多实验室研究人员以为,由于这一新方向的解锁,将来一年或六个月的收益将更为明显。

这依然是规模化发展的表现,由于这一过程须要巨大的盘算量。天生的数据量远超网络上现有的数据,只管大部分数据会被舍弃,但天生的数据量之大足以支持模子的连续运行。

03 “规模扩张”并未过期

当我们审阅环球数据中央的发展动态时,不难发现微软、谷歌、Meta和亚马逊等巨头在数据中央上的投入堪称惊人。从电力供应情况、羁系文件到卫星图像等诸多迹象,都可以清楚地看到这些公司在数据中央建立方面正加速步调。

对于“规模扩张已死”的论断,这些公司的现实举措无疑给出了最有力的反驳。比方,Meta正在路易斯安那州建立大型数据中央、亚马逊、谷歌和微软也在多个所在建立吉瓦级的数据中央,而且它们为毗连这些数据中央不吝斥资数十亿美元购买光纤网络,这些都证实它们对规模扩张的信心。

超大规模公司在数据中央范畴的连续巨额投资,不光彰显了“规模扩张”策略依然生气勃勃,而且这一策略正朝着更高效、更高性能的规模化方向演进。数据中央的发展不再单纯追求数量上的增长,而是更加注重资源的有效利用和团体性能的提升。

值得留意的是,数据中央的建立并非毫无穷定。与GPU芯片供应相比,电力供应和空间资源成为了更为告急的制约因素。

04 推理时间盘算虽贵却值

在访谈中,帕特尔还表明确推理时间盘算带来的好处。

在推理时间盘算的过程中,我们无需再额外投入时间于模子训练,这有效低沉了训练本钱,只管推理本钱可能会有所增长,但如许的权衡是值得的。

以GPT-4为例,其训练本钱高达数亿美元,然而,它目前所创造的收入已远超这一数字。对于OpenAI而言,GPT-4的投资回报率极为可观。若能制止巨额的前期训练投入,并能在模子产生收入时立刻摆设,这无疑是一个极具吸引力的选项。

试想,若能提升湾区年薪30万美元的开发者服从20%,那么所带来的效益将是巨大的。若能将100人的开发团队精简至75人或50人,同时保持相同的工作量,乃至实现代码交付量的翻倍,那么采用本钱更高的模子也是物有所值的。相比之下,即便是价格昂贵的o1模子,在与4o模子相比时,也显得相对划算。

因此,拥有最好的模子固然紧张,但更紧张的是要有乐意为这些优质模子付出高额费用的企业或消耗者。毕竟,只有当有人乐意为这些模子买单时,我们才气确保它们的高额利润。而这些买单者,要么是企业,要么是消耗者。因此,帕特尔以为,在不久的将来,可以或许参加最佳模子竞争的市场参加者将逐渐缩减至少数几个巨头。

05 英伟达王座稳固

英伟达依然在人工智能芯片范畴占据主导职位,但正面对着来自定制专用集成电路(ASIC)芯片开发商、AMD以及其他公司的挑衅。

此中,AMD在硅工程范畴表现出色,乐成击败了英特尔,但软件方面存在短板。帕特尔指出,AMD在软件开发上投入不敷,缺乏GPU集群来支持软件开发,这与英伟达形成鲜明对比。英伟达利用内部超等盘算机集群开发并快速更新软件,包罗网络、盘算和推理软件。而AMD则忽视了软件和体系级设计的紧张性,过于依靠硬件竞争。

至于谷歌TPU,其在工作负载方面的排名领先。谷歌在芯片互连、与博通的合作、水冷技能及可靠性方面举行了工程优化,这些方面英伟达直到较近的时间才开始器重。不过,TPU仅在谷歌内部应用广泛,帕特尔以为谷歌应将更多软件开源。别的,TPU的定价也让用户望而却步。

亚马逊的芯片Tranium在硅质料、内存和网络方面与TPU相当,但服从较低,部分缘故因由是其与Marvell和Alchip合作而非博通,导致电缆本钱较高。

06 OpenAI等将继续烧钱促增长

在访谈末了,帕特尔对2025年和2026年半导体范畴的发展趋势举行了推测。

他以为,超大规模企业来岁将继续增长投资,网络装备厂商、ASIC供应商和体系供应商生态体系将受益,英伟达将带动供应链增长。新兴云盘算服务市场正在整合,80家相干企业中,可能只有五到十家能生存下来。

2026年英伟达销量是否会下降,取决于模子是否连续改进和超大规模企业是否乐意继续投资。假如模子改进且企业乐意投资,纵然单位销量不增,由于芯片性能增强和本钱上升,英伟达的收入仍可能大幅增长。

别的,中东、新加坡等地的主权财产基金和养老基金等资金来源可能会涌入半导体行业,推动公司继续增长和付出。竞争动态也可能导致这些公司更积极地付出,以制止被逾越。

帕特尔信任,像OpenAI、xAI和Anthropic如许的公司将继续筹集越来越多的资金,以保持增长势头。(腾讯科技特约编译金鹿)

收藏 邀请
上一篇:蚂蚁团体重大调解,付出宝再战“超等APP”下一篇:套壳AI公司,骗了850名员工和280只猫
我有任务需求要发布
专业服务商主动承接
快速解决你的需求

专注IT众包服务

平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全

交易资金托管平台,保障资 金安全,确认完成再付款

实力商家

优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管

交易过程中产生纠纷,官方100%介入受理,交易无忧

  • 微信访问
  • 手机APP