出品 | 虎嗅科技组 作者 | 丸都山 编辑 | 苗正卿 本文为《进击的AI巨头》系列第001篇文章,《进击的AI巨头》聚焦头部AI公司的最新动向,我们将连续追踪这些正在影响AI将来走向的核心到场者。本文聚焦于英伟达发布的H20 GPU 芯片。 一枚性能大幅缩水AI芯片,可能会让英伟达在中国挣上900亿。 7月5日,咨询机构SemiAnalysis发布报告称,英伟达在本年有望交付100万枚H20 GPU。 考虑到这是一枚阉割过,且性价比力低的“对华特供版”芯片,根本可以认定,这100万枚芯片将在本年全部流入中国大陆市场。以目前该型芯片1.2-1.3万美元的渠道订价来看,H20芯片可以为英伟达带来至少120亿美元的收入,已经凌驾了这家公司客岁在华总营收。 不外,H20在中国市场的现实环境,可能并没有如咨询机构预估的那般乐观。 一位服务器经销商向虎嗅体现,目前一台H20八卡服务器,订价约莫在120万元,而性能大幅领先的满配H100 NVLink版本的八卡服务器代价为270万元上下,而且是现货。 只管后者早早被列入克制对华出售的名单中,但在非官方渠道中,这款芯片的货源根本没有断过,以致在本年二季度H200开售后,这款芯片的代价还下跌了约10%。 “无论怎么看,H20的性价比都还是太低。”这位服务器经销商提到,即便是同国内的解决方案相比,H20都难言有多大的竞争上风。 “阉割版”,但还挺本心的?与同系列芯片不同,H20是一枚“赶工”性质非常显着的产物。 在客岁10月美国升级芯片禁令后,本来就被视为阉割版芯片的A800/H800,以致是消耗级产物RTX4090都被纳入禁令的管制范围。 但仅在一个月后,就有台湾地域媒体报道称,英伟达向代工厂下了H20芯片的订单。 在云云短的时间内,英伟达不可能重新操持一款芯片,最大的可能是基于既有型号举行有针对性的调解。 好比新规中取消了将“互联带宽”作为限定芯片的辨认参数,英伟达就将H20的HBM3显存容量拉高到96Gb,使显存带宽进步到4.0Tb/s;又好比新规新增了“性能密度”的限定,英伟达就向算力规格大砍一刀,使其理论性能仅为296TFLOP,相称于H100芯片的15%。 至于那些新规没有提到的,好比PCIe Gen5扩展卡、八路HGX,英伟达全部保留了下来。值得一提的是,H20尚有非常高的卡间互联速率,其NV Link带宽到达900Gb/s,很得当组建大规模集群。 但这些特性组合在一起,却形成了一个很尴尬的事实:在算力大幅减少的环境下,H20的BOM(综合硬件本钱)很可能跟H100齐平,以致高于后者。 缘故原由在于,存储颗粒不停是高性能计算卡本钱的“大头”,好比H100芯片中,HBM3颗粒的采购就要占到60%左右,而在H20芯片上,英伟达又不得不为其配备更高规格的显存容量,以弥补算力不敷的缺陷。 根本可以断定,H20在英伟达高性能计算卡中,属于利润率最低的存在。相较于1.2-1.3万美元的售价,与它同本钱的H100目前订价为2.5-3万美元。 从这个角度来看,H20算是英伟达的一款本心产物了。 英伟达天然不甘心于让一款单品拉低公司团体的毛利体现,但自客岁芯片禁令升级后,英伟达四季度在中国大陆的营收,从上一季度的40.3亿低沉至19.46亿,此中国区数据中央营收占比也从22%滑落至8%,英伟达急需用一款产物去稳住在中国的市场份额。 H20就是英伟达拿出的诚意之作,但还是谁人问题,H20的算力着实羸弱,这个硬伤无法被忽视。 华为或与之一战?现实上,英伟达曾在本年2月举行过一次官方调价,在调价之前H20芯片的代价为2.3万美元,只管英伟达体现贬价的缘故原由是“供货充足”,但云云大幅的代价调解,紧张缘故原由大概率还是销量没有到达预期。 “国内大厂根本不会考虑H20服务器,都是闭眼买H100,而那些体量相对小的厂商也以为有点划不来。” 有服务器经销商向笔者算了一笔账,现在H100的服务器单机租赁费用大概是8-9万元/月,而算力仅有前者六分之一的H20服务器代价为120万元上下,即便不考虑算力消耗的问题,厂商也须要购买6台H20服务器,才能与H100服务器相齐平。 如许一对比,H20固然是英伟达利润率最低的产物,但对于客户来说,着实称不上有性价比。 而对于英伟达来说,尚有一个不可忽视的因素是国内同范例竞品,好比华为昇腾910B。 与H20相比,910B在单卡算力(FP16)上险些相称于前者的一倍。相应地,910B代价也要高于H20,服务器经销商向笔者体现,目前910B的服务器代价已经凌驾170万元。 抛开代价,从现实体现来看,二者的竞争互有胜负手。910B强在算力和能效比上,H20则胜在软件生态与互联上。最直接的例子就是,H20兼容所有的英伟达H系列卡,而且具备极高的访存能力,在搭建算力集群时,可以或许更好地制止算力消耗。 固然,这个集群规模是有上限的,好比各地操持的“万P计算集群”,假如用H20搭建,那么0.15P单卡运算能力就意味着十万颗级别的GPU,组网难度极大。 别的一个值得关注的问题是,英伟达与华为谁能更加稳固地供应产物? 此前,就有业内人士向笔者提到过,对于那些急于购买搭建算力中央的厂商来说,H20可能是更现实的选择。 一方面,英伟达的软件生态更加成熟,厂商的适配工作量要小得多;另一方面,目前无论是政策还是资源方,都对于算力中央的芯片国产化率有肯定要求,910B的需求量非常大,相应地交付周期也比力长。 这一说法笔者也在服务器经销商处得到了验证,对方向笔者体现,“在英伟达调价前,行业内客户对于910B的咨询要宏大于H20,但现在也有客户对H20展现出了爱好,由于有充足的现货。” 风趣的是,二者可能并不是完全意义上的竞争关系,由于有业内人士向笔者体现,在他地点的公司,910B和H20被归为不同分级,在采购上并不辩论。 |

专注IT众包服务
平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全
交易资金托管平台,保障资 金安全,确认完成再付款

实力商家
优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管
交易过程中产生纠纷,官方100%介入受理,交易无忧

微信访问
手机APP
关于我们|广告合作|联系我们|隐私条款|免责声明| 时代威客网
( 闽ICP备20007337号 ) |网站地图
Copyright 2019-2024 www.eravik.com 版权所有 All rights reserved.


