科技信息

这匹中国大模子黑马，让扎克伯格破防了！

DeepSeek用实例给风投们上了一课，不消高薪约请拥有浮夸头衔的资深从业者，以免费的AI开源项目为底子，利用有限资源同样可以大概做出一流的AI大模子。撰文丨周隆斌1月13日，美国拜登政府在卸任前末了一周出台了《人

DeepSeek用实例给风投们上了一课，不消高薪约请拥有浮夸头衔的资深从业者，以免费的AI开源项目为底子，利用有限资源同样可以大概做出一流的AI大模子。

撰文丨周隆斌

1月13日，美国拜登政府在卸任前末了一周出台了《人工智能扩散暂行终极规则》。

这份规则将环球各国和地域分别为3个品级，在获取美国开始辈的AI芯片时，分别接受不同级别的限定。让人非常不渴望看到的是，中国被分别进了最严酷的三级管控，数据中央将被全面克制入口尖端AI芯片。

这项规则是否施行，将在120天的公众意见征询期后再行商讨。不外，显而易见的是，美国政府试图通过行政手段干扰环球芯片和AI行业正常发展。

AI技能中蕴藏着无穷潜力已经被广泛证实，尖端AI芯片更是训练模子时必不可少的底子。在获取算力资源难度加大的配景下，国内AI行业的出路究竟在何方？

近期，被称作“AI界拼多多”的国产AI大模子——DeepSeek（深度求索），用有限的算力资源，给出了一个办理方案。

01

有起错的名字，没有叫错的外号。客岁底刚刚发布的DeepSeek-V3开源AI大模子，以史无前例的性价比，革新了环球AI行业的认知。

先来看看这个AI大模子的性能，DeepSeek在自家公众号中这么先容V3模子：

DeepSeek-V3多项评测结果逾越了Qwen2.5-72B和Llama-3.1-405B等其他开源模子，并在性能上和天下顶尖的闭源模子GPT-4o以及Claude-3.5-Sonnet不分伯仲。

简朴来讲就是，DeepSeek-V3已经成为现在环球最强开源大模子，可以与头部闭源大模子掰掰手腕。从测评效果上看，DeepSeek好像并没有吹牛，在百科知识、代码天生等场景中，DeepSeek-V3确实取得了第一梯队的结果。

不外，行业内的评测是一份公开试卷，完全可以有针对性地对模子举行训练。就像电脑的跑分测试，未必就那么客观。在实际利用体验上，DeepSeek-V3的数学和编程本领确实非常强，这也是评测的重点方向。不外，它在一些特别语境或者创造性头脑方面还是差点意思。

比方，向DeepSeek-V3扣问，香菇掉到了马桶中，那它还能被称作香菇吗？它只会一本端庄地给出回答，GPT-4o则是先点明这是一句幽默的提问，再举行回答。

对于将AI大模子看成搜索引擎的我来说，DeepSeek-V3是合格的。尽管在一些总结归纳上与GPT-4o略有差距，思量到后者的利用限定，我还是乐意将免费的DeepSeek列为首选AI工具。

令人想不到的是，DeepSeek-V3整个模子的预训练资本花费为557.6万美元，仅需GPT-4o的二非常之一。“低廉”的资本给了DeepSeek砸穿行业底价的勇气，开辟者调用DeepSeek-V3的付出只要GPT-4o的非常之一，性价比爆棚。

更加难能难得的是，DeepSeek-V3在训练时利用的GPU是英伟达的H800，一款在性能上被阉割的特供AI芯片。OpenAI手握上万块英伟达一流的AI芯片，乐意为其融资的投资者继续不停，资本从来都不是他们思量的第一要素。

厥后者大部门以OpenAI为标杆，AI大模子只有砸钱、砸算力才气做出来的观念在行业中深入民气。正因云云，花小钱办大事的DeepSeek才让一众硅谷大佬们惊呼这是“来自东方的秘密力气”。

扎克伯格在谈到DeepSeek时，有数地体现：“他们的技能真的很不错，这个模子非常先辈。（在AI大模子范畴）中国正在努力冲刺，我们当然该支持美国的公司。实际上，这是一场差距很小的竞争。”

02

早在客岁5月，DeepSeek发布DeepSeek-V2模子时，超低的代价就引起了AI大模子贬价的血雨腥风。彼时DeepSeek尚未推出头向消耗者的应用，大众着名度远没有现在这么高。

直到客岁12月26日，DeepSeek-V3推出网页版后一夜爆火，月度访问量迅速突破千万。与大模子一同发布的，另有一篇53页的论文，详细先容了DeepSeek-V3模子的技能细节，将怎样用有限资源举行模子优化的计谋全部公之于众。

DeepSeek接纳的告急技能总结下来有三点，创新的模子架构、高效的训练技能以及优化资源利用。我认为，此中MLA（多头埋伏注意力机制）架构最值得称道。DeepSeek将用户使命分解为多个子使命，由不同的专家模子分别处置处罚，再将各专家模子的效果汇总输出效果。

这就意味着，大模子在接到用户需求时，不消变更全部资源举行处置处罚。提升模子运行效率的同时，明显低沉了运行资本，有种“专人专办”的感觉。

假如过细研究DeepSeek的办理方案，会发现DeepSeek更多是在举行“工程创新”。它固然没有创造出一套全新的技能，却改进了业内原有的模子训练方式。

有人认为业内对于DeepSeek的评价有些过高，它只是对原有技能举行了优化。如许的见解显然太过关注技能层面，而忽略了AI行业无穷光明远景的背后，是有些昏暗的实际。

已往一年中，环球科技公司险些都铆足了劲在AI项目上发力，环球AI初创公司如雨后春笋般冒出，“用AI重塑全部行业”的标语喊得震天响。然而，摆在全部企业面前的窘境是，AI贸易化路径并没有被完全买通。

对于传统企业而言，假如必要AI大模子为业务赋能，选择开源模子举行微调，定制专属大模子试错资本更低。广大消耗者为AI功能付费的意愿也不高，大部门用户都是“白嫖党”，尚且属于造就用户风俗的阶段。

就连作为AI行业的领军企业OpenAI至今都尚未实现红利，很大一部门缘故原由在于尖端AI模子的训练耗资惊人，运行资本也非常高昂。据测算，仅维持ChatGPT的运营，天天资本就高达70万美元。OpenAI首席实行官山姆·奥特曼则体现，未来的AI模子资本预计将凌驾10亿美元。

《纽约时报》获得的融资文件表现，OpenAI 2024年预计收入到达37亿美元，但预计亏损也将到达50亿美元，而2026年亏损大概会高达140亿美元，这一估算还不包括给员工的股票鼓励兑现。

可以说，高度依靠融资的OpenAI在破产的边沿反复摇晃。假如来日诰日投资界厌倦了看不到红利渴望的AI行业，OpenAI仅凭自身的造血本领，恐怕难以为继，其他AI初创企业更是云云。

如许的担心并非空穴来风，着名数据分析机构 CB Insights 发布的《2024年第三季度环球人工智能投融资陈诉》表现，2024年第三季度天生式AI范畴的投资额环比降落了29%，10亿美元以上的大额融资量环比降落77%。

任何生意业务的核心都是资本与收入的平衡，DeepSeek为AI行业提供了一种极新的思绪，既然收入端临时难以大规模提升，不妨先从资本端发力。大概DeepSeek在技能上没有多么震天动地的创新，却让国内AI行业看到了一丝在夹缝中生存的大概性，也为环球AI行业恒久存续提供了新范式。

DeepSeek的成功离不开前辈们技能开源的支持，DeepSeek也乐意将本身的结果以开源的方式反哺整个行业。在通往AGI（通用人工智能）的漫漫石阶中，DeepSeek刻下了属于本身的名字。

03

低沉资本这件事并不是什么精妙的点子，更是中国企业最善于的事情。为什么从百度、腾讯、阿里这些互联网大厂，到月之暗面、智谱AI、零一万物等号称中国大模子范畴“六小虎”的创业公司，没有一家可以大概提早想到呢？

假如深入了解DeepSeek这家公司后，就会发现这绝非偶尔。

DeepSeek在V3模子发布前相当低调，模子发布后也没有如国内偕行一样，铺天盖地地打广告，着名度更多来自于用户们口口相传。但假如说到它的全资母公司幻方量化，股民朋侪们肯定非常熟悉。

幻方量化，迄今为止国内唯一规模曾经凌驾千亿元大关的量化私募。根据私募排排网数据表现，幻方量化的代表产物九章幻方中证500量化多计谋1号，从2017年1月19日成立至今（2025年1月10日），累计收益率凌驾300%，年化收益率到达19%，与巴菲特年化收益率的20%非常相近。

ChatGPT 3.5问世时，业内测算想要做出这种级别的大模子，至少必要1万张英伟达A100芯片。彼时环球算力比赛尚未正式开启，国内拥有万卡算力的公司，满打满算也就6家，百度、腾讯、字节、阿里、商汤，另有一位手握入场券的正是幻方量化。

DeepSeek由幻方量化首创人梁文锋一手开办，固然公司成立时间是在2023年7月，但DeepSeek项目在幻方内部已经孵化好久。

2021年幻方量化私募规模破千亿元时，梁文锋选择主动低沉管理规模，停息旗下全部产物的申购，并免除全部基金的赎回费用。现在，幻方量化的管理规模已降至200亿-300亿元。

彼时外界险些没有任何人能明白梁文锋的决定。主动低沉管理规模固然有行业监管趋严、市场风险等客观因素，但很少有私募基金会和送上门的钱过不去。以幻方量化其时的体量和名气，不说业绩提成，单是管理费每年都能躺赚数十亿元。

现在看来，大概梁文锋早就看到了AI技能爆发的曙光。梁文锋在接受采访时提到：“我们的出发点，就不是趁机赚一笔，而是走到技能的前沿，去推动整个生态发展。中国也要渐渐成为贡献者，而不是不绝搭便车。”

04

DeepSeek这家公司的企业文化也非常独特。其他国内科技企业风俗重金约请行业大佬，DeepSeek的团队则非常年轻化。

据梁文锋本身透露：“我们的核心技能岗位，根本以应届和结业一两年的人为主。”就连公司的管理层，也都是一些结业5年左右的年轻人。当然，这些年轻人没有很深厚的工作配景，却也都是国内一流院校的天之骄子。

DeepSeek内部接纳扁平化管理模式，每一位员工的想法都会得到充分恭敬。只要有新点子，不论职级，在颠末内部讨论后，都可以变更公司资源举行项目研究。DeepSeek-V3的MLA架构，最初正是由一位年轻研究员的个人爱好所诞生。

除此之外，背靠幻方的DeepSeek是业内有数的不依靠外部融资生存的初创公司。没有投资人给的压力，贸易化自然也不是DeepSeek的首要使命。以是直到V3模子之前，DeepSeek都没有选择上线面向大众的产物。大概是偶合，OpenAI的ChatGPT也是迭代到3.5版本，才选择公之于众。

成员年轻化，组织结构扁平化，不以贸易化为首要目的，这统统组合在一起，使得DeepSeek在行业中显得格格不入。梁文锋主动跳出私募行业的舒适圈，领导一群压根没有找到本身舒适圈的年轻员工，开辟出了一条未曾假想的门路。

有人说，DeepSeek闪亮登场，用少量算力资源训练出超强盛模子，英伟达慌了，芯片要卖不动了。然而，DeepSeek提供的是一种现有大模子训练的优化方案，要想告竣AGI光凭现有技能肯定是不敷的，下一代大模子还是要仰仗算力堆砌。

真正应该慌的，是那些AI初创企业们。

正如小米造车前，雷军操持5年投入1000亿元。没想到研发、建厂、营销一系列开支下来，仅花费300亿元，第一款车型小米SU7就火爆天下。国内投资圈这才明白过来，那些砸进去大几百亿比年亏损，毛利率转正都难的造车新权势们有多无能。

DeepSeek同样用实例给风投们上了一课，不消高薪约请拥有浮夸头衔的资深从业者，以免费的AI开源项目为底子，利用有限资源同样可以大概做出一流的AI大模子。

没有对比就没有伤害，其余AI初创公司的精美PPT中，究竟有多少是高管给投资人画的大饼，无数轮募资中拿到的钱是不是用在了刀把上？DeepSeek论文发布后，不知道有多少AI初创公司的高管正在连夜开会，琢磨新的说辞。

在中美AI比赛中，DeepSeek以业界黑马的形象出现，给硅谷带来了一点小小的中国震撼。作为一家以量化生意业务发迹的中国公司，DeepSeek并不被视为技能引领者，但它在有限的算力资源条件下，却依然可以大概做出令整个AI行业为之侧目的技能创新。

这也让众人看到，在这场出息未卜的AI大比赛当中，中国公司仍然有很大时机，联合自身上风，在先辈AI范畴拥有本身的话语权，进而迸发出改变天下的力气。

*本文为冰川思想库原创文章，未经授权克制转载，否则追究干系法律责任

收藏邀请

上一篇：光彩内网闪现CEO赵明辞职公告，华为系副董李健接任下一篇：TikTok灾黎涌入，带火了AI手机

我有任务需求要发布

专业服务商主动承接

快速解决你的需求

我要发布

专注IT众包服务

平台只专注IT众包，服务数十万用户，快速解决需求

资金安全

交易资金托管平台，保障资金安全，确认完成再付款

实力商家

优秀软件人才汇集，实力服务商入驻，高效解决需求

全程监管

交易过程中产生纠纷，官方100%介入受理，交易无忧

时代威客APP

时代威客公众号

时代威客小程序

猜你需要

热门需求

这匹中国大模子黑马，让扎克伯格破防了！

01

02

03

04

今日头条

热门资讯

优

快

专

保

新手帮助

平台规则

关于时代

便捷服务

微信小程序

新浪微博

手机客户端