快捷导航
财经资讯

DeepSeek,为何出自量化基金公司?

本文泉源:时代周报 作者:郭儒逸春节假期,泼天流量降到了DeepSeek的头上。大概一周多之前,DeepSeek还算不上太著名气,在大模子圈之外,外界对它大概多是一头雾水。然而短短几天,其就一跃成为业界顶流,并闯进了

本文泉源:时代周报 作者:郭儒逸

春节假期,泼天流量降到了DeepSeek的头上。

大概一周多之前,DeepSeek还算不上太著名气,在大模子圈之外,外界对它大概多是一头雾水。然而短短几天,其就一跃成为业界顶流,并闯进了公众视野。

因接连推出的两款大模子产物,DeepSeek在华尔街掀起风暴,美股科技股一度重挫。周二,英伟达单日蒸发近6000亿美元市值,博通和美光科技等芯片产业链股票也纷纷大跌。固然周三英伟达反弹涨近9%,但DeepSeek带来的生理打击并没消散。

“DeepSeek大模子在性能上比肩ChatGpt,大概意味着国产大模子实现突破,这对美股科技股造成了打击。”前海开源基金首席经济学家杨德龙告诉时代周报记者。在他看来,科技股是美股牛市的主要推动力,但投资者担心其估值产生巨大泡沫。若一些新技术突破或新模子不必要斲丧那么多的GPU,大概会引发像英伟达等公司的大幅下跌,从而导致美股科技股泡沫破碎。

作为一家建立不到两年的大模子公司,无论在融资、技术渴望还是舆论层面,DeepSeek不停都动静不大。而它背后的公司幻方量化(一家头部量化私募),在此之前也仅是在私募圈着名。出人意料的是,一家私募和一家大模子初创公司,这样的少见组合诞生了“DeepSeek神话”——无疑令人倍感好奇。

这一切是怎么做到的?

潜行多年

假如从建立时间上看,DeepSeek并无特别之处。自2022年底ChatGPT发布之后,举世科技圈震动,随之一系列国产大模子创业项目面世。DeepSeek搭乘的也是这股潮水,2023年4月,幻方量化高调公布进军大模子,三个月之后,DeepSeek作为独立公司建立。

但脱胎于幻方量化的DeepSeek,实在技术积累要更早。

幻方量化建立于2015年,首创人是梁文锋。在该公司官网上,赫然写着的是:利用AI投资的对冲基金。按照幻方量化的披露,在公司建立之前七八年时间,首创团队就在探索将技术应用于投资生意业务。其时量化投资在国内尚未盛行,团队成员在这方面的履历同样寥寥,出于朦胧的市场感知和技术抱负,梁文锋团队仍决定走上这条路。

在这一时期,幻方量化首创团队从零开始实验全自动生意业务,采用机器学习等技术。2010年是一个迁徙转变点,当年股指期货和融资融券相继推出,A股投资更活泼和多样化。一时间,量化投资在国内私募基金业渐渐增长,报道称梁文锋团队也借此收益颇丰。

2015年,幻方量化正式建立,借助AI和数学举行量化投资。2016年,幻方量化第一个由深度学习算法模子天生的股票仓位上线实盘生意业务,利用GPU举行盘算。而在此之前,算法主要依赖线性模子和传统机器学习算法,模子盘算主要依赖于CPU。

自此之后,幻方的量化计谋全面AI化。到2017年底,几乎全部量化计谋均已采用AI模子盘算。随后不久,该公司明确公布AI为主要发展方向。

所谓量化投资,指的是借助统计学和数学方法,利用盘算机步伐对大量数据举行分析,寻求获得超额收益的投资计谋。在持仓风格上,量化投资倾向高度分散和多样化设置,以低落单一资产颠簸的风险。在决议上,不同于传统的依赖基金司理主观判断,量化公司是基于数据和模子举行生意业务。

全面AI化也带来某些问题,比如复杂的模子盘算需求使得单机训练遭遇算力瓶颈,训练需求和有限的盘算资源产生抵牾,幻方量化必要办理大规模算力的受限困难。在这个配景下,幻方量化在2019年建立了一家AI底子研究公司,并推出自研的“萤火一号”AI集群,搭载500块显卡。同一年,幻方量化规模扩张,跻身百亿私募。2021年,幻方又斥资10亿元加码建立“萤火二号”,为AI研究提供算力支持。

从事厥后看,幻方量化在构建AI算力过程中的“囤卡”动作,为它赢得了市场机遇。作为国内早期的英伟达芯片大买家之一,在ChatGPT爆发前夜,幻方量化手中的英伟达显卡数目就越攒越多。据幻方量化称,在2022年时,其用于科研支持的闲时算力高达1533万GPU时,这意味着天天用于科研而非生意业务的算力便达4.2万GPU时。这个程度,大大超越了厥后的很多大模子公司。

DeepSeek,就是在这样的加持下问世。

也交过学费

幻方量化上演了一个“一朝成名天下知”的精彩故事,在它的叙事版本里,无论做金融生意业务还是进军大模子,都是比较纯粹的技术向寻求。

一位靠近幻方量化的投资人士告诉时代周报记者,他不停很关注这家公司,而且和团队成员有过交换。固然没有直接接触过首创人本人,但能感觉出来,相对于贸易红利,这个团队的技术抱负色彩是更为浓厚的。

幻方量化渴望通过AI量化生意业务,对金融资产举行订价和投资。金融生意业务富足复杂,又是从起家就到场的范畴,对于旨在实现通用人工智能(AGI)的幻方量化而言,这是一个非常符合的切入场景。

早在2020年,点拾投资首创人朱昂曾访谈过幻方量化CEO陆政哲。彼时陆政哲称,幻方量化将自己界说为一家完全依赖AI来做投资的对冲基金。其模子数据泉源有三个,分别是行情数据、覆盖全市场的根本面数据以及颠末布局化处理的另类数据。用这三类数据来训练机器模子,据此构建投资组合,再用精致化的步伐化生意业务完成生意业务。

这套打法确实效果显著,在2017年-2020年间,整个量化行业高速增长,幻方量化的管理规模也水涨船高。不外,量化生意业务并非美满,幻方量化在这上面也吃过苦头。

2021年12月,由于业绩回撤达汗青最大值,幻方量化就业绩不合格发文致歉。幻方量化称,其人工反复检视了AI的投资决议,以为AI选出来的股票从长期价值来说根本上没问题,但在生意业务时点上确实做的不够好。尤其市场风格剧烈切换时,AI倾向于冒险博取更多收益,这进一步加大了回撤。

量化资管行业扩张太快,被以为是另一个缘故因由。幻方量化以为,行业规模猛增,导致计谋同质化严峻,加大了团体操纵的难度。因此,其时幻方量化动手控制总的规模,同时亮相要加大对计谋研究的投入,以重新获得市场上风。而在羁系层面,2024年7月份融券业务相干政策发生庞大调解,转融券业务停息,而且融券包管金比例上调。别的,步伐化生意业务被进一步强化羁系。量化行业似乎告别一段蛮横发展期。

现在,梁文锋旗下有撂镆百亿私募,除了宁波幻方量化(股票计谋),另外一家是浙江九章资产(多资产计谋)。就业绩而言,据私募排排网数据,已往两年量化公司的风头仍然强势,如2023年百亿私募排行榜中,前十名中量化公司占据六席,在104家上榜私募中,九章资产和幻方量化的业绩分列32和33位。到2024年,量化私募的团体收益仍高于主观私募,除东方港湾(主观投资)牢牢把持行业首位之外,前三十名中量化或主观+量化的机构占据多数。不外,幻方量化的业绩同样算不上突出,仅排在第19位。

在私募排排网有业绩展示的12只产物中,幻方量化旗下产物2024年的收益均值为12.18%,收益中位数为13.02%。

“还需冷静对待”

某种程度上,DeepSeek应该是幻方量化的深度转型之作。建立之初,该公司就体现将专注在大模子上,从语言大模子到视觉大模子,再到多模态大模子,堪称步步为营。

已往一年多,从冷静无闻到火爆出圈,DeepSeek经历了一条清楚的产物迭代之路。

在2024年5月之前,DeepSeek相继推出了DeepSeek Coder(免费且开源的首个模子)、DeepSeek LLM(第一个大语言模子),此中DeepSeek LLM包罗670亿参数,在一个包罗2万亿token(语言模子中用来体现单词或短语的符号)的数据集上举行训练。在中文体现上,该模子据称超越了其时的GPT-3.5。

这两款模子都没有引起波涛,直到随后发布的DeepSeek-V2,才让DeepSeek在圈中着名。DeepSeek-V2是混合专家(MoE)语言模子,包罗总参数到达2360亿,每个token激活210亿个参数。在一些行业测试中,DeepSeek-V2有着不错的体现。

有意思的是,其时国内业界对这款模子似乎短缺技术层面的关注。DeepSeek-V2之以是被注意到,是由于它在大模子行业掀起一场价格大战——DeepSeek在5月初公布,DeepSeek-V2贬价至每百万Tokens输入价格为1元、输出价格为2元,开发者还能获得500万Tokens的免费额度。

这个价格程度,约莫相称于GPT-4 Turbo的七十分之一。

随即互联网大厂纷纷跟进,乃至不乏有厂家将价格降得比DeepSeek-V2还低。就在国内玩家为价格战打的火热时,有硅谷从业者发现,DeepSeek-V2采用的多头潜伏注意力机制,有效提拔了大模子的性能。

这大概是硅谷较早地正视这家中国初创公司。

据一位行业相干人士表明,多头潜伏注意力机制是DeepSeek-V2提出的一种注意力架构,该架构可以显著低落推理过程中的KV缓存。所谓KV缓存,指的是在大模子的推理过程中,用于存储先前盘算效果的一种技术。

到2024年底,DeepSeek继续迭代,推出了DeepSeek-V3模子。DeepSeek终于迎来它的GPT-3时候。

本年1月20日,DeepSeek-R1发布,在数学、代码、自然语言推理等任务上,宣称性能对标OpenAI o1正式版。而它的蒸馏(将大模子的知识迁徙到小模子中)小模子,也超越了OpenAI o1-mini。别的,在开源和闭源蹊径仍有争议的眼下,DeepSeek公布R1开源,允许用户举行“模子蒸馏”,以促进技术共享。

DeepSeek-R1是一枚重磅炸弹,在性能上为举世业界瞩目之外,更紧张的是——它的资本相比竞品大大低落。一周之后,DeepSeek一气呵成,又推出开源多模态模子,被以为在文生图方面超越OpenAI的DALL-E3。至此,外界对DeepSeek的讨论关注,到达高潮。

与先进大模子保持相近的性能,并在训练资本、运行资本和服务订价上全面大幅降落,这是DeepSeek震撼科技圈的缘故因由。在这样的征象级产物出现之前,已往两年多时间,由于AI业界对高性能显卡的追逐,英伟达被一路推上王座。无论在资源市场还是产业链,这个逻辑似乎已经建立,没推测DeepSeek横空出世,硬生生搅了局。

不外,这场打击波能连续多久,还是个未知数。DeepSeek的势头固然很猛,但是否弥合了国产大模子与国际先进程度之间的技术代差,正在引发热议。另外,DeepSeek通过算法优化提拔服从,是否就意味着对算力需求的显着削弱,下结论也太早。

喧闹之外,降温观察渐渐成为一种声音。“针对最近几天事情的发展,个人觉得还是冷静对待,肯定其取得的成绩,但也要制止感情化。”上述投资人士如此说道。

收藏 邀请
上一篇:英伟达大幅反弹,周一的“DeepSeek”打击竣事了吗?下一篇:森峰科技IPO被终止:年营收10亿 李峰西夫妇背负债务3699万
我有任务需求要发布
专业服务商主动承接
快速解决你的需求

专注IT众包服务

平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全

交易资金托管平台,保障资 金安全,确认完成再付款

实力商家

优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管

交易过程中产生纠纷,官方100%介入受理,交易无忧

  • 微信访问
  • 手机APP