快捷导航
科技信息

国产大模子震惊外洋,周鸿祎:绝对是中国AI财产发展的里程碑变乱

前几天中国六代战机曝光,外网闹翻天了。这还不敷,这两天中国大模子又出了新版本,致使外洋 AI 社区刷屏。国内 AI 创业公司 DeepSeek发布了新的开源大模子,其参数目为6000多亿,性能赶上了 GPT - 4o和Facebook的羊
前几天中国六代战机曝光,外网闹翻天了。这还不敷,这两天中国大模子又出了新版本,致使外洋 AI 社区刷屏。
国内 AI 创业公司 DeepSeek发布了新的开源大模子,其参数目为6000多亿,性能赶上了 GPT - 4o和Facebook的羊驼,但练习本钱比它们低沉了10倍,代价仅为它们的10%。
该模子推出后,显着能感觉到外洋 AI 技能人才对中国 AI 技能的进步,处于半震惊半懵状态。
网友批评整洁划一,都在问中国人是怎样做到的?Meta 的一位科学家赞叹,DeepSeek 的练习像是黑科技。OpenAI 的一位首创团队成员称,从前到达 DeepSeek 这种级别本事通常需16000个 GPU,而现在 DeepSeek 只用2000个 GPU,盘算量淘汰了11倍,这证明 AI 算法另有很大优化空间。

各人可能不太相识 DeepSeek 这家公司,固然我们有互助,但我对其相识不深,于是用纳米 AI 搜索查询了一下。
DeepSeek 中文名为深度求索,如名字所示,该公司一直低调行事,却早著名气。在硅谷,DeepSeek 被称为来自东方的秘密力气。
其背后是量化私募的巨头幻方公司,2021 年为做量化生意业务囤了一万张英伟达 A100,当时 ChatGPT 尚未出现,大模子也未发布,犹如 Meta 为搞元宇宙囤卡一样,都机遇偶合赶上了 AI 海潮,以是在其他巨头闹卡荒时,DeepSeek 手中有卡心中不慌。
这家公司初次被人记着是因其发布 2.0 开源模子时提供了史无前例的性价比,模子推理本钱降至每百万个 token 约一元,约为 LLaMA的1/7、GPT 的1/70,故而 DeepSeek 被称为 AI 界的拼多多,掀起国产大模子代价战,字节跳动、腾讯、百度、阿里纷纷贬价。
现在开辟者能享大模子福利,DeepSeek 功不可没。

为何本日要提及此事?
已往我常说中美 AI 核心差距不大,约半年左右,重要差距在算力。因核默算法公开,多为工程化方法,模子也是开源的,差距实则不大,可很多人不信,一些专家还带节奏,称论 AI 气力美国领先,中国最多第二梯队,美国遥遥领先,我对此不敢苟同。
有人妄自菲薄还让众人悲观,长他人的志气灭自己的威风,对中国 AI 财产发展无益。
现在 DeepSeek 发布的模子有力回手了这些言论。微软、脸书、谷歌都在朝着10万卡集群做大模子练习时,DeepSeek 仅用2000个 GPU,耗费不到600万美金和两个月时间,就做出一个与环球顶尖大模子本事对齐的开源大模子。
有人质疑说,新推的大模子是用国外模子知识蒸馏而来,但知识蒸馏方法人人可用,为何他人未做到?
此次服从大幅提拔,肯定是在底层架构上有不同于其他巨头的创新,DeepSeek 定有不为人知的练习方法和工程实践方法。
已往只有美国 AI 公司具备这种独有本事,现在中国公司也渐渐把握了。
有人会说 DeepSeek 只是个例,缺乏说服力,可否说出更多先辈国产大模子?固然可以。
比如阿里的通义千问,其推出的千问2.5系列大模子,此中的700亿参数版本,在视觉推理、数学和科学问题体现上与国外大模子相比绝不逊色,慢思考本事也渐渐提拔。
别的,王小川的百川智能近期推出的金融大模子在专业本事上高出了 GPT - 4o,这也证明白我之前对专业大模子的判定,即在通用大模子根本上联合专业范畴知识练习,专业大模子本事可逾越通用大模子,我们称之为范畴加强。
360 在o1出现前就实现了慢思考本事,只是实现方法略有不同,360 打造的安全行业大模子本事也遥遥领先于 GPT - 4o。
总之,盼望观看这篇文章的各位信托中国 AI 发展并不弱,不要被某些专家言论误导。已往我们是模仿者和跟随者,他人善于从零到一,我们善于从一到 n,现在环境正变化,中国科技范畴原发性创新已让全世界看到,已往是 “Copy to China”,以后可能是 “Copy from China”。

DeepSeek 公司体现精彩,开了个好头,以后我国 AI 创新定会更加活跃。借 DeepSeek 这个版本,我谈几点大模子发展的见解。
第一,无需再争论开源与闭源优劣,DeepSeek 是开源的,开源模子正赶超闭源模子。在人类技能发展趋势中,开源可使大模子技能不被少数巨头把持,唯有开源才气让大模子真正走入各行各业,让各级政府和企业低本钱在开源根本模子上打造行业应用,推动生产力飞跃。以是 DeepSeek 的进步对推动中国 AI 财产发展是极大利好。
更令人奋发的是,中国正引领环球大模子开源海潮,开源是互联网精力的直接体现,也是美国科技发展的源泉与机制。
然而,现在中国最强的两个模子通义千问和 DeepSeek 是开源的,美国最强的两个模子Claude和GPT 却是闭源的.可见美国走向闭源,中国走向开源,这预示着科技发展天平向中国倾斜,一旦中国开源生态创建,这种创新机制将助力中国加快 AI 科技发展,把握先机,实现从追赶者到引领者的华丽转身。
第二,DeepSeek 3.0版本用2000块卡做到了万卡集群才气做到的事,这表明我们在肯定水平上冲破了西方对我们的算力封锁,堪称奇迹。当前美国想尽办法对我们举行小院高墙式的封锁,遏制中国 AI 财产发展,禁止高端算力芯片流入中国。
只有强大对手才气逼出最强的自己,若针对中国 AI 芯片的禁令,终极使中国大模子在算力受限环境下找到更高效办理方案,那这种拔苗助长的效果影响将更广泛。
别的,用这种极致练习方法练习专业大模子,算力本钱会进一步低沉,促使中国 AI 在专业、垂直、场景、行业大模子上更快遍及。
第三,有人会问,云云一来我们是否另有须要建显卡集群?不要误解,我并非说中国 AI 发展不须要高端算力芯片,巨头们囤显卡建算力集群仍旧须要,由于现在预练习算力需求大概没那么大,但像慢思考这类复杂推理模子对推理算力需求大,文生图、文生视频的应用也需斲丧大量算力资源,巨头们提供 AI 云服务,构建巨大算力根本必不可少,这与 DeepSeek 低沉练习算力需求是两回事,两者并不抵牾。
建万卡集群现实是个工程问题,做过一次便一通百通,以是马斯克从 OpenAI 挖人建十万卡集群,小米挖 DeepSeek 的天才少女,都是为获取工程化的万卡集群练习诀窍。
作为科技行业的从业者,看到 DeepSeek 推出云云锋利的模子,中国 AI 公司依附原发性技能创新震惊世界,让曾经轻视我们的外国开辟者偕行恐慌,各位是否感到畅快、自尊与感动?
这绝对是中国 AI 财产发展的里程碑变乱,我信托以后中国 AI 发展此类消息会越来越多。各人应对中国 AI 财产发展布满信心。
收藏 邀请
上一篇:芯流独家:迎战高通、紫光展锐,恒玄科技自研AI眼镜芯片,能否搅动市场格局?下一篇:AI反诈奶奶上线!使命是与骗子唠嗑,“浪费他们的时间”
我有任务需求要发布
专业服务商主动承接
快速解决你的需求

专注IT众包服务

平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全

交易资金托管平台,保障资 金安全,确认完成再付款

实力商家

优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管

交易过程中产生纠纷,官方100%介入受理,交易无忧

  • 微信访问
  • 手机APP