快捷导航
科技信息

一天之内,阿里、腾讯大动作!

4月29日破晓,阿里巴巴开源新一代通义千问模子Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,成本大幅降落,性能全面逾越R1、OpenAI-o1等环球顶尖模子,登顶环球最强开源模子。 千问3是国内首个“混合推理模子

4月29日破晓,阿里巴巴开源新一代通义千问模子Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,成本大幅降落,性能全面逾越R1、OpenAI-o1等环球顶尖模子,登顶环球最强开源模子

千问3是国内首个“混合推理模子”,“快思索”与“慢思索”集成进同一个模子,对简朴需求可低算力“秒回”答案,对复杂标题可多步调“深度思索”,大大节省算力斲丧。

千问3接纳混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T ,并在后训练阶段多轮强化学习,将非思索模式无缝整合到思索模子中。千问3在推理、指令依照、工具调用、多语言本领等方面均大幅增强,即创下全部国产模子及环球开源模子的性能新高:在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在观察代码本领的LiveCodeBench评测中,千问3突破70分大关,表现甚至凌驾Grok3;在评估模子人类偏好对齐的ArenaHard测评中,千问3以95.6分逾越OpenAI-o1及DeepSeek-R1。

性能大幅提拔的同时,千问3的摆设成本还大幅降落,仅需4张H20即可摆设千问3满血版,显存占用仅为性能相近模子的三分之一

值得一提的是,记者获悉,就在同一天,腾讯对其混元大模子研发体系举行了全面重构,围绕算力、算法和数据三大焦点板块,刷新团队摆设,加码研发投入。

调解后,腾讯建立两个新的部分:大语言模子部和多模态模子部,分别负责探索大语言模子和多模态大模子的前沿技能,连续迭代底子模子,提拔模子本领。

同时,进一步加强盛模子数据本领宁静台底座建设,此中数据平台部专注大模子数据全流程管理与建设,机器学习平台部则聚焦机器学习与大数据融合平台建设,为AI模子训练推理、大数据业务提供全面高效的PaaS平台底座,共同支持腾讯混元大模子技能研发。

腾讯相干人士表现,这意味着腾讯在快速调解构造架构以应对日新月异的大模子行业发展,这次调解有利于整合资源,优化研发流程,进一步提拔腾讯在AI领域的长期技能作战本领。

混元是腾讯自研的通用大模子,支持文本、图像、视频和3D等多种模态内容的明白与天生。本年以来,混元大模子技能迭代速度明显加快,相继推出快思模子Turbo S和深度思索模子T1,均在公开基准测试中到达业界领先水平,在视频天生和3D天生领域也推出多个新版本模子。混元3D天生、视频天生、DiT文生图及千亿参数MoE语言模子等模子均已对外开源,GitHub总Star数凌驾2.9万。

近期,国产大模子发展按下提速键,天生式人工智能正带来产业厘革。据央视网报道,现在,我国已形成覆盖底子层、框架层、模子层、应用层的完备人工智能产业体系。最新数据表现,截至2025年4月9日,我国人工智能专利申请量达1576379件,占环球申请量的38.58%,位居环球首位。现在,我国已累计培养400余家人工智能领域国家级专精特新“小巨人”企业,占据环球1/10的人工智能产业规模。

编辑|金冥羽杜波

校对|陈柯名

封面图片泉源:视觉中国

逐日经济消息综合央视网、每经网、通义千问Qwen微信公众号、公开资料等


逐日经济消息

收藏 邀请
我有任务需求要发布
专业服务商主动承接
快速解决你的需求

专注IT众包服务

平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全

交易资金托管平台,保障资 金安全,确认完成再付款

实力商家

优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管

交易过程中产生纠纷,官方100%介入受理,交易无忧

  • 微信访问
  • 手机APP