机器之心编辑部 就在上个周末,Sam Altman 大张旗鼓地公布,OpenAI 的一款未公开实行性大语言模子在 2025 年国际数学奥林匹克竞赛(IMO)中达到了金牌水平,得分 35/42,乐成跻身举世顶尖数学竞赛选手行列。 故意思的是,据报道不止 OpenAI,谷歌 DeepMind 在这次比赛中,也拿到了 IMO 金牌。但相比 OpenAI 的高调官宣,这次谷歌显得有点低调。 谷歌的低调是有缘故起因的,根据 IMO 组委会一位成员、两届 IMO 金牌得主 Joseph Myers 的说法,IMO 曾要求 AI 公司(即参赛的大模子)不要抢走参赛门生的风头,发起在闭幕式后一周再公布干系效果,一方面是出于对人类参赛者的尊重,另一方面也是为了留出时间对人工智能提交的答案和格式举行验证。 然而,OpenAI 却在闭幕式之前(但根据 OpenAI 研究科学家 Noam Brown 的说法是之后)就公布告终果。 IMO 评审团和协调员的普遍见解是,OpenAI 的这种做法很无礼,也不合适。 遗憾的是,OpenAI 似乎更在乎炒作和声量,不吝抢占参赛门生的风头,于是他们在昨天就提前公布告终果。 来自 OpenAI 的员工在庆贺自家模子获得了 IMO 金牌,时间和 IMO 闭幕式时间非常相近,闭幕时间在 7 月 19 日(当地时间)下战书 4 点举行。 也不知是否是由于 OpenAI 抢发,机器之心也相识到,谷歌 DeepMind 与字节 Seed 团队 IMO 竞赛的效果,也将在本日大概近期公布,且分数是官方评的。 别的,Joseph Myers 还表示,OpenAI 没有与 IMO 互助测试他们的模子,91 名官方 IMO 协调员都没有对 OpenAI 的解决方案举行评级。 相比来看,DeepMind 似乎很遵守规则,并耐烦等候官宣时间。 一家专注于数学 AI 的初创公司 Harmonic 公开证明了这一点:「为了维护门生竞赛的神圣性,IMO 董事会要求参赛的 AI 公司必要比及 7 月 28 日发布效果。」 看来,OpenAI 确实是没有遵守 IMO 要求,提前就把效果公布了。 谷歌 DeepMind 推理团队负责人 Thang Luong 对此事也举行了点评,表示道,IMO 组委会确实有一份官方评分尺度,但这份评分指南并未对外公开。如果没有依据该评分尺度举行评估,参赛构作育无法宣称获得奖牌。如果有一分被扣,那就是银牌,而不是金牌。 IMO 金牌得主 Jasper 观点与 Thang Luong 的观点相似:IMO 的竞赛标题通常包罗 6 道,每个题目 7 分。金牌的分数线是 35 分,银牌 28 分,铜牌 19 分。纵然是扣除很少的分数,OpenAI 也大概跌落到银牌。Jasper 认为从 OpenAI 提交的内容来看,他们的答案很大概会被扣掉一些分数。 陶哲轩(Terence Tao)也指出,只管标题保持稳固,但测试情势至关紧张。一名在尺度条件下大概无法获得铜牌的门生,若在修改后的赛制下甚至大概摘金。以是说,OpenAI 是否获得金牌,现在照旧一个问号。 如果真像前文所说的,OpenAI 终极获得银牌,这种反转照旧挺残酷的,究竟他们放肆宣传本身的模子是金牌得主水平了。 OpenAI :没有人通知我们一周后才气公布 对于此事,OpenAI 也做出了回应,OpenAI 研究科学家 Noam Brown 表示,他们是在闭幕式之后发布的效果,他个人提前接洽了一位 IMO 构造者,并根据其发起时间发布效果。同时,Noam Brown 表示,没有人告诉他们「一周之后」才气发布。 别的,Noam Brown 还表示 IMO 官方几个月前曾接洽他们,提出在比赛结束后提供 Lean 格式(允许用户将数学定理和证明以机器可验证的情势表达)的标题,但 OpenAI 拒绝了。 这算不算回应了前面的质疑:官方要求参赛 AI 公司闭幕式后一周再公布干系效果,但我们根本没参赛。 这一回应引发了网友的猛烈讨论,对此你怎么看呢? |

专注IT众包服务
平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全
交易资金托管平台,保障资 金安全,确认完成再付款

实力商家
优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管
交易过程中产生纠纷,官方100%介入受理,交易无忧

微信访问
手机APP
关于我们|广告合作|联系我们|隐私条款|免责声明| 时代威客网
( 闽ICP备20007337号 ) |网站地图
Copyright 2019-2024 www.eravik.com 版权所有 All rights reserved.


