Bendi新闻
>
谷歌AI一分之差痛失IMO金牌!19秒做一题碾压人类选手,几何AI超进化震撼评委
谷歌AI一分之差痛失IMO金牌!19秒做一题碾压人类选手,几何AI超进化震撼评委
3月前
新智元报道
新智元报道
【新智元导读】就在刚刚,谷歌DeepMind最新的数学模型捧得了IMO奥数银牌!它不仅以满分成绩做出了6道题中的4道,距离金牌只有1分之差,而且在第4题上只用了19秒,解题质量和速度惊呆了评分的人类评委。
AI的数学推理能力,震惊评分教授
程序能够提出这样一个非显而易见的解法,实在令人印象深刻,远超出我对当前技术水平的预期。
AlphaProof
AlphaGeometry 2
AI的解题过程
值得一提的是,这些问题首先会被人工翻译成正式的数学语言,然后才会投给AI。
P1
P2
P4
P6
能做奥数题,但能分清9.11和9.9谁大吗?
AlphaProof和AlphaGeometry 2,是在形式化证明和特定领域的符号引擎上完成训练。在某种程度上,它们在解决专业的奥林匹克竞赛问题更出色,即使它们基于通用LLM构建的。 而GPT-4o的训练集中,混杂了大量的GitHub代码数据,可能远远超过数学数据。在软件版本中,「v9.11 > v9.9」,可能严重扭曲了数据分布。因此,这个错误在某种程度上是可以理解的。
微信扫码关注该文公众号作者
来源:新智元
相关新闻
数学界迎来AlphaGo时刻:谷歌AI用19秒答完一道IMO几何题,差1分即可摘金谷歌AI差一分夺IMO金牌这件事会对中小学数学教育有什么冲击?秘密打造「AI陶哲轩」 震惊数学圈!谷歌IMO梦之队首曝光,菲尔兹奖得主深度点评Meta训AI,成本已超阿波罗登月!谷歌豪言投资超千亿美元,赛过OpenAI星际之门十年磨一「图」,谷歌震撼发布纳米级人脑图谱!AI加持人类大脑研究史上首届“AI选美”出现,还让AI做评委?!评选结果迟迟没出来,网友:乱套了...谷歌跌超4%!谷歌AI人物成像新功能“离大谱”,美国国父大变黑人,拟下线几周谷歌数学AI登Nature:IMO金牌几何水平,定理证明超越1978年吴文俊法谷歌AI拿下IMO银牌,数学推理模型面世!投资大佬炮轰谷歌一半员工是摆设!AI 工程师:我们被招来后净做没用的东西了赢下AI大战有多贵?谷歌AI负责人:要花超1000亿美元!比人类便宜20倍!谷歌DeepMind推出「超人」AI系统科技界“AI月”即将开启!OpenAI、谷歌、微软们要放啥大招;即时零售开卷履约时效,京东小时达品牌升级为秒送……AI编程创企获2.52亿美元融资!谷歌前CEO参投,距独角兽一步之遥高合创始人现身总部,传谷歌拟在印度生产手机,李一舟AI小程序暂停服务,老头环DLC预告播放量超570万,这就是今天的其他大新闻!25亿独角兽CEO带头跑路,携30员工卖身谷歌!AI大佬:AGI泡沫几周就要破【行业日报】瑞银集团将出售80 亿美元瑞士信贷资产!谷歌推出AI 加速器计划!女子早癌病变被漏诊,AI医生在X光中发现!谷歌最新AI听咳嗽就能检测新冠/结核奥特曼紧急辟谣:OpenAI下周不推AI搜索!但谷歌还是在劫难逃【行业日报】美商务部要求微软谷歌通报AI模型!摩根斯坦利加倍私人信贷组合!重磅更新!谷歌Chrome加持AI,重量级功能×3,Windows、Mac均可用减肥又抗衰新招;宇宙“焰火捕手”升空;谷歌医疗AI胜过人类…|WE科学周报知名AI独角兽被谷歌收购!泡沫破灭!为啥这些新闻该直接划走DeepMind CEO称AI智力不如猫!LeCun持相同看法!曝光谷歌新项目AI将突破聊天限制