Bendi新闻
>
奥数逼近金牌水平!谷歌最新AlphaGeometry模型登上Nature!菲尔兹奖得主点赞

奥数逼近金牌水平!谷歌最新AlphaGeometry模型登上Nature!菲尔兹奖得主点赞

夕小瑶科技说 原创
作者 | 王二狗

大家好,我是二狗。

谷歌DeepMind 最新AI研究突破登上了《Nature》!

这篇《Solving olympiad geometry without human demonstrations》研究论文提出了AI系统 AlphaGeometry,能够以接近人类奥林匹克金牌得主的水平解决奥林匹克几何问题。

这是在迈向更先进和通用的人工智能系统的道路上发展深度数学推理的一个重要里程碑。

在对 30 道奥数几何题的基准测试中,AlphaGeometry 在标准奥数时限内成功解决了 25 道,正确率高达83%。 相比之下,之前最先进的AI系统仅解决了 10道,而人类金牌得主平均解决了 25.9 个问题。

另外值得一提的是,AlphaGeometry 在人类专家评估下解决了 2000 年和 2015 年奥林匹克竞赛中的所有几何问题,且与许多先前的方法不同,AlphaGeometry 生成的证明可读性很强。

谷歌DeepMind CEO 哈萨比斯对AlphaGeometry 团队取得的成就表示祝贺:

神经语言模型+符号推演引擎

AlphaGeometry 是一个由神经语言模型和符号推演引擎两个部分组成的神经符号系统,二者一起解决复杂几何定理的证明。类似于“思考,快和慢”的理念,一个系统提供快速、直观的想法,而另一个系统则提供更加深思熟虑、理性的决策。这其中:

  • 神经语言模型,可以预测有用的几何结构来解决问题;
  • 符号推演引擎,能够使用逻辑规则推导出结论;

而二者的结合能够扬长避短,AlphaGeometry系统中的语言模型引导符号推导引擎寻找几何问题的可能解决方案。

奥林匹克几何问题基于图表,需要添加如点、线或圆新的几何结构才能解决。AlphaGeometry 的语言模型可以从无数种可能性中预测添加哪些新结构最有用。这些线索有助于填补空白,并允许符号引擎对图表进行进一步推论并接近解决方案。

比如让AlphaGeometry 解决一个简单的问题:给定问题图及其定理前提(左),AlphaGeometry(中)首先使用符号引擎推导有关图的新陈述,直到找到解决方案或用尽新陈述。如果找不到解决方案,AlphaGeometry 的语言模型会添加一种可能有用的构造(蓝色),为符号引擎开辟新的推导路径。这个过程一直循环持续,直到找到解决方案为止(右)。

仅接受合成数据的训练(1 亿个

由于缺乏推理技能和训练数据,AI系统经常难以解决几何和数学中的复杂问题。AlphaGeometry 的系统将神经语言模型的预测能力与规则约束演绎引擎相结合,协同工作来寻找解决方案。

谷歌DeepMind 开发了一种“符号推演与回溯”方法生成了 1 亿个合成训练数据,打破了数据瓶颈,成功地在没有任何人类演示的情况下训练出来了 AlphaGeometry。

谷歌的“符号推演与回溯”合成数据生成方法使用高度并行计算,系统首先生成十亿个几何对象的随机图,并详尽地推导出每个图中点和线之间的所有关系。AlphaGeometry 找到了每个图表中包含的所有证明,然后向后回溯工作找出需要的附加构造来得出这些证明。

AGI数学推理的一个重要里程碑

AlphaGeometry展示了人工智能不断增长的逻辑推理能力以及发现和验证新知识的能力。

网友们纷纷表示祝贺:

谷歌DeepMind表示:

解决奥林匹克级别的几何问题是在迈向更先进和通用的人工智能系统的道路上发展深度数学推理的一个重要里程碑。

我们决定开源 AlphaGeometry 代码和模型,并希望与合成数据生成和训练中的其他工具和方法一起,帮助在数学、科学和人工智能领域开辟新的可能性。

菲尔兹奖得主和IMO金牌获得者NGÔ BẢO CHÂU表示:

现在我知道了为何AI领域的研究人员会首先尝试解决 IMO 几何问题,因为这里寻找的解决方案有点像国际象棋,系统在每一步中的合理动作数量都相当少。但我仍然对谷歌DeepMind 这项工作感到惊讶,这是一项令人印象深刻的成就。

参考资料

 [1]https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/

微信扫码关注该文公众号作者

来源:夕小瑶科技说

相关新闻

奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞一枚「弃子」打破80年黎曼猜想纪录!菲尔兹奖得主MIT大拿联手,陶哲轩转赞打破奥数天花板!DeepMind最新AI数学大模型,能以人类金牌水平解决几何题数学界AlphaGo来了!攻破奥数难题登Nature,接近人类金牌水平AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分放弃加拿大吧!27岁多伦多小伙要搬到美国:再也忍受不了这些!数千网友点赞!营业到晚9点!奥克维尔等地9个Service Ontario入驻Staples!本周开业!只差一分!DeepMind最新数学AI在奥数竞赛中勇夺银牌;SpaceX公布猎鹰9号事故的原因 | 环球科学要闻奥特曼进军搜索,谷歌慌了!让谷歌股价暴跌的“大杀器”三个月前就被程序员摸透了!发布会对比惨烈,奥特曼发文暗讽谷歌!谷歌被曝疯狂重组迎击OpenAI00后UP主自学特效,被马斯克点赞了!第十九届中国青年女科学家奖颁奖,为“她力量”点赞!菲沙排名第一小学学区!奥克维尔华人热区Glen abbey独立屋,走出式地下室,后院东南朝向采光极好!奥特曼紧急辟谣:OpenAI下周不推AI搜索!但谷歌还是在劫难逃[点赞]24岁中国混血小姐姐,获格莱美奖!最强开源大模型深夜炸场! Llama 3 王者归来,直逼 GPT-4, 马斯克点赞 | 附体验链接鹅厂最新AI工具刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验谷歌数学版Gemini破解奥赛难题,堪比人类数学家!Windows全球大面积蓝屏,英国不对国产电车加收关税,奥迪不再用假排气管,谷歌等成立安全AI联盟,这就是今天的其他大新闻!量化面试|清华奥赛金牌学长带你全面梳理Quant知识点考点,1遍刷完4大经典求职圣经!新西兰也要跟?这一国家允许祖父母休育儿假,还发工资!NZ专家疯狂点赞!最新!奥克兰疑似华人浮尸案:NZ警方逮捕两人!他们试图离境...为腾讯点赞!一时砸车伤人爽,十年铁窗泪茫茫!场场爆满!这场顶级魔术表演,被5000多名观众点赞!新西兰华人千万别错过!
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。