Bendi新闻
>
数学领域的“AlphaGo”:DeepMind最新AI模型,打破奥数天花板

数学领域的“AlphaGo”:DeepMind最新AI模型,打破奥数天花板

11月前

来源:深究科学

作者:周晨


导读


今日,DeepMind再有新动作,这一次聚焦到奥林匹克竞赛领域。

          

DeepMind与纽约大学计算机科学系联手在《自然》(Nature)杂志上发布一项研究成果,研究团队研发了一款名为AlphaGeometry的人工智能(AI)系统。该AI模型成功解答了国际数学奥林匹克竞赛级别的几何问题,表现超越了以往最佳的自动化定理证明系统。

          

与以往不同的是,AlphaGeometry通过在不同复杂级别综合数百万个定理和证明,成功摆脱了对人类演示的依赖。

          

2016年,DeepMin的推出的AlphaGo打遍围棋界无敌手,这一次,AI能否再次在数学领域超越人类呢?

       

很多人认为,数学或许是验证人类逻辑思维能力的一个可靠参照模板。
          
在数学领域,证明数学定理一直是人类自动推理能力阈值的一大证明,而奥林匹克数学竞赛,则无疑是对于逻辑极限能力的挑战。
          
在过去,人类的高水平逻辑推理能力被认为是AI难以取代的,因为将人类逻辑证明的思路转化为机器可验证格式的成本一直很高。奥数水平的数学定理证明对逻辑推理和解题能力要求极高,而目前基于机器学习的AI系统在这方面仍然面临挑战,因为缺乏人类示范作为训练数据,特别是在几何学定理方面,机器学习的AI难以掌握这个领域。   
          

1月18日,DeepMind联合纽约大学计算机科学系提出了一种名为AlphaGeometry的创新AI模型方法,使得AI模型能够在无需人类示范的情况下学习和解决复杂问题。
          

AlphaGeometry能够通过综合复杂程度各异的数百万条定理和证明,利用一个神经语言模型完成自我训练。这种方法结合符号演绎引擎(能搜索难题中的大量分支点),能让AI模型在无需人类直接输入的情况下学习并解开复杂问题。
          
AlphaGeometry合成数据生成流程
          
可以说,该模型通过在不同复杂性级别上综合数百万个定理和证明,成功地摆脱了对人类演示的依赖。   
          
为了测试该模型的有效性,研究团队用国际数学奥林匹克竞赛(优等高中生参加的数学定理证明大赛)2000-2020年的30个问题测试了该系统。AlphaGeometry解出了其中25题,接近国际数学奥林匹克竞赛金牌选手的平均表现,而之前最优秀的方法只解出了10题。
          
AlphaGeometry将几何定理证明器的当前状态从低于人类水平提升到接近金牌水平。
          
值得一提的是,AlphaGeometry能生成人类可阅读的“证明步骤”,在人类专家的评估下,AlphaGeometry成功解决了IMO 2000和2015的所有几何问题,并且还发现了一个经过推广的IMO定理,这意味着,或许在不久的将来,该模型能够在数学领域刮起一阵让人为之震惊的风暴。
              
AlphaGeometry的概览,以及它是如何解决一个简单问题和IMO 2015问题3的
          
虽然目前AlphaGeometry仅限于几何学,但研究团队表示,这种方法或许也能在其他数学领域取得成功。
          
可以说,这项研究的成果标志着AI领域在解决复杂逻辑挑战方面迈出了重要一步,同时,也意味着未来AI数学研究将迎来全新的可能性。
                  
参考资料
Solving olympiad geometry without human Demonstrations.Nature. 
   

微信扫码关注该文公众号作者

来源:报人刘亚东A

相关新闻

打破奥数天花板!DeepMind最新AI数学大模型,能以人类金牌水平解决几何题只差一分!DeepMind最新数学AI在奥数竞赛中勇夺银牌;SpaceX公布猎鹰9号事故的原因 | 环球科学要闻堪比印钞机!AI总龙头业绩暴增六倍!黄仁勋:“下一场工业革命已开始”;连续20CM涨停!A股这家公司的天花板在哪里?56岁“谷歌之母”:商界女性的“天花板”,每年为谷歌赚1500万56岁“谷歌之母”苏珊·沃西基去世:商界女性的“天花板”,璀璨与坎坷交织的传奇人生!深国交学长:我在数学夏校“天花板”罗斯数学营,凌晨1点睡觉,交80页作业却被教授“打回重写”…国内“避暑”天花板:游客不足大理的1%,安逸不输成都!均温18℃,不用空调!!严重被低估了......数学中的“太极”:切触几何的柔与刚剑桥数学博士郑乐隽:我也曾厌恶数学,然而“迟钝”一点的孩子,更像数学家AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分17岁中专女生闯进全球数学竞赛12强:那个差点被“扼杀”的天才今日arXiv最热大模型论文:上海AI lab发布MathBench,GPT-4o的数学能力有多强?梗图理解“天花板”!港中文终身教授贾佳亚团队推出多模态模型:GPT-4+DALL-E 3,王炸组合刷爆榜单“天才少女”姜萍爆冷突围的全球数学竞赛,AI参赛结果如何?|亮马桥小纪严选最强数学大模型易主!阿里千问新模型成绩超GPT-4o,网友:这才是真“草莓”毛巾界的“天花板”!日本HOYO厚祐毛巾,不掉毛超吸水,软糯亲肤~49元get希er顿花园酒店同款床笠,这简直是床品界的“天花板”!帝都CBD的“天花板”国际校终于有开放日了!本学年最后一场,不可错过湾区15家宝藏下午茶, 谁是你心中的“天花板”?升学考又用AMC10原题?不愧数学竞赛“天花板”!性格内向,是我职场的隐形“天花板”吗?最会“赚钱”的数学家、“华尔街伟大的投资者”,他还创立了一家非常成功的基金会哈佛、MIT录取的“数学大神”们,从这项普娃也能玩的数学活动开始安省15个被网友被疯狂点赞的“避寒”天花板!温泉度假地现在去也不晚!
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。