Bendi新闻
>
ICLR 2024 Spotlight | 无惧中间步骤,MUSTARD可生成高质量数学推理数据
ICLR 2024 Spotlight | 无惧中间步骤,MUSTARD可生成高质量数学推理数据
7月前
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。
论文题目:MUSTARD: Mastering Uniform Synthesis of Theorem and Proof Data 论文链接:https://openreview.net/forum?id=8xliOUg9EW 代码链接:https://github.com/Eleanor-H/MUSTARD 数据集链接:https://drive.google.com/file/d/1yIVAVqpkC2Op7LhisG6BJJ_-MavAMr1B/view 作者主页:https://eleanor-h.github.io/
MUSTARDSAUCE-valid:经过了 Lean 形式化证明器验证的 5866 条数据; MUSTARDSAUCE-invalid:未能通过 Lean 形式化证明器验证的 5866 条数据; MUSTARDSAUCE-random:随机的 5866 条数据; MUSTARDSAUCE-tt:MUSTARD 生成的所有 28316 条数据。
赛道 1-1 (自动形式化):https://www.codabench.org/competitions/2436/ 赛道 1-2 (自动非形式化):https://www.codabench.org/competitions/2484/ 赛道 2 (自动定理生成和证明):https://www.codabench.org/competitions/2437/ 赛道 3 (代码辅助的运筹优化问题自动求解):https://www.codabench.org/competitions/2438/
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
来源:机器之心
相关新闻
不影响输出质量还能追踪溯源,「大模型无偏水印」入选ICLR 2024 SpotlightICLR 2024 | 根据压缩比率控制生成样本难度,NUS等提出首个无损数据集蒸馏方法今日arXiv最热NLP大模型论文:IBM研究院提出Genie方法,自动生成高质量数据集ICLR 2024 | 再论生成数据能否帮助模型训练?2024中国风景名胜区高质量发展大数据分析报告(附下载)靠Scaling Laws炼出4D版视频生成模型,多伦多大学北交大等携手开源81K高质量数据集巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数|ICLR 2024ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练ICLR 2024 | 阐明扩散模型中的曝光偏差问题,一行代码大幅提升生成质量单模型斩获「蛋白质突变预测」榜一!西湖大学提出基于结构词表方法 | ICLR 2024 SpotlightMeta联合纽约大学和华盛顿大学提出MetaCLIP,带你揭开CLIP的高质量数据之谜Meta 联合纽约大学和华盛顿大学提出MetaCLIP,带你揭开CLIP的高质量数据之谜。ICLR 2024 | 高分工作!Uni3D:3D基础大模型,刷新多个SOTA!股价上涨超70%,uniQure公布亨廷顿基因疗法数据,高剂量可使疾病进展减缓80%用好数据元件:数据要素高质量赋能数字金融Karpathy点赞,这份报告教你如何用 LLaMa 3创建高质量网络数据集月狐数据:2024生成式AI使用趋势研究报告图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东灰豚数据:2024进口成人奶粉可引进性分析报告ICLR 2024 | LLM Agent领域第一高分论文,全网Star数最高的多智能体框架ICLR 2024 | 冻结住的CLIP仍可作为教师模型!港大提出全新开集动作识别模型ICLR 2024 | Adobe提出DMV3D:3D生成只需30秒!让文本、图像都动起来的新方法!清风无恙:2024中国高尿酸及痛风行业大数据及产业竞争分析白皮书(122页)BJHAI:2024北京市高级别自动驾驶示范区数据安全治理白皮书