Bendi新闻
>
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
6月前
新智元报道
新智元报道
【新智元导读】近日,一篇出自中国团队之手的AI论文在外网引发热议。论文中,研究团队提出了Q*模型算法,帮助Llama-2-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。
在GSM8K数据集上,Q*帮助Llama-2-7b提升至80.8%的准确率,超越了ChatGPT; 在MATH数据集上,Q*帮助DeepSeek-Math-7b提升至55.4%的准确率,超越了Gemini Ultra; 在MBPP数据集上,Q*帮助CodeQwen1.5-7b-Chat提升至77.0%的准确率,缩小了与GPT-4的编程水平差距。
微信扫码关注该文公众号作者
来源:新智元
相关新闻
昆仑万维携手南洋理工大学抢发Q*算法:百倍提升7B模型推理能力AlphaGo核心算法增强,7B模型数学能力直逼GPT-4,阿里大模型新研究火了联想AI首款AI手机发布!百倍潜望追光AI影像,3999元售,还有全新AI PC登场DeepMind 发布 JEST 算法,AI 模型训练耗能降低十倍深圳内推 | 百度⽂⼼(ERNIE)团队招聘⼤模型算法实习⽣北京内推 | 理想汽车空间AI团队招聘大语言模型算法实习生北京内推 | AMD北京AI算法团队招聘大语言模型算法实习生深圳/香港/上海内推 | 商汤研究院基础语言模型团队招聘大语言模型算法研究员北京/上海内推 | 小红书智能创作团队招聘多模态大模型算法工程师/实习生14款!中国第四批大模型备案获批!附280款算法备案全名单上交、清华联合发布rLLM,业界首个关系表格大模型算法库科研实习 | 南方科技大学-香港中文大学(深圳)联合招收大语言模型算法实习生专访普渡大学魏体伟:研发芯片级“两相冲击射流冷却”技术将散热效率提升百倍,正筹建公司实现技术转化AI Trust资讯 | 492项!我国大模型加速落地:第六批深度合成服务算法备案信息公布综述170篇「自监督学习」推荐算法,港大发布SSL4Rec:代码、资料库全面开源!纽约出新法!禁止社交平台向儿童提供“成瘾性”推荐算法。豪赌!哈佛辍学华人竟然发布了只支持Transformer一种算法的AI芯片,一张顶20张H100 ,比GB200快北京内推 | 微软搜索广告算法团队招聘LLM方向广告算法实习生杭州内推 | 阿里淘天集团未来生活实验室招聘大模型算法实习生晚点独家丨地平线重组智驾算法团队,加大投入高阶;快手电商 GMV 增速放缓,着力培养用户消费习惯北京内推 | 中国电信人工智能研究院招聘多模态大模型算法研发实习生北京内推 | AMD北京AI算法团队招聘AIGC方向研究型实习生(可远程)全面解析RLHF,PPO,DPO,Flash Attention,增量学习等大模型算法ByteHouse 如何将 OLAP 性能提升百倍?