Bendi新闻
>
性能对标Llama 3,算力消耗仅1/19!源2.0-M32大幅提升模算效率
性能对标Llama 3,算力消耗仅1/19!源2.0-M32大幅提升模算效率
5月前
智东西5月28日报道,今天,浪潮信息发布基于MoE的源2.0-M32开源大模型,全面开源且支持免费可商用,全系列模型参数和代码均可免费下载使用。
源2.0-M32采用基于注意力机制的门控网络技术,包含32个专家模块,参数量为400亿,模型运行时激活参数为37亿。同时,该模型在模型性能全面对标700亿参数规模Llama 3的同时,训练、微调、推理过程中的算力开销显著低于业界的头部开源模型Llama3-70B,源2.0-M32单Token下训练和推理所需的算力资源仅为Llama3-70B的1/19。
微信扫码关注该文公众号作者
来源:智东西
相关新闻
OpenAI陷巨大算力荒,国内大厂抢先破局!打破单芯片限制,算力效率提升33%32专家MoE大模型免费商用!性能全面对标Llama3,单token推理消耗仅5.28%英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4o奥特曼专访自曝全新GPT-5细节:性能跃升超想象,算力足可达AGI!开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4国产多模态大模型开源!无条件免费商用,性能超Claude 3 Sonnet清华系2B模型杀出,性能吊打LLaMA-13B,170万tokens仅需1块钱!功耗降低 40%、1.5 倍核显性能、120 TOPS AI 算力,英特尔 Lunar Lake 移动处理器一文看懂向Redis宣战?微软开源Garnet,性能提升几十倍!CVPR 2024 | 与任务无关的多模态数据也能提升Transformer性能!港中文&腾讯新作200亿「书生·浦语2.0」正式开源!数推性能比肩ChatGPT,200K超长上下文完美召回首个国产开源MoE大模型来了!性能媲美Llama 2-7B,计算量降低60%苹果最贵最强iPad发布!首发M4芯片,AI性能提升60倍,满配售价近3万!Llama 3低比特量化性能下降显著!全面评估结果来了 | 港大&北航Ð面对“性能墙”、“存储墙”双墙阻碍,四大新型存储升级算力再战Transformer!原作者带队的Mamba 2来了,新架构训练效率大幅提升时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3国产「GPTs」上线!全面对标 OpenAI 的智谱发布大模型,性能逼近 GPT-4生产力提升30%!微软最大规模调研报告出炉,AI工具成打工人效率神器Go应用性能优化的8个最佳实践,快速提升资源利用效率!国内首个开源千亿参数MoE大模型来了!性能超Grok-1,单张GPU可跑Llama 8B搜索100次超越GPT-4o!推理+搜索即可提升性能,新「Scaling Law」诞生?碾压前辈!Meta 发布“最大、性能最好”的开源 Code Llama 70B,但开发者纷纷喊穷:玩不起碾压前辈!Meta发布“最大、性能最好”的开源Code Llama 70B,但开发者纷纷喊穷:玩不起!