Bendi新闻
>
第四范式发布先知 AIOS 5.1,节省大模型算力硬件成本,提高 GPU 综合利用率
第四范式发布先知 AIOS 5.1,节省大模型算力硬件成本,提高 GPU 综合利用率
4月前
今天,第四范式先知AIOS 5.1版本正式发布。该版本新增GPU资源池化(vGPU)能力,实现对硬件集群平台化管理、算力资源的按需分配和快速调度,最多节省80%的硬件成本,提高GPU综合利用率多达5-10倍。
第四范式先知AIOS 5是行业大模型开发及管理平台。平台以提升企业核心竞争力为目标,在支持接入企业各类模态数据的基础上,提供大模型训练、精调等低门槛建模工具、科学家创新服务体系、北极星策略管理平台、大模型纳管平台、主流算力适配优化等能力,实现端到端的行业大模型的构建、部署、管理服务。
在行业大模型的构建过程中,为进一步提高算力资源利用率,第四范式先知AIOS 5.1版本新增GPU资源池化(vGPU)能力,拥有五大技术亮点:
全面适配国产/非国产算力,支持混合部署与统一调度
算力和显存超分复用,算力切分精细到1%,显存切分以M兆为单位
具备千卡级别分布式调度与管理能力
支持自定义隔离策略,实现共享或独享算力池
利用多任务共享及处理优化技术,推理性能提升10倍以上
更多内容,点击下方关注:
微信扫码关注该文公众号作者
来源:AI科技评论
相关新闻
第四范式戴文渊:深耕行业大模型十年,这是中国AI市场的风口一群顶尖搜索人才如何 2 个月出货,还把 GPU 利用率干到 60%!揭秘百川智能研发大模型这一年一群顶尖搜索人才如何2个月出货,还把GPU利用率干到60%!揭秘百川智能研发大模型这一年直击算力焦虑,这家清华系 AI 创企搞了个千卡异构混训平台,算力利用率最高达 97.6%“百模大战”周年考|国内大模型盘点:305个大模型发布,备案率约四成,如何寻找变现、破局之路OpenAI发布新旗舰模型GPT-4o;字节跳动正式发布豆包大模型|AIGC周观察第四十三期商汤进入2.0时代:“日日新”大模型驱动生成式AI业务收入率先突破10亿大模型时代的蓝海任务,GPT4V准确率不足10%,港科大发布指代理解基准RefCOCO大模型“挣钱”新方法!用GPT-4优化众筹文稿,提高筹款成功率11.9%!探索 Copilot 创新实践:腾讯、字节跳动、PingCAP 与第四范式共聚 AICon探索 Copilot 创新实践:腾讯、字节跳动、PingCAP 与第四范式共聚 AICon第四范式因资本市场工作需要 委任联席公司秘书第四范式上市不到4个月总裁裴沵思离职 首席架构师胡时伟接任14款!中国第四批大模型备案获批!附280款算法备案全名单如何把商业交给大模型?京东科技何晓冬:需要更严肃地把大模型“幻觉率”降下来新能源消纳新政发布!放宽利用率目标,强调跨省调节娃入园入学后利用率超高的大件,它排第一!没提前买的妈妈,开学第二天就后悔了选股确率高达60%?大模型与财务报表的双向奔赴法国突发! 马克龙震惊; 深圳楼市出大招! 提高得房率; 扫码可领劳动补贴? 人社部回应; 普京将访华→中科大联合华为诺亚提出Entropy Law,揭秘大模型性能、数据压缩率以及训练损失关系专治大模型说胡话,精确率100%!华科等提出首个「故障token」检测/分类方法原子利用率理论可达100%,南科大团队提出去消旋化反应新策略,克服氧化还原电势兼容性问题答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思8点1氪:李佳琦方回应直播间卖假和田玉传闻;特朗普遭刺杀后支持率未显著领先;多家大模型测不出9.11和9.9哪个大