浪潮信息“元脑”全面升级,定制算力、算法、数据工具,帮企业一键召唤“大模型”
AI应用卷出新高度!
智东西4月22日报道,上周,浪潮信息宣布“元脑”品牌重磅升级,在算力、算法、数据、互联方面全面布局,一举亮相多个面向大模型落地应用的工具套件。
浪潮信息董事长彭震谈道,应用已成为中国AI产业的核心优势之一。应用创新源自需求驱动,需要算法、算力和数据协同发展,以系统为核心的全局创新已成为推动人工智能高速发展的产业新范式。
这也对大模型落地应用与千行百业深度融合发挥价值提出了更为严苛的要求。
在这一背景下,多元多模的生态格局显现,浪潮信息以自身技术积累为底座,正加速与更多元脑品牌的合作伙伴构建协同共生、开放共赢的生态体系。
智东西等媒体与浪潮信息高级副总裁刘军、浪潮信息服务器产品线总经理赵帅、浪潮信息AI软件研发总监吴韶华进行了深入交流,在AI算力范式不断革新的背景下,深入剖析浪潮信息升级“元脑”品牌的原因以及一系列工具发布对AI产业的深远影响。
从手机、PC到服务器,越来越多元化的端侧设备被大模型颠覆,并在AI+时代释放出更多潜力。
浪潮信息总经理胡雷钧认为,AI算力正渗透进每一个计算设备中。面对AI产业的这一变革趋势,浪潮信息在IPF上宣布将计算品牌全面升级为元脑,“元脑既是智算品牌,也是生态品牌”,以应用为导向、以系统为核心搭建起大模型在千行百业落地的基础。
面向大模型正在颠覆千行百业的行业共识。浪潮信息发现,场景+大模型衍生出的创新应用对企业提出了更为严苛的要求。
吴韶华称,大模型预训练阶段学习的是通用知识,导致其在具体行业应用时缺乏专业知识,容易产生幻觉,企业内部数据分散、多元的特性也使得数据被快速高效处理利用有一定难度;其次大模型在行业应用时需引入知识检索手段,进行持续内部运维等;此外大模型仍处于技术发展早期,模型、芯片等快速演进,大模型与芯片的适配与部署难度、成本对于一般企业而言都很高。
因此,面向企业用户大模型开发的软件平台正是应对上述难题的最优解法之一,也就是浪潮信息发布的企业大模型开发平台“元脑企智”EPAI,面向企业开发部署生成式AI应用的端到端开发平台。
一定程度上,高质量数据决定了大模型的应用效果。EPAI的数据来源分为基础知识、行业知识和企业知识,其中上亿条基础知识数据来源于浪潮信息研发“源”大模型的数据积累。对于私密性较高的企业数据,浪潮信息提供了自动化数处理工具,企业可以将数据保留在本地,并通过权限控制、加解密等工具套件帮助数据安全。
有了数据后,为了让大模型对于行业的理解更加深入,需要进行模型微调,让大模型变得更加通用且专业。EPAI提供的微调工具可支持千亿参数模型面向产业知识快速再学习,并拥有百万token的长文档处理能力,以适应具体行业场景下的任务需求。
与此同时,EPAI实现了知识库检索与微调模型的相辅相成,其检索增强生成(RAG)技术,通过本地化检索基础知识+行业知识+企业知识,能弥补微调大模型知识更新不及时的问题。
这样一来,基于浪潮信息的大模型应用开发平台,大模型的强大能力与企业的个性化需求、场景更加匹配。此外,对于应用大模型的玩家而言,其关注性能的同时还会关注平台是否易用、好用且对成本更为敏感。
因此,EPAI提供了将大模型快速接入现有系统的API、开箱即用的对话UI交互、为企业复杂任务流提供基础模块支撑的智能体三种使用方法。
再加上诸多开源、闭源大模型支持、面向多模和多元算力的计算框架等优势,企业可以实现大模型应用在跨算力平台上的无感迁移。
可以看出,EPAI为企业提供了几乎全链路的开发、部署、运维工具,让企业在大模型浪潮下“再无后顾之忧”。
事实上,伴随着大模型从底层技术的突破到应用落地的焦点转移,很多企业的核心需求在落地阶段才逐渐显现出来。吴韶华举了一个例子,与开源代码不同,企业内部的私有代码有宝贵知识产权,使得基础大模型的代码能力很难直接在企业内部的场景中释放价值,这与企业实际项目中,新的函数需基于现有的项目接口构建有关。这也是浪潮信息正在重点突破的方向。
不论从大模型加速落地的演进趋势,还是EPAI的几大核心特征来看,企业在大模型开发、部署、落地此前都面临着诸多门槛。浪潮信息此次发布的端到端开发平台以及一系列的工具,或许会成为大大缩短企业开发、部署大模型的周期的关键变量。
或许在不久的将来,在大模型落地这一不可逆转的趋势下,EPAI进一步加快大模型无限潜力释放的显著成果将充分体现出来。
在元脑品牌新升级的“以系统为核心”之中,算法、数据、算力、互联缺一不可。刘军谈道,这四者的关系为以算法为负载,以数据为输入,以算力为承载,以互联为连接。
这也是浪潮信息提供全栈智算产品和方案的基础。除了EPAI,浪潮信息面向大模型应用专门打造了智能算力底座、专用存储、超级AI以太网交换机。
得算力者得天下,算力需求与大模型产业发展息息相关。随着行业落地加速,千亿甚至万亿参数大模型层出不穷,使得企业对智能算力的需求急速攀升。
因此,浪潮信息联合英特尔发布了AI通用服务器,可实现浪潮信息千亿大模型源2.0部署、优化、测试,这也是业界首次实现基于CPU处理器的千亿参数模型推理。
AI通用服务器在2U空间支持4颗英特尔处理器,支持AMX等AI加速功能,同时能满足千亿大模型的低延时要求。
高质量数据数据方面,浪潮信息打造了大模型应用的专用存储AS13000G7-N系列,充分满足大模型的多协议、高带宽、低延迟、数据高效流转等需求。
此外,浪潮信息专为大模型打造了超级AI以太网交换机“X400”,这是国内率先支持Spectrum-X平台的网络产品。相比传统RoCE网络性能提升至1.6倍,AI网络的带宽利用率超过95%,通信时延降低30%,NVIDIA Megatron-LM大模型训练速度最高可以提升70%,大幅缩短训练时长并降低训练成本。
从多元算力可调度、满足大模型存储需求到满足AI集群需求,浪潮信息此次推出的系列工具,已经成为企业进行大模型开发的重要支撑,同时为大模型释放技术潜力以及帮助企业抓住市场机遇提供了更多可能性。
从元脑生态的蓬勃发展,以及浪潮信息在算力、算法、数据、互联方面的技术创新与突破,都离不开其此前的布局。
面向大模型应用落地的狂飙突进,浪潮信息率先在算力、算法、数据、互联方面实现了技术创新与突破,并且能切中企业用户的真实痛点发布系列工具,都离不开其此前的技术研发与生态建设布局。
浪潮信息在大模型算法方面的研发布局由来已久。早在2021年,浪潮信息就发布2457亿参数规模的“源1.0”中文语言大模型,并全面开源,2023年又成功研发并开源千亿参数“源2.0”基础大模型,包含1026亿、518亿、21亿三种参数规模,这也是国内首个千亿参数、全面开源的大模型。
彼时,为了提升基础大模型的智力水平,源2.0采用了新型的注意力算法结构局部注意力过滤增强机制(LFA,Localized Filtering-based Attention)等措施,实现源2.0大模型在精度上接近GPT-4的水平。
同时,浪潮信息通过大模型生成高质量数据以及非均匀流水并行、优化器参数并行、数据并行、Loss计算分块的分布式训练方法等,不断突破提升大模型智力水平的边界,找到技术发展的可行路径。
伴随着大模型产业发展在应用端呈现出的发展趋势,智算的重要性显而易见,而“一切计算皆AI”的产业发展趋势已经融入浪潮信息发展的每一根毛细血管中。
除了技术创新,诞生于2019年的元脑品牌的全面升级,也成为浪潮信息迎接AI产业革命新机遇的最新答案。
浪潮信息渠道推进部总经理毛柏林透露,2023年浪潮信息生态伙伴数量已经达到3万家,同比增长33%,元脑认证伙伴首次突破1万家。
迈入智能时代,拥有不同底层技术、在不同行业深耕的各路企业之间的连接日渐紧密,因此,元脑既是智算品牌,也是生态品牌。浪潮信息将联合左右手的伙伴,面向不同场景,实现大模型的加速落地,激发AI产业创新发展的新动力。
浪潮信息同期还发布了EPAI种子计划,预计在3年内将伙伴数量扩充至1000家。
大模型产业发展的趋势已经逐渐明晰,多元多模、落地部署进程加快等趋势演进加速,在这一背景下,浪潮信息以开放共赢的“元脑生态”为依托,正从AI创新落地的探索者向引领者冲锋。
AI+成为今年大模型产业发展当之无愧的热词,新质生产力变革步伐加快。伴随着AI部署落地的创新成果不断涌现,多元的模型、算力、数据需求对其大规模应用提出挑战。
浪潮信息依托于此前的技术积累与布局,再加上对产业前沿趋势的深入洞察,率先向这一变革趋势发起冲锋,在算法、算力、数据、互联领域的工具体系助力下,AI应用将会为千行百业带来无尽的想象力。
微信扫码关注该文公众号作者