Bendi新闻
>
EDA巨头拥抱GPU,用超算助力芯片设计

EDA巨头拥抱GPU,用超算助力芯片设计

4月前

👆如果您希望可以时常见面,欢迎标星🌟收藏哦~

来源:内容由半导体行业观察(ID:icbank)综合自semiwiki和nextplatform,谢谢。

对于 EDA 市场的观察者来说,有一个很容易被忽视的新增长机会。


如今,从数据中心到汽车、航空航天、能源等,大约 50% 的 EDA 收入来自系统而不是半导体公司。在大多数这些行业中,整个系统设计不仅取决于电子设计,还取决于机械和其他多物理场优化(空气动力学、应力、热学、电磁学等)。


多物理场分析(Multiphysics analysis)已经渗透到半导体设计中,例如使用计算流体动力学 (CFD) 进行冷却分析的封装内到系统内热分析和管理。


简而言之,多物理场在电子系统设计和总体系统设计之间架起桥梁,对于支持发电、航空和汽车市场至关重要。与芯片设计一样,这些领域的系统问题变得越来越困难,需要解决方案提供商积极、持续的创新来满足现代设计需求。


Cadence 声称,利用 EDA 和多物理场专业知识之间的协同作用,Millennium 平台为多物理场分析带来了惊人的性能提升,在数小时而不是数周内解决工业规模问题,并开辟了巨大的新增长机会。



Cadence 已有30多年的历史,最出名的可能是其用于设计芯片的电子设计自动化 (EDA) 软件。


几十年来,Cadence 进行了三打以上的收购,以构建其模拟产品组合,涵盖电路、电路板以及模拟和数字电路的系统设计和测试的各个方面。


与此同时,Cadence 一直在升级仿真堆栈,添加了其摄氏度热仿真器,该仿真器混合使用了有限元分析 (FEA:finite element analysis ) 和 CFD(Computational fluid dynamics ),并从那时起构建或购买了其他 CFD 求解器来应对类似问题Ansys正在被 EDA 竞争对手 Synopsis 以 350 亿美元收购。


重要的是,随着多物理场模拟的出现,模拟本身变得越来越复杂,多物理场模拟将设计设备的粒子物理、热力学、电磁和机械特性结合在一起,以创建该设备的更完整的渲染。


CFD 是一个具有悠久历史的高专业领域。工具部门和产品团队通常都配备了大批博士。网格和求解器的算法以及软件已经发生了显著的发展,当然还会继续发展。换句话说,这是 EDA 公司必须无机地进入的领域。


Cadence 于 2021 年在这里进行了一系列收购。其中包括拥有强大网格划分和求解器技术并在船舶和涡轮机械应用领域享有盛誉的 NUMECA。Cadence 收购 Pointwise 后不久,Pointwise 在 CFD 网格划分方面拥有成熟的实力,并在航空航天和国防市场建立了基础。2022 年底,他们收购了 Cascade Technologies,这是一家斯坦福大学的衍生公司,拥有引人注目的 LES 技术。通过这些收购,Cadence 建立了一支稳定的 CFD 纯种技术和专家队伍,增强了他们在多物理场其他方面的既定实力。但他们似乎并没有就此止步。


各行业迫切需要更高的 LES 性能,以实现更准确的数字孪生建模。举个例子,一辆汽车消耗的能量有 50% 用于克服空气动力阻力,直接影响 ICE 燃油消耗或电动汽车续航里程。设计人员需要数字孪生来模拟数千种操作条件,以找到并优化他们可以围绕汽车结构进行的许多小改进,以减少阻力,Cadence 如何满足这一需求?


为了最大限度地减少计算量并调整运行软件的硬件,从而使客户比原本可能更满意,Cadence 实质上是在同一时间进入超级计算机业务和云业务。


Cadence 将由此产生的堆栈称为 Millennium Enterprise Multiphysics Platform,在其上运行的第一代 AI 辅助 CFD 软件称为 M1,它是 Fidelity CFD 套件中大涡流 CFD 模拟器的 GPU 驻留版本。通过两者的结合,Cadence 希望为航空航天、国防、汽车、电子和工业客户提供 CFD 仿真的准确性、速度和规模两个数量级的改进,这些客户的部分业务依赖于 CFD产品、系统或设施设计。Cadence 表示,通过在该仿真软件中使用 GPU 加速器,客户将看到其仿真的能源效率提高了 20 倍。


可以合理地假设其他 Cadence 软件最终将移植到 Millennium 系统,以便 EDA、FEA、CFD 和其他仿真可以作为整体设计的一部分协同工作。


Millennium 平台并不是第一次涉足专门硬件来运行 Cadence 软件。2014年,Cadence创建了一个原型系统,该系统利用其EDA工具的输出来模拟来自Xilinx的大规模FPGA集群上的芯片设计,该系统被称为Protium,该系统在过去十年中已更新和扩展了四次,提高了速度可以编译哪些门以及它可以模拟的设计规模。


2015 年,Cadence 推出了一款更通用的基于 FPGA 的硬件仿真器 Palladium,能够吸收十亿门设计,以 1 MHz 运行它们(不管你相信与否,这相当不错),并编译高级综合以每小时 1 亿门的速度设计 ASIC 直至 FPGA。最新的 Palladium 系统称为 Z2,可以在 10 小时内编译 100 亿个门,或者说速度是原始 Palladium Z1 硬件的 10 倍,并且可以跨越超过 180 亿个门的设计。


Millennium 超级计算机在几个方面有所不同。


首先,它基于具有高速互连的 GPU 加速器的 CPU 主机,就像当今任何其他 AI 和 HPC 超级计算机一样。Cadence 并没有推出任何特定的计算引擎或互连集,也没有透露其参考设计,这些参考设计可能会告诉我们它的选择是什么,因为它不想让自己陷入任何特定的硬件角落。考虑到如今获得 GPU 分配的困难,这是合理的。


也就是说,可以合理地假设 Cadence 选择 Intel Xeon SP 和 AMD Epyc 服务器处理器作为主机,并选择 Nvidia A100 和 H100 以及 AMD Instinct MI250X 和 MI300X 加速器作为 Millennium 系统中的主要计算能力。假设 InfiniBand 是首选互连也是合理的,但以太网对于那些想要走这条路的人来说是一个选择。


硬件很有趣,但 Cadence 表示更重要的是 Fidelity M1 大涡流模拟器的核心求解器(模拟燃烧中的湍流、大气流动、声振动和其他湍流源)驻留在 GPU 中。这意味着 M1 代码完整地在 GPU 上本机运行,并且与许多其他 GPU 加速应用程序不同,M1 代码不会将并行处理片段从 CPU 卸载到 GPU,并将结果带回 CPU 进行其余处理。


“CFD 中的 GPU 计算仍然是相当新的事物,”Cadence CFD 产品管理总监 Alex Gatzemeier 告诉The Next Platform。“我们的大多数客户,基本上是行业中的大多数客户,仍然严重依赖基于 CPU 的 HPC 系统。CFD 的大小和规模与当今 GPU 上的人工智能不同,但获得 GPU 仍然很困难,很难将它们调整为跨云中的十个或二十个节点进行扩展。这仍然是一个挑战。Millennium 提供交钥匙解决方案。因此,没有任何开销,您基本上可以转到云端并在几分钟内开始。或者您可以将 Millennium 运送到您自己的数据中心,您可以根据需要连接任意数量的节点。”


您可能会认为,在大型航空航天公司、大型国防承包商和大型汽车制造商中,他们将拥有数十万甚至数百万个核心来运行 CFD 模拟。但 Gatzemeier 表示,例如,在一家大型汽车制造商中,典型的客户在运行 CFD 的全 CPU 集群中拥有数万个核心,并且典型的作业在几天到一周的时间里在几千个核心上运行。


借助 Millennium 系统,配备 32 个 GPU 的单机架机器每年将提供约 1.5 亿核心小时,大致相当于典型的基于 CPU 的 CFD 集群。而且,由于 Millennium 系统可以跨多个机架进行扩展,如果您确实想更快地完成更多 CFD 工作,甚至可以跨行进行扩展,因此它可以进一步扩展。事实上,多达 5,000 个 GPU 甚至更多。


以下是 Cadence 在橡树岭国家实验室“Summit”超级计算机上运行的早期版本 LES 求解器上展示的一些缩放数据:



右侧的曲线显示了 LES 求解器在不同网格尺度上预测温度的效果。


此图显示了将 GPU 添加到 M1 软件后单个机架内的可扩展性:



Cadence 表示,这个 32 个 GPU 集群在 CFD 代码上的性能与大约 32,000 个 X86 内核相当。这意味着客户现在可以进行更多的 CFD,或者开始进行预测性 CFD 作为设计过程的一部分,并在模型进行风洞测试之前对设计进行更改,从而使设计受益。这就是图表中“左移”的含义,类似于 DevOps 在代码投入资格和生产之前很久就将代码测试转移了。


顺便说一下,Millennium 机器运行的是裸机 Linux,软件根本没有容器化。它的运行方式与任何其他并行 HPC 应用程序一样,无需所有这些爵士乐。但如果你想将 Kubernetes 置于其之上,并在超级计算机上执行不同类型的工作,你也可以做到。


Millennium 超级计算机现已可供订购,Cadence 在圣何塞自己的数据中心托管的云中的部分也是如此。定价没有透露,但我们确实很好奇。


阅读原文

https://www.nextplatform.com/2024/02/01/cadence-sells-custom-gpu-supercomputers-to-run-new-cfd-code/

点这里👆加关注,锁定更多原创内容

END


*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3663期内容,欢迎关注。


推荐阅读


EUV光刻机重磅报告,美国发布

碳化硅“狂飙”:追赶、内卷、替代

芯片巨头,都想“干掉”工程师!

苹果,玩转先进封装

GPU的历史性时刻!

大陆集团,开发7nm芯片

张忠谋最新采访:中国会找到反击方法

EUV光刻的新“救星”

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank


喜欢我们的内容就点“在看”分享给小伙伴哦

微信扫码关注该文公众号作者

来源:半导体行业观察

相关新闻

2024 年第一大收购案,1100 亿美元「芯片设计巨头」诞生用AI设计芯片,阁下该如何应对?芯片新战场,EDA如何拥抱新挑战?拜登再宣布一笔半导体补贴:用数字孪生加速芯片设计和生产算力理性背景下智能驾驶芯片的设计挑战和发展|为旌科技运营副总裁赵敏俊演讲预告纪念彻底改变芯片设计的Lynn Conway人工智能如何帮助芯片设计?芯片设计公司 “勇闯” 流片关两颗芯片成功点亮!职院生也能设计芯片!转让无晶圆厂芯片设计企业专项基金LP份额;求购星动纪元机器人股份|资情留言板第135期太干了,国产芯片设计原厂一览表。。。特斯拉上海储能超级工厂获施工许可;消息称高通骁龙8Gen4芯片重新设计迎战苹果A18,目标频率4.26GHz丨智能制造日报7nm国产芯片成功上车,EDA如何赋能 — 西门子EDA对话芯擎科技华为Pura 70系列开售:三角形摄像头设计,5499元起售,芯片未透露|最前线提高芯片一次流片成功率,降低设计成本,助推产品上市!国产EDA强强联合,发力RISC-V芯片验证重磅!英伟达官宣全球最强 AI 芯片:性能提升 30 倍,并将重新设计整个底层软件堆栈重磅!英伟达官宣全球最强AI芯片:性能提升 30 倍,并将重新设计整个底层软件堆栈版图工程师征服70%芯片公司的秘籍:《先进FinFET模拟版图设计》线下班即将开课!被质疑擦边?!喜茶新联名视觉设计超好看,但却因离谱原因登上热搜…东方美学正式出圈!这个品牌用设计打造了极致的“东方新浪漫主义”...为了打造「最轻薄」,新 iPad Pro 内部设计用了更多胶水秋招丨EDA巨头之一Ansys开放2025岗位,速抢第一波上岸机会!80款阳台设计,超美!【装修干货】
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。