英伟达 NVLink 交换芯片,变了
👆如果您希望可以时常见面,欢迎标星🌟收藏哦~
来源:内容由半导体行业观察(ID:icbank) ,谢谢。
在 2024 年台北国际电脑展上,我们的团队看到了一些非常有趣的东西。Ingrasys 展位上有一块裸露的 NVIDIA HGX B200 主板。Ingrasys 是富士康的一个部门,可能也参与了 GB200 NVL72 的构建。在该公司的 2024 年台北国际电脑展上,有一块没有散热器的 NVIDIA HGX B200 主板,这显示出了巨大的变化。NVIDIA NVLink Switch 芯片(不再称为“NVSwitch”)的数量从四个减少到两个,并转移到 HGX 底板上。
NVIDIA NVLink 交换芯片更换为 HGX B200
作为 NVIDIA 8-GPU 基板的简要历史课,我们需要从 P100/V100 代开始。在那一代中,我们将在 8 路 SXM 基板上安装 PCIe 交换机。GPU 之间有 NVLink,但交换机是 PCIe。当我们在 2018 年做DeepLearning12时,我们必须安装自己的散热器,基板是由技嘉制造的。
DeepLearning12 半散热器安装 800
构建 DeepLearning12 的成本很高。例如,我们必须购买一个价值 350 美元的扭矩驱动器,该驱动器必须达到不损坏 NVIDIA P100 GPU 所需的公差。我当时在数据中心开始安装这些驱动器,我们的一位好心读者阻止了我,他在同一数据中心的百度 AI 研究集群上工作,他告诉我,如果扭矩不完美,我可能会损坏 GPU。事实上,我听到的最糟糕的故事是 HPE 因扭矩/导热膏厚度损坏了几个 V100 代 GPU。
下一个重大进步来自 NVIDIA HGX-2 主板。NVIDIA 不再让主板合作伙伴制作基板,然后安装冷却解决方案,而是将所有这些预先集成到其 NVLink Switch 芯片中,这些芯片当时被称为“NVSwitches”。在这里,您可以看到 NVIDIA V100 时代所需的相对较小的散热器。
浪潮 NF5488M5 HGX 2 板散热器
进入 NVIDIA A100 时代,NVLink Switch/NVSwitch 散热器变得更大,但整个 HGX A100 平台由 NVIDIA 制造,并预先组装好后发送给供应商。请注意,我们关注的是 8-GPU 基板,而不是我们在 Dell EMC PowerEdge XE8545等系统中评测过的“Redstone”4-GPU 基板。
浪潮 NF5488A5 NVIDIA HGX A100 8 GPU 组装 NVSwitch 散热器至 A100
当谈到 H100 一代时,我们在 NVLink 交换机和 GPU 周围获得了更好的管道,但正如您所见,四个 NVLink 交换机位于 HGX H100 底板的一端。
华硕 ESC N8A E12 NVIDIA HGX H100 3
现在来看看我们在 Computex 2024 的 Ingrasys 展位上看到了什么。首先,有一块 NVIDIA HGX H200 底板。
NVIDIA HGX H200 底板 缩小
这似乎同时遵循与带有 NVLink 交换机的 NVIDIA HGX H100 8-GPU 底板相同的设计。
NVIDIA HGX H200 底板
在展会上,我们看到了 8x GPU NVIDIA HGX B100 平台,其上带有更多的 NVIDIA 品牌标志。
NVIDIA HGX B100 带散热器
为了获得更清晰的视图,这里是与发布时相同的 HGX B100 平台。
NVIDIA Blackwell HGX B100
但值得注意的是,在边缘连接器附近,我们有 PCIe 重定时器,而不是 NVLink 交换机。
NVIDIA HGX B100 PCIe 重定时器
虽然没有裸露的 NVIDIA HGX B100 主板,但有一块不带散热器的 NVIDIA HGX B200 主板。我们询问了 NVIDIA,NVLink Switch 设置应该是一样的。
NVIDIA HGX B200 底板顶部(无散热器)
这里我们可以看到 PCIe 重定时器从散热器中露出。这些重定时器往往具有较小的散热器,因为它们的 TDP 范围为 ~10-15W,具体取决于您谈论的是使用此占用空间的Astera Labs、Broadcom还是Marvell版本。
NVIDIA HGX B200 底板 PCIe 重定时器
引人注目的是,NVLink 交换机位于主板中间,而不是边缘。板载有两个,而不是四个。
NVIDIA HGX B200 底板 4x GPU 和 NVLink 交换机
我们要求 NVIDIA 确认这些就是新的 NVSwitches,我们通过电子邮件收到了这样的回复“我们还没有透露芯片的定位,但我们确实从 4 个芯片减少到了 2 个。”同时,该公司还纠正了我们将这两个称为“NVSwitches”的品牌,因为“…中间的两个芯片被称为“NVLink Switch”芯片。
虽然 NVIDIA 尚未透露 NVLink Switch 芯片的位置,但在 HGX B200 底板中间有两个这样的芯片,并且在 HGX B100 上也得到了证实。
最后的话
NVLink 交换机芯片现在更大了,将它们移到电路板中央可能会减少走线长度,而不是将它们全部放在一端。这在进行高速信号传输时很有好处。此外,NVIDIA B200 GPU 的四组 GPU 翻转在两侧,因此 NVIDIA 很可能也在这样做,以进一步减少到 NVLink 交换机的走线长度。
NVIDIA HGX B200 底板角度 Ingrasys
很高兴能在展会上看到这一点。
参考链接:
https://www.servethehome.com/ingrasys-shows-big-nvidia-nvlink-switch-chips-change-to-the-hgx-b200-b100/
END
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3812期内容,欢迎关注。
推荐阅读
『半导体第一垂直媒体』
实时 专业 原创 深度
公众号ID:icbank
喜欢我们的内容就点“在看”分享给小伙伴哦
微信扫码关注该文公众号作者