Bendi新闻
>
英伟达:下一代GPU细节曝光

英伟达:下一代GPU细节曝光

2月前

本文转自“英伟达:下一代GPU细节曝光”。Nvidia 正在准备该公司的 GeForce RTX 50 系列 (Blackwell) 产品,以与最好的显卡相竞争。著名硬件泄密者 @kopite7kimi 声称,根据他的信息,Blackwell系列的内存接口配置不会与Ada Lovelace系列有太大差异。既然这是一个泄漏,请持保留态度。我们从之前发布的一些泄密信息中了解到 ,该公司计划在其基于Blackwell 架构 的下一代顶级 GB202 GPU 中保留 384 位内存总线 。


相关链接:

1、英伟达NVLink技术详细概述

2、英伟达Blackwell平台网络配置详解

3、英伟达GB200 NVL72全互联技术,铜缆方案或成为未来趋势?

4、英伟达Blackwell性能翻5倍,AMD/Intel产品升级,国产厂商如果应对?



更多GPU技术细节,请参考文章“最新版:GPU显卡天梯图(2023年11月)”,“全球GPU呈现“一超一强”竞争格局”,“2023年GPU显卡词条报告”,“HBM崛起:从GPU到CPU”,“英伟达GPU龙头稳固,国内逐步追赶(2023)”,“英伟达L40S GPU架构及A100、H100对比”,“AI芯片第一极:GPU性能、技术全面分析”,“主流国产GPU产品及规格概述(2023)”,“新型GPU云桌面发展白皮书”,“国内外GPU现状:海外龙头领跑,国产差距明显”,“GPGPU流式多处理器架构及原理”等等。


Nvidia 的 Blackwell 可能是该公司第一个支持GDDR7内存的系列,与现有的GDDR6和GDDR6X内存解决方案相比,其更高的数据传输速率和架构特性有望显着提高性能。鉴于第一代 GDDR7 SGRAM IC 将具有 32 GT/s 的数据传输速率,采用这些芯片的 384 位内存子系统将提供约 1,536 GB/s 的带宽,因此 512 位内存接口是不容错过的。


虽然我对512位还抱有幻想,但GB20x的内存接口配置和AD10x没有太大区别。


2024 年 3 月 9 日,美光表示 16 Gb 和 24 Gb GDDR7芯片将于 2025 年上市,但其路线图并未表明这些设备是否会同时推出,还是 16 Gb 会更早推出。也就是说,仍有待观察的是 Nvidia 是否会在其最初的 GeForce RTX 50 系列显卡中使用 16 Gb 还是 24 Gb GDDR7 内存 IC。


由于英伟达的Blackwell家族至少还有两到四分之三的时间,现在很难做出预测。然而,我们在表中概述了GB200系列供电产品的可能内存配置。


迄今为止的几代产品中,Nvidia 的顶级消费类显卡均使用 384 位内存接口(AD102、GA102),事实证明,从性能和成本的角度来看,该接口是最佳的。Nvidia 顶级消费类图形产品的精简版采用 320 位内存接口,而高端 GPU 则采用 256 位总线(例如 AD103、GA103 和 GA104)。同时,性能主流段也有采用192位内存总线的GPU(如AD104、GA106)和主流段采用128位内存接口的GPU(如AD106、AD107、GA107)。


虽然泄密者的评论表明Blackwell系列将在很大程度上保留当前Ada Lovelace系列的内存接口配置,但应该记住,根据同一泄密者,Blackwell 系列将缺少 GB204 GPU。相比之下,传闻中的GB205很可能不会直接继承 AD104。



功率突破1000W?



如果您认为 Nvidia 的 700W H100 是又热又耗电的机器,那就等到今年晚些时候 的 B100  GPU上市吧。

戴尔科技集团首席运营官杰夫·克拉克 (Jeff Clarke) 表示,Nvidia 最新的 AI 加速器的功耗将达到 1,000 瓦,比其前身高出 42%。但别担心,他非常确定驯服这头野兽不需要液体冷却。

克拉克上周在戴尔财报电话会议上对投资者表示:“我们对 H200 所发生的事情及其性能改进感到兴奋。”他补充说,他对 Nvidia 即将推出的 B100 加速器和另一个他称为 B200 的加速器也有同样的感受。。

他认为,处理每个功耗 1,000 瓦的 GPU 不需要直接液体冷却——他说“明年 B200 就会达到这一水平”。

目前还不完全清楚 Clarke 所指的“B200”卡是什么,因为去年秋天英伟达与投资者分享的路线图上没有出现该名称的芯片。然而,我们怀疑 Clarke 实际上指的是 GB200 Superchip,它与GH200一样,预计将 Nvidia 的 Grace CPU 与其 B100 GPU 结合起来。


根据我们对 GH200 中 Grace CPU 的了解,并假设功耗没有重大变化,GB200 的热设计功耗 (TDP) 约为 1,300 瓦,比其前身高出 30%。

英伟达也可能还有另一张我们还不知道的牌。这家 GPU 巨头的下一代 Blackwell 架构的细节仍然很少。

除了命名之外,克拉克表示即将推出的芯片将提供一个机会来大规模展示戴尔在其他形式的液体冷却方面的专业知识。他提到“流体化学和性能、我们的互连工作、我们正在做的遥测、我们正在做的电源管理工作”作为直接液体冷却替代方案的步骤,即使对于非常密集的芯片也是如此。

在 Nvidia 的带宽使H200 GPU 在今年上半年首次亮相后,B100 预计要到 2024 年年底才会推出。

H200 于 2023 年末发布,是 H100 的更新版,配备高达 141GB 的 HBM3e 内存,可实现高达 4.8TB/秒的带宽。Nvidia声称,由于该芯片的 HBM3e 内存堆栈,该设备可以使包括 Llama 70B 在内的大型语言模型的性能提高一倍。

分析师警告称,即使今年有两款新的加速器上市,Nvidia 的 GPU 供应仍将受到限制。尽管有报道预测 Nvidia 的 GPU 出货量可能会在 2024 年增加三倍以上。

除了新的加速器之外,Nvidia 的路线图还要求在今年年底前推出速度更快、功能更强大的 InfiniBand 和以太网 NIC 以及交换机,每个端口的带宽可达 800Gb/秒。

来源:半导体行业观察

相关阅读:

转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。

推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包(全)”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”一起发送“服务器基础知识全解(终极版)和“存储系统基础知识全解(终极版)pdf及ppt版本,后续可享全店内容更新“免费”赠阅,价格仅收249元(原总价399元)。


温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


微信扫码关注该文公众号作者

来源:架构师技术联盟

相关新闻

英伟达下一代GPU披露:集成八个HBM 4拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM详解最强AI芯片架构:英伟达Blackwell GPU究竟牛在哪?现场对话技术高管英伟达黄仁勋:下一代智能汽车芯片与三家中国车企达成合作黄仁勋子女经历曝光:不卷名校,加入英伟达前开餐厅当厨子不想炸薯条的Ilya和不送GPU的英伟达,Hinton最新专访:道路千万条,安全第一条一文读懂英伟达的“新GPU”:比H100快5倍?1200W的功耗?液冷?与MI300X比较又如何?英伟达 RTX 4080 SUPER GPU 跑分出炉:OpenCL 测试比非 SUPER 版高 7%为AI“降温”:直接对芯片的无水液冷技术大幅降低能耗和成本,正适配英伟达GPU野心藏不住了!不满CPU统治,英伟达决定彻底重写软件开发栈!黄仁勋:为什么还要用Python?命令行都不需要!GPU开发时代将至梅花创投吴世春:英伟达或在两年内有剧烈的估值回归,有没有人和我打赌?少赚1500亿美元!孙正义认错:英伟达卖早了,错过了一条大鱼!HBM:英伟达的命门,存储新周期的主线Computex 2024:英伟达AI路线及战略分析英伟达:能笑到最后才是真本事百亿美元只是开胃菜!科技大厂天量撒钱狂升数据中心:英伟达「铲子梦」还能做多久?AI芯片战争:英伟达是科技之巅,还是下一个思科?悉尼华女豪饮两瓶红酒后,醉驾撞上电线杆!庭审细节曝光:背后原因令人唏嘘热归热,Groq离取代英伟达GPU有多远?突破摩尔定律极限!前谷歌量子计算团队首创「热力学计算机」,英伟达GPU「退役」?湘潭大学投毒案细节曝光:和朱令案根本不一样最新大模型推理优化进展:英伟达、阿里、腾讯和零一万物专家观点解读|AICon全球半导体TOP 25:英伟达仅第四,中国大陆一家入选拜登秘密运送32万非法移民入境细节曝光:竟全部送往这个州
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。