英伟达表示要向苹果看齐,他自己说的。
科技圈的泰勒 · 斯威夫特,皮衣老黄又又又来开演唱会搞演讲了。
就在昨天,国际电脑展前夕,英伟达创始人兼 CEO 黄仁勋回到母校中国台湾大学,洋洋洒洒讲了将近两个小时。
从最基础的 AI 技术讲到生成式 AI ,从软件讲到硬件,从 CPU 讲到 GPU 等等等等。。。
乍一看貌似和计算相关的,黄仁勋都讲了个遍。但世超仔细咂摸了一下,倒觉得从头到尾他想讲的,就只有一个:未来是加速计算的世界,而英伟达,正在参与搭建这个世界。
加速计算,其实就是 GPU 计算,它把密集计算的部分都交给比较擅长的 GPU 去处理,剩下的控制部分则交给 CPU ,而在 GPU 没出来之前,这些活都是 CPU 做的。
考虑到整场演讲时间太长,没耐心看完的差友们,可以直接看世超给大伙划的重点。
老样子,一开场老黄就先跟大伙们聊了半个小时计算机和英伟达的发展史,当年把第一台 DGX-1 超级计算机送给 OpenAI 的事情也算是老演员了。
总之这半个小时,老黄就是为了给咱们前情提要一下,在之前通用计算已经通货膨胀得不行了,现在最需要的,是让加速计算给它疏通疏通。
而英伟达手里,就握着疏通的两个利器,一个是GPU ,一个是CUDA 。
GPU 大伙们都很熟了,和 CPU 配合下,最快能让计算速率提升 100 倍,但成本只是原来的 1.5 倍。老黄那句 “ 买越多,省越多 ” 的至理名言就是从这来的。
CUDA 可能好多人还整不明白,这么说吧,它就相当于是英伟达造出来的一个环境生态,在这个环境下造出来的软件,能让GPU 的算力被最大限度开发出来。
这些年来,围绕 CUDA 建起来的软件生态,少说也有好几箩筐了。像是物理领域的 Modulus 、通信领域的 Aerial RAN 、基因序列的 Parabricks 等等,都有专门的 CUDA 软件。
在CUDA 生态下运行的数据科学库 Pandas ( 右 )
如果说之前,GPU 和 CUDA 还只是让计算速度快点的工具,归根结底,各个领域还是各玩各的。
而 ChatGPT 这类生成式 AI 的出现,算是把算力变成了一种通用的货币。
用老黄的比喻来说, GPU 和 CUDA 直接变成了 “ AI 工厂 ” 的砖和瓦,在这个新的 AI 工厂,生成的tokens 数摇身一变成了新的商品。
咱也都知道,光看 AI 现在的发展速度,算力肯定是不够用。
但先别急,老黄直接甩出了这些年来他们硬件提升的数据,还拉来了摩尔定律做对比。看这陡峭的折线图,是把摩尔定律按在地上摩擦。
而吊打摩尔定律的,是英伟达刚投产的 Blackwell 芯片,这是专门给 AI 生成 tokens 设计的。
演讲的过程中,老黄还拿 Blackwell 芯片和八年前的 Pascal 做了个直观的对比,同样是生成一个 token , Pascal 消耗的能量,相当于两个 200 瓦灯泡亮两天,而现在一个 token 只要 0.4 焦耳。。。
也就是说,新的 Blackwell 芯片把生成 token 的能量降低了 45000 倍,世超可没多打一个 0 。
不仅如此,老黄的新芯片在 “ 盖房子 ” 这块儿,也得心应手了很多,两块 Blackwell 芯片能像搭积木一样拼成超级芯片。
紧接着,把 36 个这样的超级芯片组合在一起,就能变成一个服务器。
最后把这些服务器串在一块儿,这就是妥妥的一座超级 “ AI 工厂 ” 。
这还没完,老黄还没想停手,在这次演讲中,他直接把英伟达后面的计划给说出来了,打算做 “ AI 界的苹果 ” ,把原来两年更新一次芯片的频率提升到一年更新一次,每年都要给自己的 “ AI 工厂 ” 装潢加固下。
就比如, 2025 年会推出 Blackwell Ultra 。而且他们现在就已经在为 Blackwell 芯片开发的下一代平台 Rubin ,准备 2026 年发布,而且新平台还会用全新的 GPU 。
另外,在老黄构想中的 AI 工厂里,可不只有这些硬件,各种软件和服务他也不想落下,这咱在英伟达搞 CUDA 的时候就能窥见一二。
而在 AI 时代,除了造芯片,老黄还给开发者们提供了一些服务,整出了个NIMs ( 英伟达推理微服务 )。
它就相当于一个 AI 盒子,里面集成了两百多家企业的技术,供全世界的 2800 万个开发者们使用,包括预训练好的 AI ,用于推理服务的 Trition 服务器等等。
NIM 也会在开发者们用这些技术的时候,给他们加速,就比如,在相同的计算资源下,在 NIM 里面运行 Meta 的 Llama 3-8B 的时候,生成的 tokens 数量比平时多了三倍。
总的来说,在老黄这里,你不仅能买到算力,还能直接在他那儿开发 AI ,是一点不让钱流到别人口袋。。。
也许是看时机成熟了,在演讲过程中,老黄还提到了一个之前从来没说过的计划:数字孪生地球( Earth-2 )。
这个项目在英伟达内部已经搞了好几年了,为的就是能预测整个地球的未来,好让我们能更好地应对还没到来的灾害。
反正世超在看完老黄的整场演讲,觉得他就是想把英伟达搓成一根绳,串起整个 AI 时代。
能不能做到,咱现在也不好下结论。至少从现在来看,在AI 芯片领域,英伟达的地位是焊的死死的。
上周,英伟达刚发的第一季度财报就是很直观的证据,当季业绩全面超预期,而里面增长最高的就是和 AI 相关的数据中心,同比增长了427% 。
当时不少媒体都拉来苹果和英伟达对比,说它离苹果只差一步之遥。
但同样作为 “ 卖铲人 ” ,网上还有不少论调称,英伟达会是 AI 时代的思科,等泡沫破裂之后,自然会现出原形。
其实说实话,在世超来看,他们俩之间还不能完全划等号。
最起码英伟达不仅仅是一个卖铲人,它在卖铲的同时,还附加了不少服务,之前有 CUDA ,现在又有了个 NIMs ,而这些服务,才是它真正的护城河所在。
最后,世超想用老黄说过一句话做结尾, “ 当你无法辨别自己是猎人还是猎物时,奔跑就好了。 ”
而如今的英伟达,依旧在狂奔。。。
撰文:松鼠
编辑:江江、面线
美编:阳光
图片、资料来源:
黄仁勋演讲视频、财联社
微信扫码关注该文公众号作者