从四大趋势看芯片产业的发展
What's Next
这是《麻省理工科技评论》的“未来趋势”系列,横跨各个行业、趋势和技术,带你一起先睹未来。
芯片制造的未来在哪?在科技巨擘、初创势力、AI 技术及全球贸易纷争等因素交汇下,这一问题显得尤为重要。科技巨头亲自下场造芯,初创公司则以创新技术谋求破局,力图在智能时代芯片战中占得先机。而边缘运算的崛起,正推动 AI 更贴近生活,对芯片的小型化、高效能提出更高要求。国际间对芯片供应链的竞争,更是重塑生产制造格局,力求技术自主与安全。芯片领域,正步入一个多方博弈、创新迭出的新纪元。
得益于人工智能领域的蓬勃发展,芯片界正处于一场巨大浪潮的转折点。市场对能更快速训练 AI 模型并使其能够在智能手机、卫星等设备间快速响应的芯片需求激增,从而使用户能在不泄露私人数据的情况下运用这些模型。政府、科技巨头及初创企业纷纷竞逐日益壮大的半导体市场蛋糕。
以下是未来一年内定义下一代芯片形态、生产者以及新技术的几大趋势。
(来源:MIT Technology Review)
各国相继推出《芯片法案》(CHIPS Acts)
在凤凰城郊外,全球两大芯片制造商台积电(TSMC)与英特尔(Intel)正竞相在沙漠中建设园区,期冀将其打造为美国芯片制造实力的新中心。这两项努力的共同点在于资金来源:2022 年 3 月,美国总统拜登宣布为英特尔在美国各地的扩张项目提供 85 亿美元的直接联邦资金及 110 亿美元的贷款。几周后,又宣布为台积电提供 66 亿美元资金。这些奖励仅是通过 2022 年签署的 2800 亿美元《芯片与科学法案》(CHIPS and Science Act)涌入芯片行业的美国补贴的一部分。这笔资金意味着任何涉足半导体生态系统的公司都在分析如何重组供应链以从中获益。尽管大部分资金旨在提升美国芯片制造业,但包括设备制造商和专业材料初创企业在内的其他参与者也有申请的空间。
然而,美国并非唯一一个试图将部分芯片制造供应链本地化的国家。日本正在其本国版《芯片法案》上投入 130 亿美元,欧洲计划投入超过 470 亿美元,而印度今年早些时候宣布了一项 150 亿美元的本土芯片厂建设计划。这一趋势的根源可以追溯到 2014 年,据塔夫茨大学教授、《芯片战争:争夺世界最关键技术》一书作者克里斯·米勒介绍,当时中国开始支持本土芯片制造商。
“各国国家政府担心除了提供激励措施外别无选择,否则企业就会将制造转移到中国。”他说。这一威胁加上 AI 的兴起,促使西方政府资助替代方案。在未来一年里,这可能会产生滚雪球效应,更多国家因担心落后而启动自己的项目。
米勒指出,这些资金不太可能导致全新的芯片竞争对手出现或从根本上重塑最大芯片玩家的格局。相反,它主要激励像台积电这样的主导企业在全球多个国家建立根基。但仅凭资金不足以迅速实现这一目标——台积电在亚利桑那州建厂的努力已因错过截止日期和劳资纠纷而受阻,英特尔也同样未能按承诺期限完成建设计划。而且,即便这些工厂最终上线,其设备和劳动力是否能具备与海外同等水平的先进芯片制造能力尚不确定。
“供应链的重塑和转移将缓慢进行,需要数年乃至数十年,”米勒说,“但它确实在发生转变。”
边缘运算(Edge computing)中的 AI 新进展
目前,我们与 ChatGPT 这类 AI 模型的大多数交互都是通过云端进行的。这意味着当你请求 GPT 挑选服装(或是扮演你的男友)时,你的请求会先到达 OpenAI 的服务器,促使驻留在那里的模型处理该请求并得出结论(称为“推理”),然后再将响应返回给你。依赖云端存在一些缺点:它需要互联网连接,并且意味着你的一些数据会与模型厂商共享。
这就是为什么人们对人工智能的边缘运算产生了浓厚的兴趣和投资,在边缘运算中,AI 模型调用的过程直接在你的设备(如笔记本电脑或智能手机)上进行。随着行业不断朝着 AI 模型深入了解我们的方向发展(Sam Altman 向我描述了他的杀手级人工智能应用程序,它“完全了解我的一生、每封电子邮件、我曾经进行过的每一次对话”),对于能够运行模型而不分享私人数据的更快“边缘”芯片的需求日益增长。这些芯片面临的限制与数据中心中的芯片不同:它们通常需要更小、更便宜且更节能。
美国国防部正在资助许多针对快速、私有边缘运算的研究。2022 年 3 月,其研究部门国防高级研究计划局(DARPA)宣布与芯片制造商 EnCharge AI 合作,创建用于 AI 推理的超强大边缘计算芯片。EnCharge AI 致力于开发一种既能增强隐私又能低功耗运行的芯片。这将使其适用于军事领域,如卫星和离网监控设备。该公司预计将于 2025 年出货这些芯片。
AI 模型在某些应用场景中将继续依赖云端,但对边缘运算改进的新投资和兴趣可能会为我们的日常设备带来更快的芯片,从而实现更多的 AI 应用。如果边缘芯片变得足够小且便宜,我们很可能会在家和工作场所看到更多 AI 驱动的“智能设备”。如今,AI 模型大多局限于数据中心内。
EnCharge AI 的联合创始人 Naveen Verma 表示:“我们在数据中心看到的许多挑战将会被克服。我预期边缘运算将成为关注的重点,我认为这对于规模化部署 AI 至关重要。”
大型科技企业进入芯片制造竞争
从快时尚到草坪护理,各行各业的公司为了创建和训练适用于其业务的 AI 模型,正在支付高昂的计算成本。例如,员工可以用来扫描和总结文档的模型,以及面向外部的技术,如虚拟助手,可以帮助你修理损坏的冰箱。这意味着训练这些模型所需的云计算需求空前高涨。
提供大部分这种计算能力的公司是亚马逊、微软和谷歌。多年来,这些科技巨头一直梦想着通过自主生产数据中心的芯片而非从英伟达等公司购买,来提高利润率。英伟达近乎垄断了最先进的 AI 训练芯片市场,其市值超过了 183 个国家的 GDP。
亚马逊于 2015 年开始这方面的尝试,关键动作则是收购了初创公司 Annapurna Labs。谷歌在 2018 年跟进,推出了自己的 TPU 芯片。微软于去年 11 月推出了首款 AI 芯片,而 Meta 则在今年 4 月展示了其最新版本的 AI 训练芯片。
(来源:AP PHOTO/ERIC RISBERG)
这一趋势可能会削弱英伟达的地位。但在大型科技企业眼中,英伟达不仅是竞争对手:无论他们内部努力如何,云巨头仍然需要英伟达的芯片来满足其数据中心的需求。这部分是因为他们自己的芯片制造努力无法满足所有需求,同时也是因为他们的客户期望能够使用顶级的英伟达芯片。
微软 Azure 硬件负责人 Rani Borkar 表示:“这实际上是关于给客户选择权。” 她表示,她无法想象微软会为其云服务提供所有芯片的未来:“我们将继续加强合作关系,并部署来自所有芯片合作伙伴的芯片。”
随着云计算巨头试图从芯片制造商那里争夺市场份额,英伟达也在尝试反其道而行之。去年,该公司启动了自己的云服务,使客户可以直接跳过亚马逊、谷歌或微软,直接在英伟达芯片上获得计算时间。随着这场围绕市场份额的激烈竞争展开,未来一年将是检验客户是否将大型科技企业的芯片视为与英伟达最先进芯片相当,还是更像其较小版本的关键时期。
英伟达与初创企业的较量
尽管英伟达占据着支配地位,但一股投资浪潮正涌向那些初创公司,它们旨在芯片市场的未来某些细分领域中超越英伟达。这些初创企业全都承诺能提供更快的人工智能训练速度,但对于采用哪种炫目的计算技术来达成这一目标,它们各有主张,从量子计算到光子学到可逆计算不一而足。
然而,Eva 这家芯片初创公司的 28 岁创始人 Murat Onen,他从麻省理工学院的博士研究中转化出了这家公司,对于当下创办芯片企业的感受直言不讳。
“在这个领域,英伟达就是那个山顶之王,这就是我们所处的现实。”他如是说。
许多像 SambaNova、Cerebras 和 Graphcore 这样的公司正试图改变芯片的基本架构。想象一下,一个 AI 加速芯片需要不断地在不同区域间来回传输数据:信息存储在内存区,然后必须移动到处理区进行计算,之后再存储回内存区以保存。这一切都需要耗费时间和能源。
优化这一流程将为客户带来更快且成本更低的 AI 训练,但这只有在芯片制造商拥有足够优秀的软件,能让 AI 训练公司无缝过渡到新芯片上的前提下才能实现。如果软件迁移过程过于笨拙,像 OpenAI、Anthropic 和 Mistral 这样的模型厂商很可能会继续依赖大型芯片制造商。这意味着采取这种策略的公司,比如 SambaNova,不仅要花大量时间在芯片设计上,还要投入大量精力在软件设计上。
Onen 提出的是一种更深层次的变革。他没有使用传统晶体管(通过数十年的小型化实现了更高的效率),而是采用了一种名为质子门控晶体管的新组件,据称 Eva 专门为此设计,以满足 AI 训练的数学需求。这使得数据可以在同一位置存储和处理,节省了时间和计算能源。将此类组件用于 AI 推理的想法可以追溯到 20 世纪 60 年代,但由于材料障碍等原因,研究人员始终未能解决如何将其应用于 AI 训练的问题,其中一个关键要求是在室温下精确控制导电性的材料。
在实验室的某一天,“通过优化这些参数,加上运气不错,我们得到了想要的材料,”Onen 说。“突然间,这个设备不再像是科学展览项目了。”这提高了大规模使用此类组件的可能性。经过数月的工作以确认数据正确后,他创立了 Eva,相关工作发表在 Science 上。
(来源:Science)
但在这个行业中,许多创始人都曾承诺——但都未能——推翻领先芯片制造商的主导地位,Onen 坦率地承认,要判断设计是否按预期工作,以及制造商是否会同意生产,还需要数年时间。他说,带领公司在这样的不确定性中前行,需要灵活性,并且要乐于接受他人的质疑。
“有时候,我觉得人们对自己的想法太过执着,担心一旦这个想法失败就没有下一步了,”他说,“我不这么认为。我仍然希望有人挑战我们,告诉我们这是错的。”
原文链接:
https://www.technologyreview.com/2024/05/13/1092319/whats-next-in-chips/
微信扫码关注该文公众号作者