Bendi新闻
>
2024,AI芯片大厂绝对厮杀,泼天富贵人人有份!

2024,AI芯片大厂绝对厮杀,泼天富贵人人有份!

9月前
来源:硅基研究室
作者:白嘉嘉
图片/AI绘图、原文



2024年注定是AI芯片厂商们绝对厮杀的一年。


过去一年时间里,AI赛道烈火烹油,以英伟达为代表的GPU厂商手握算力心脏,背靠AI企业扩大云计算规模和训练大模型的需求,吃下了AI时代的第一笔红利,赚得盆满钵满。


随着时间来到2024,AI从云端蔓延向终端,「AI+产品」概念下的许多新物种逐渐走到消费级的临界点。为了捕捉这些增长点,雄踞于各个细分领域的AI芯片龙头纷纷开启了跨界合作,一手推出新品,一手寻找新的合作伙伴。


即便是确定性相对较强的云端算力市场,也透着一股「山雨欲来风满楼」的气息。谷歌、微软、亚马逊先后宣布推出或计划推出自研AI芯片,AMD的新产品MI300X在性能上紧咬英伟达H100,英特尔CEO基辛格透露:“整个行业都被推动来减少CUDA(英伟达推出的运算平台)的市场。”


2024,AI芯片市场的格局将迎来什么变化?而这泼天富贵,又将花落谁家?



1/云端之战:英伟达如何对抗围剿?



从云端需求和企业动作来看,2024年研发下一代大模型仍将是各大科技公司竞争的核心,其中多模态模型占比逐渐提高的趋势带动了更大的算力需求。


C端AI应用数量的增加也为云市场的增长注入了稳定性。过去,模型的预训练是GPU消耗最大的环节,大约80%,但随着越来越多的消费者开始调用模型进行推理,未来推理和训练的算力占比将倒置。晚点LatePost报道,多位大模型从业者估算,如果千亿参数或更大的人工智能模型被广泛使用,大模型的训练成本和推理成本会达到2:8,甚至1:9。


对AI创业者以及科技巨头来说,这个消息忧喜参半。


2023年,所有涌向AI的掘金者都对上游芯片供应商有一种复杂的情绪。研发AI产品离不开AI芯片这颗算力心脏,但高昂的价格和短缺的产能同时也令他们无时无刻不被焦虑包围。


除了恐惧拿到芯片的同行领先自己在市场上铺开业务,更担心卖方市场的格局仍将持续下去,无法摆脱向上游「纳税」的命运。


但令人意外的是,这些赚得盆满钵满的卖水人同样不安。GPU龙头英伟达创始人黄仁勋在去年十一月的一场演讲中表示:“我们不是假装公司一直处于危险之中。我们(确实)一直处于危险之中。”


黄仁勋在AI的暴风眼站了一年,这句话大概是他的真实感受。


压力首先来自于同行竞争。


作为市场上唯一有希望在GPU领域挑战英伟达的企业,AMD每次发布新芯片,英伟达都会被拿出来做对比,你甚至可以在去年12月的多轮交锋中看到火花迸射。


AMD12月6日推出MI300x时,宣称表现优于英伟达的AH100。英伟达随后发布了自己的基准测试作为回应,表明AH100在正确的设置下仍然更好。AMD再次对此做出回应,发布了新的基准测试,再次显示MI300X在正确的设置下表现出色。



此外,英特尔虽然在GPU领域鲜有建树,但仍未放弃这块甜美的蛋糕。英特尔声称,将在2024年上市的Gaudi 3,性能超过了英伟达的AI芯片H100。


除了同行,英伟达的客户们也并不忠诚,谷歌、亚马逊、特斯拉、阿里、百度、微软……几乎所有的大客户都宣布将自研AI芯片。


这些客户还对英伟达的生态护城河发起了猛攻。“整个行业都被推动来减少CUDA的市场”,英特尔CEO基辛格最近公开表示,MLIR、谷歌和OpenAI等都在转向一个“以Python语言为基础的编程层”,以使AI训练更加开放。


自研芯片和生态建设并非易事,为何反倒成为了行业共识?英伟达的「镰刀」实在太锋利了。


《财新》的一篇报道中显示,哪怕花英伟达同样的成本,只要做出十分之一的效果,这些科技厂商便已经有利可图。更具体的案例是,按照谷歌的报价,使用其最新的AI芯片TPUv5e在训练、推理参数少于2000亿的大模型时,成本低于用A100或H100。


英伟达抢客户的行为也让云厂商难以接受。去年3月GPU最稀缺的时候,英伟达推出云计算服务DXGCloud。简单来说就是把卖给云厂商的GPU再租回来,进一步优化后再出租给需要GPU算力的客户。一来一去,云厂商承担了数据中心的建设成本。但客户却去了英伟达。



对英伟达来说,最大的变量可能还是在中国。近日外媒的一篇报道显示,由于对华出口芯片的性能被一压再压,中国玩家正在对其失去兴趣,这意味着它可能失去接近五分之一的营收。


当然,作为硅谷最具战斗精神和固执的企业之一,坐以待毙从来不是英伟达的风格。过去的一年里,借占市场份额接近95%的最大GPU卖方身份,英伟达的护城河其实被拓宽了。


英伟达的核心竞争力主要由三个板块构成——供应链优势、软硬件生态、投资。


软硬件生态方面,预计2024年出货的AI芯片H200及生态配件,仍是市场上最适合大模型生长的「土壤」。而投资方面,2023年英伟达完成了20多笔投资,投资版图涵盖AI相关的各个行业,即便未必能从中稳定获利,过程中积累起的KnowHow,也将逐渐成为其它初创企业选择英伟达的理由。


真正决定2024年市场格局的,是英伟达的供应链优势。


AI芯片产业链冗长、复杂,每个细分领域都有各自的领头企业,只有将它们集成到一起,才能生产出性能最好的芯片。


英伟达笼络它们的手段是承诺不可取消的订单。目前,英伟达有111.5亿美元的采购承诺、产能义务和库存义务,另外还额外签订了价值38.1亿美元的预付费供应协议。这些被承诺的订单中包含台积电近六成产能和SK海力士、三星、美光HBM的大部分供应。


台积电封装对芯片性能的影响无须多言,HBM同样关键。HBM是高带宽内存芯片,而GPU只有内存足够大、数据传输速度足够快,才能保证运行效率。


单从这方面看,没有其他供应商可以与之相媲美,因此他们也将无法参与正在发生的狂热AI浪潮,即便是谷歌等科技巨头。


综上所述,2024年的云端战事确定性较强,虽然英伟达遭遇围剿,但无论是自研芯片还是生态建设都需要时间来慢慢发酵,至少在供应链紧张的问题解决之前,英伟达的统治地位不会被动摇。



2/场景之战:AI PC  AI Car  AI Phone成最热版块



淘金先富卖铲人,背后的AI芯片厂商已经摩拳擦掌。分行业来看,AI PC、AI Phone、AI Car是其中关注度最高的三个板块。


AI Phone:亟待AI拉动新增量


过去几年时间里,手机处于增长乏力的状态,即便厂商在硬件上「卷」到了极致,仍难以掩盖创新缺失的残酷真相。除了华为mate 60横空出世给市场带来了一些新鲜血液,就连苹果的发布会都难以讲出说服消费换机的新故事。


AI是它唯一能拉动增长的发力点。「AI上机」的传说从ChatGPT向C端开放起就飘荡在市场的上空,被谈论了一整年。但在大模型向小型化发展之前,硬件与模型规模之间的矛盾几乎不可调和。


事实上在手机端,至今也很难在保证模型性能的情况下,避免手机发热、内存占用量过大等体验对消费者购买欲产生的影响。


年初,手机芯片双雄之一高通演示了在安卓上运行Stable Diffusion的效果,并在近期宣布将推理时间缩短到1秒以内,但另一雄的联发科工程师表示,本地运行13B体量的小模型就意味着需要占用约13GB的内存,再加上安卓本身的4G,在不下载任何其他App的情况下,就已经超过了大多数手机16GB的内存容量。



即便如此,市场仍为AI Phone领域的增长投下了赞成票。它们的理由是,手机是人们日常使用频率最高的电子产品,基于入口优势,虽然本地部署还存在一定的困难,但云端运行AI带来的增量仍不容忽视。分析机构Canalys预测,2024年全球智能手机出货量将在2024年恢复增长,增幅约为4%。


AI PC:硬件、框架之争


相比之下,AI PC的进展则顺利得多。理由也很简单,与手机相比,PC的体积更大,芯片性能的上升空间更广。IDC预测,2024年将成为AI PC快速发展的第一年,2024年整体PC市场AI PC占比将达到55%,而2027年将达到85%。


目前PC端的AI芯片厂商已经释放出了浓烈的火药味,彼此间的混战一触即发。


NPU与GPU之争是混战的第一个赛点。


GPU无需多言,关键是NPU为什么能站上擂台。与算力中心背靠成千上万台集成了CPU、GPU等各种芯片的服务器不同,PC的算力主要集中在一块「总芯片」当中,这块芯片由CPU、GPU、NPU等「分芯片」构成,各芯片分工不同。其中NPU就是专门被设计出来处理AI相关运算任务的。


因此,矛盾产生了。虽然GPU的定义是图形处理器,但同时它浮点、并行运算的特性也促使它成为了运行AI运算的最佳载体之一,这一点在云端已经被证明。一旦AI PC实现,大量AI运算任务势必带动GPU的销量。本次CES展开幕之前,英伟达连发三款消费级GPU,显然是向市场释放信号。


X86构架和ARM构架之争,是混战的第二个赛点。



X86和ARM是芯片的两种构架。X86构架是英特尔的代名词,在PC芯片端,直接与英特尔展开竞争的是采用ARM构架的手机芯片龙头高通和联发科。


X86和ARM的区别可以简单概括成前者性能、功耗双高,后者双低。过去,ARM一般被用于手机,但近年内,随着ARM芯片的性能不断提高,低功耗的优势正在引起业内玩家的注意。微软、苹果、Meta等厂商都在支持基于ARM的PC。据界面新闻报道,英伟达和AMD正在考虑2024年为移动PC提供基于ARM的解决方案。


高通对于AI PC垂涎已久,去年10月面对Windows 11发布的骁龙X Elite芯片与同级X86相比,性能可达竞品的两倍,而达到相同峰值性能时,功耗仅为竞品的三分之一。


AI Car:两大阵营跑马圈地


虽然AI PC的战场已经硝烟四起,但若是与AI Car相比,甚至能被称作一团和睦。背后的原因也很好理解,PC和手机是为存量市场里找增量,而车载AI则是实打实的蓝海。


「AI上车」同样有两个赛点,分别是智能座舱和自动驾驶。


在智能座舱领域,高通率先采用SoC逻辑设计车载MCU芯片的举措为它带来了先发优势,因此扮演着守城者的角色。眼下,它正面临着英伟达、联发科、英特尔等企业的多重围攻。


去年6月,联发科宣布将与英伟达合作,为下一代软件定义汽车提供全套车载人工智能座舱提供解决方案,覆盖从豪华到主流的所有汽车细分市场。


双强合作的模式是,联发科将开发集成英伟达GPU的汽车SoC。而英伟达则是目前高端车型主要采用的自动驾驶系统供应商,客户资源广泛。本次CES展中,英伟达公布了DRIVE系列汽车业务的最新进展,理想、长城、极氪、小米等企业均已采用DRIVE Orin平台为其智能自动驾驶系统提供支持。



英特尔亦在CES宣布了进军汽车行业的重要战略,推出专为下一代汽车设计的AI增强软件定义车辆系统芯片(SoCs)。其旗下的自动驾驶解决方案公司Mobileye一直处于世界领先的地位。


在自动驾驶领域,则呈现两强争霸的格局。英伟达与地平线分别包揽高端和低端车型,按覆盖车型价格区间的广度排名,地平线第一,英伟达第二。


与英伟达CUDA类似,地平线也有自己的生态护城河。同时,作为本土供应商,地平线在交付效率上更具优势。



3/格局之战:2024,谁是最关键的变量?



各家芯片厂商在AI PC、AI Phone、AI Car卷出天际,在这个堪比「春秋战国」的新竞争时代,即便英伟达依旧遥遥领先,一些关键问题也随之而来:2024年,谁能杀出重围?谁又是英伟达之外最关键的变量?


毫无疑问,这将是一场格局之战。我们可以从蛛丝马迹中对2024年谁将杀出重围做出一些预判。


虽然三大热门场景都有变化,但增量的绝对值不尽相同。综合硬件性能、用户需求、市场规模等因素,「硅基研究室」判断,AI Car会是增量最大的领域,AI Phone次之,AI PC最末。


车端可能是2024年最扑朔迷离的AI芯片战场。


市场上玩家布局的路线主要可以归纳成两条。一条从自动驾驶出发,向智能座舱拓展,譬如英伟达和Mobileye(通过英特尔实现)。另一条则是从智能座舱出发,向自动驾驶拓展,譬如高通。


在智能座舱领域,眼下市场上各家新能源车企的竞争,与其说是芯片性能之争,不如说是对用车场景的理解之争。而在自动驾驶领域,因为和安全息息相关,必须要保证硬件运行的稳定性,并且需要经过市场验证,领先玩家具备更高的壁垒。



从这个角度出发,英伟达、Mobileye将率先受益,地平线等二线厂商有望凭借低成本、高成熟度的产品成为车企的替代方案。


但是,如果将视角切换到交付的稳定度和市场铺开面上,则是地平线、华为等国产玩家具备更强的潜力。


一方面,在地缘政治背景下,AI芯片的对华出口能否持续、稳定,需要画一个问号。性能和生态固然是一道门槛,但正在解决当中。


另一方面,虽然目前地平线主要在低端车型中铺开,但企业在自动驾驶领域的发展高度依赖数据积累,未来以更快的速度对先进厂商完成反超也并非没有可能。


在手机领域,AI芯片厂商享受红利的前置条件是大模型本地部署。



众所周知,大模型上机有两种模式,一种是云端接入,另一种是终端部署。前者靠将用户的诉求反馈至云端,运算后在将结果发回手机。后者全流程均依靠本地硬件完成。


从能实现的功能上来看,两者类似,唯一对消费者购机意愿影响较大的因素是“是否愿意将本地数据(包括照片、文件、对话记录)上传至云端”。从这一点出发,本地部署确实存在需求,手机AI芯片的增长值得期待。


那么高通和联发科谁能将占据领先地位呢?


从市场站位来看,高通和联发科分别占据高端和中低端手机市场,向上突破的难度远大于向下兼容,并且目前推出AI手机的厂商均将价格定位在高端。


高端的市场站位给高通带来了更丰厚的毛利率,对比财报来看,高通第三季度的毛利率约为55.1%,联发科毛利率水平为47.4%,这意味着高通有更多的「余钱」来推动研发。滚雪球效应下,恐怕联发科想要追赶高通仍有一段路要走。


值得一提的是,苹果和华为的AI芯片计划也会对市场格局产生影响,但程度较轻。


近年来,苹果手机芯片的性能提升幅度与高通、联发科等竞争对手相比均不占优势。不久前登场的两大安卓芯片——高通8 Gen3以及联发科天玑9300,在CPU多核性能、CPU多核能效比、GPU峰值性能、GPU能效比等核心技术指标上均已领先同时期的苹果A17 Pro。


华为方面,受到地缘政治因素影响,目前在芯片性能方面还难以和国际一流芯片厂商掰手腕。


在PC端,虽然近日AI PC的声量不小,但距离它真正撬动C端市场的销量,还需要一些时日。


从C端场景出发,可以大致将AI应用区分为办公和娱乐两大类。


办公场景中,虽然微软、金山办公、Midjourney、Adobe等软件已经将AI功能融入其中,但它们的推理任务主要还是由云端负担,并且已经形成了按次付费的商业模式,不需要本地硬件具备太高的性能。


在娱乐场景中,在AI热兴起之前,为了支撑游戏流畅运行,本身就对GPU为代表的图形处理能力有较高的要求。按照眼下能被「塞」进PC的模型规模,过去用于渲染游戏画面的GPU,完全有充足的算力支撑AI衍生应用运行。


仍以英伟达为例,虽然在本次CES揭幕之前发布了三款新的消费级GPU,但三款GPU的性能均未超越2022年发布的RTX 4090。




综上所述,2024年,在云计算等传统领域,英伟达得益于供应链优势等护城河,最值钱的卖水人地位短期内不会发生改变。


而在AI PC、AI Phone、AI Car三大场景中,分别在技术和渠道方面占据优势的英伟达和地平线将率先吃到AI Car的红利,而高通有望在亟需新故事拉动增长的AI Phone品类杀出重围,至于AI PC,在新场景和新工作范式出现,并带动更强的硬件需求之前,相关企业的市场份额及销量还有待观察。


2024年是AI芯片厂商迎来泼天富贵的一年,但同时,也能感受到水面之下酝酿着激烈的变化。企业和投资者当然可以投身这片蓝海,但最好时刻保持警惕。


参考资料:
大模型公司「卷」芯片,英伟达危?|元宇宙日爆
2024年,人工智能芯片展望 | 半导体行业观察
英特尔推最新AI处理器,挑战英伟达:训练主导地位不会持久|澎湃新闻
英伟达H200突然发布:容量翻倍,带宽狂飙| 半导体行业观察
英伟达芯片,最新路线图 | 半导体行业观察
作为自动驾驶芯片领域的独角兽,地平线不再抗拒低端滤镜| 零态LT
当苹果芯片跌落神坛| 智东西
一夜暴增5600亿!美国英伟达发布最强消费级显卡,AI 性能增长超170%|直击CES 2024|林志佳

联系我们:txm176(值班微信)广告及商务合作:电话18660411611投稿及采访约谈:邮箱[email protected]

版权声明:制造界除发布原创文章外,亦致力于优秀文章的交流分享。转载须注明文章来源和作者;申请转载授权请在文末或后台留言。版权所有,违者必究。

微信扫码关注该文公众号作者

来源:制造界

相关新闻

1个芯片顶英伟达3个?这个偏爱印度的创始人爆肝8年,终于等来抢英伟达泼天富贵的一天!大模型应用成本卷到了千元级!云天励飞发布“深目”AI 模盒:搭载自研芯片,单手可托起OpenAI「突拔网线」,国内大厂笑疯!泼天流量来了,微软急伸橄榄枝做好三件事,接住618的泼天富贵!阿里妈妈增长秘籍大公开OpenAI陷巨大算力荒,国内大厂抢先破局!打破单芯片限制,算力效率提升33%重磅!AI 技能秒杀工程师!大厂或再次疯狂裁员重磅!AI工程师诞生!技能秒杀大厂码工国产芯片大厂三年干到 70 亿市值,却一次性裁员 50 %?员工曝 CTO 不懂技术!来了!国内年度AI芯片盛会定档9月,50+大咖、7大板块,还有先锋榜单速递|曝孙正义抢英伟达的大客户并与供应商谈判!少赚 1500 亿美元后,寄托于 Arm 成为下一个英伟达,明年生产 AI 芯片3440亿元!“国家大基金三期”成立,或将重点投资AI芯片产业华谊兄弟突发!董事长被证监局警告;苹果首次发布搭载AI芯片的iPad;舒肤佳香皂再现刀片,官方紧急回应丨大公司动态云天励飞余晓填:剖解大模型技术演进与挑战,算法芯片化突破大模型落地“三角约束”丨GenAICon 2024苹果M4芯片问世,直接让iPad Pro秒杀了所有AI PC!澳洲巨富喜获泼天富贵!普通人哭瞎!泼天富贵!温哥华$64万独立屋$410万售出!屋主含泪怒赚$350万!投资者开始扫货独立屋!10.2万亿!泼天富贵后的暗战!泼天富贵!美剧《辐射》带动游戏在线人数暴涨4倍,吸引大批萌新玩家重磅!洛杉矶将赔偿华裔和老墨巨额“强拆”款!泼天富贵正在降临...泼天富贵!$11.3亿史上最大头奖,幸运儿就在隔壁!泼天富贵!列治文华人小伙独中5800万加元大奖!要去学吉他...甘肃,就是想要一个泼天富贵!泼天富贵!澳洲2亿乐透巨奖被2人瓜分!官方全网搜寻另一位神秘获奖人!醒来账上多了1个亿,这是什么感觉?剧透GPT-5,物色芯片厂,2024年的Sam Altman已经火力全开,只因不敢停下来
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。