热气腾腾的生成式AI,正被苦于消沉消费级市场的芯片巨头们奉为圭臬。手机和个人电脑(PC)是两大典型代表。尤其是PC产业,在冠上“AI PC”的华丽称号后,大有要重写行业规则的架势。最先拥抱这股浪潮的,就是几个头部PC芯片玩家。PC芯片巨头们积极争“首发”。AMD称自己推出全球第一款内置专用AI引擎的x86处理器;英特尔强调自己率先提出“AI PC”概念;高通也把PC芯片“提咖”成骁龙峰会的头号主角,突出展示其能跟苹果、英特尔PC芯片掰手腕的性能。在刚落幕的CES 2024上,AI PC同样“驱寒”有术,热度爆棚。AMD这边推出首次引入NPU的台式机PC处理器,那么英伟达连推3款游戏显卡,并号称自己拥有最大的生成式AI平台。芯片掌舵人们已纷纷放话:英伟达CEO黄仁勋预言未来10年AI PC将取代传统PC,AMD CEO苏姿丰相信AI PC未来几年将重新定义计算体验,英特尔CEO基辛格称英特尔2024年的目标是为所有用户提供全球首创和领先的AI PC体验。眼见AI PC芯片的火药味燃烧得愈发浓呛,但冷静下来,日趋火热的“AI PC”概念真的能给沉寂久矣的PC市场带来换机动力吗?它究竟是PC产业久旱逢甘霖、老树发新芽的序曲,还是由换汤不换药的营销手段?PC芯片巨头们又如何接住这一波汹涌而至的端侧生成式AI计算需求?
PC芯片的市场,不是单枪匹马杀出来的,其成功与软件生态的发展密不可分。这么多年来一直雄踞PC处理器龙头的英特尔,当年便是凭借与微软Windows操作系统组成的“WinTel联盟”,从不同架构的商用处理器竞争中杀出重围,奠定了英特尔x86处理器在PC和服务器芯片市场的霸主之位。芯片、操作系统是土壤,在操作系统上生长出的各类互联网应用,推动PC进入千家万户,发展成办公、家庭场景的标配。智能手机与移动互联网的兴起,同样离不开这“三大件”。软件生态越繁荣,下游应用越好用,终端用户就越会被“黏住”。构建生态壁垒在微软、苹果、英伟达等“万亿美元市值俱乐部成员”的崛起之路都起到了堪称决定性的影响。因此,AI PC革掉传统PC的命,光靠芯片企业们的卖力吆喝肯定是不够的,必须拿出真正能说服用户买单的“杀手级”功能。英伟达深谙其道,吃尽生成式AI算力红利的它早就背起布道师的重任,过去一年来不停晒工具、晒案例,向客户、合作伙伴和终端消费者们展示生成式AI有多么容易开发、多么有用好用。▲英伟达在CES期间推出ACE微服务并演示如何制作AI NPC
微软和一众PC巨头们同样承担起给AI PC应用“打样”的重任。挟OpenAI以令天下的微软,用生成式AI接连翻新了搜索引擎、办公软件和操作系统,为全球打工人们描绘了指挥AI替你干活儿的美好愿景。PC巨头们也讲起了AI PC新故事,让办公本断网也能畅跑文本生成、概要提炼、图像生成、代码生成、智能抠图、动作捕捉、视频补帧、视频会议替身等任务,一方面吸引更多消费者,另一方面帮微软的AI开发者生态“开枝散叶”。故事已经有些新意,但要让消费者愿意敞开钱袋子,还需要能撑起故事的真本事,这就来到了芯片巨头们的主场。毕竟软件生态从诞生到繁荣,都离不开底层芯片的支撑。
当生成式AI在PC赛道的故事序章写好,PC芯片巨头们从2023年秋季开始忙得不可开交。从战况来看,显卡巨头英伟达作为“AI计算当朝元老”,在培育AI生态上一马当先;PC处理器龙头英特尔手握过去数十年的生态积累,品牌号召力一骑绝尘;AMD、高通等芯片巨头们也都积极地组建“朋友圈”,想方设法吸引PC客户。但英特尔已经不再是PC老伙计们的“独宠”。这些PC大厂们正变得“雨露均沾”,既大批量生产基于英特尔芯片的新品,又开始越来越频繁地给AMD、高通的PC芯片站台。在PC处理器赛道,英特尔客户端计算事业部的营收已经连续9个季度同比下降。▲英特尔客户端计算事业部近9个季度营收变化
虽然一大主要因素是PC市场疲软,但显然英特尔没法坐等市场慢慢回暖。毕竟不在同一个垂直赛道、但总被拿来做比较的英伟达,已经凭借狂飙的数据中心业务弯道超车,最新第三季度营收比英特尔、台积电都高。▲英伟达近8个季度营收、数据中心业务营收、游戏业务营收变化
相比之下,客户端计算业务是英特尔第一大营收支柱,营收占比一直在50%左右。英特尔迫切需要PC市场恢复增势。自9月首提AI PC概念后,英特尔行动迅速,口号喊得震天响:10月启动“AI PC加速计划”,宣布通过与逾100家独立软件供应商(ISV)合作、集合300余项AI加速功能,在2025年前出货超过1亿台AI PC;12月推出酷睿Ultra处理器,宣布将在2024年支持230多款AI PC机型。有了新故事,PC大厂们也兴奋地开始展示新机型。跟以前PC强调支持AI不同的是,AI PC将生成式AI功能作为关键卖点,强调人机交互体验和办公生产力的“进化”。通过创建本地知识库和定制个人大模型,AI PC摇身一变,成了用户的私人助理,不仅更加听得懂人话,而且执行力更强。它既能快速找到文件、图片、修复bug的操作步骤,又能从信息整理、旅行规划、内容创建、辅助写作、代码生成、知识管理、视觉设计、游戏、安全、直播、视频协作等环节来提高效率和优化体验。这些功能,要求PC搭载的芯片能让更多上述AI功能直接跑在设备端,不仅比云端响应更快更及时,而且即便断网离线也不影响用户的使用。此外,它还自带保护用户数据隐私的buff。而以前PC芯片能提供的AI算力有限,在本地运行规模比较大的AI模型往往要配置独立显卡。但独立显卡又对散热、电源功率要求较高,难以满足人们对办公本轻薄、低功耗、长续航的需求。
一类是显卡玩家。以英伟达和AMD为主,发挥GPU在并行计算上的专长,让GPU一边精进图形渲染,一边把AI处理能力做大做强,强调让电脑无需专用NPU也可以很好地支撑端侧AI。英伟达高级VP Jeff Fisher在今年CES期间称英伟达GeForce RTX是世界上最大的生成式AI平台,并称与基于NPU的设备相比,RTX AI笔记本电脑的性能可提升20~60倍。AI技术尤其对游戏市场的体验优化有很多加成。近年两大芯片巨头都在“卷”超分技术。比如英伟达一直强调由AI驱动的深度学习超级采样技术(DLSS)技术,AMD也发布了超级分辨率锐画技术3,来进一步提高游戏帧率和画质。▲英伟达在CES期间称其每台RTX笔记本电脑都做到了AI-Ready
另一类是PC处理器玩家。普遍做法是往PC处理器SoC里塞一个专用AI协处理器NPU,搭配性能越来越强的集成显卡,实现更强的AI算力,做到对高能效与低成本需求的兼顾,并在宣传思路反过来想让PC用户降低对独显的需求。AI PC处理器的设计思路越来越像一个放大版的手机SoC,卷制程、卷NPU、卷内存、卷封装,最终目的是实现更强大的AI性能:在制程上,苹果一马当先在其M3系列PC芯片中用上了台积电3nm;高通骁龙X Elite、AMD锐龙7040系列、锐龙8040系列移动处理器用的是台积电4nm;英特尔酷睿Ultra的计算Tile首度采用英特尔自家的Intel 4制程工艺,其他Tile则用上了台积电5nm和6nm。此外据传言,英特尔打算今年面向客户端市场推出的Arrow Lake处理器可能会用上Intel 20A制程和台积电3nm。在设计上,CPU+GPU+NPU异构一体化设计已经成标配。苹果M3、高通骁龙X Elite、英特尔酷睿Ultra(代号为Meteor Lake)、AMD锐龙7040系列和8000G系列都内置了专为AI加速设计的计算单元NPU。单看NPU,苹果M3内置的是16核NPU,AI算力达18TOPS;AMD锐龙7040系列的Ryzen AI引擎峰值算力达10TOPS,锐龙8040系列的NPU可提供16TOPS AI算力;高通骁龙X Elite的NPU更能打,AI算力最高达45TOPS。上述仅对比了NPU的性能,如果考虑到与其他计算单元的协同,整体AI算力则更高,如酷睿Ultra总体AI算力达34TOPS。英特尔CEO基辛格预测AI PC发展早期会出现独立的NPU,未来NPU可能会像显卡一样成为一个长期独立存在的类别,其功能也可能会逐渐融合进基础平台。在内存上,LPDDR5、LRDDR5x已经是主流产品,更大的内存容量、更高的内存带宽对本地运行生成式AI模型至关重要。苹果PC芯片都采用了其自研统一内存架构,M3 Max芯片内存容量有128GB,带宽达400GB/s,能跑数十亿个参数的Transformer模型;高通骁龙X Elite用上了136GB/s内存,最高支持端侧跑超过130亿参数的生成式AI模型;AMD锐龙7040系列最高支持256GB内存;英特尔酷睿Ultra在本地能跑200亿参数大语言模型。▲苹果M3 Max芯片的统一内存架构支持128GB的高速统一内存
而把不同计算单元紧凑地塞到一颗芯片里,离不开先进封装技术。在封装上,苹果M系列芯片UltraFusion架构用的是台积电先进封装技术;AMD更是早就在多款芯片产品里把“Chiplet堆叠”玩得炉火纯青。值得一提的是英特尔酷睿Ultra。大部分竞品只是在一颗SoC里集成多种计算单元的核心,采用的是单一制程工艺。而酷睿Ultra在客户端设计上玩起了“分离式Tile”策略,计算、SoC、图形、IO四大Tile分别可以采用来自不同晶圆厂的不同制程工艺,然后再通过英特尔Foveros封装技术封在一起。这种做法具有更强的灵活性,能实现更高能效与性价比。▲英特尔酷睿Ultra的分离式Tile架构
除了硬件性能外,AI PC芯片的核心竞争力还包括“软实力”,即与AI软件生态的协同。目前独立PC芯片玩家都在拥抱微软Windows生态,苹果则自成一派。虽然苹果在生成式AI领域的存在感远输微软,但要拼生态掌控力,苹果绝对不能被轻视,其芯片完全围绕着苹果自家终端产品的需求去设计,能够更好地在软硬协同方面去追求极致,实现自研芯片与其AI框架、AI应用的最佳协同。有趣的是,苹果也是主流PC芯片玩家中唯一没谈过其芯片如何优化生成式AI功能的企业。在发布M3系列芯片时,苹果强调的AI重点功能还是图像处理、场景编辑检测、视频剪辑等。此前巨头们扎堆涌入VR/AR领域时,苹果不随大流地提出“空间计算”概念,如今大模型战火连天,不知道苹果又将如何开辟出蹊径。
进入2024年,AI PC发令枪响,大有要与智能手机争夺生成式AI第一终端的架势。芯片巨头们也心期待着PC大厂们今年能获得一个好收成。AI PC显然是个具有吸引力的概念,多家市研机构都给出了积极的预测:IDC预计2024年中国市场上搭载AI功能终端设备将超过70%,AI终端占比将达到55%;Canalys预计2024年具备AI功能的PC出货量市占率将达到19%,AI PC出货量在2000万台左右;2027年将有60%的电脑具备AI处理能力,出货量将超过1.7亿台;波士顿咨询预测到2028年,AI PC将占PC市场的80%。当年英特尔微处理器横空出世,联手微软Windows操作系统掀开了PC革命的大幕。但时代毕竟不同了,进入后PC时代,消费电子产品形态愈发多元,只要有网,生成式AI功能可以进入任一形态的终端设备中。随着工作与生活的界线越来越模煳,PC的功能不再不可替代。云端AI确实不是万能的,但问题是,端侧AI也还没冒出来普惠的刚需。当前AI PC花式宣传的端侧AI功能,更多是在断网、缺GPU、涉及敏感数据等特殊场景紧要关头中救急用的替代品,并不会成为提高生产力的主力。对于重度AI制图、内容创作、视频生成等用户来说,上云或用独显才是保证高效率的首选;对于轻度AI应用用户来说,手机端侧生成式AI体验同样越来越好。AI PC有些新意,但这些新意足够打动消费者、驱动PC市场迎来久违的换机潮吗?芯片巨头们又如何在AI PC芯片的核心性能和生态上与同行拉大差距?先让子弹飞一会儿。