中国大模型融资暗战：罗曼蒂克的快速消亡

国际科技财经移民娱乐民生时事体育

Bendi新闻

中国大模型融资暗战：罗曼蒂克的快速消亡

10月前

投资人们后悔了吗？

文｜于丽丽

编辑｜刘旌

来源｜暗涌Waves（ID：waves36kr）

封面来源｜视觉中国

一场资本暗战‍‍‍‍‍‍

这是一场融资的突变。

在持续了一年多的中国大模型鏖战中，由杨植麟创办的月之暗面，尽管是一个是常被提起的名字，但其实在融资上并不占有先机。

直至2023年底，成立于2021年的MiniMax，和成立于2019年的智谱AI，凭借“起跑早，已有相对成熟的大模型产品出来”，还是中国估值最高的两家大模型创业公司，而成立于2023年的百川智能、月之暗面、零一万物则追随其后。

2024年春节是一个分水岭。2月中旬，月之暗面突然传出“完成新一轮超10亿美元融资，估值达25亿美元”的消息。尽管该消息被很快修正为“8亿美金”，但据暗涌Waves了解，8亿美金其实是一个相对保守的数字，“这并不包括老股东的加码以及因为跨春节尚未走完投资流程的机构。”

尽管大模型必然是一场持续融资的昂贵游戏，但大部分公司融资时，基本是“融个两三亿美金先垫着”的状态。去年十月，百川智能获得的单轮融资是3亿美金投资，智谱AI 2023年累计获得的融资是超25亿人民币（约3.48亿美金），而现在，成立仅一年的月之暗面，不仅把单轮融资额提到了史无前例的量级，也成为赛场上现阶段估值最高的独角兽之一。

“这显然是一个深思熟虑的策略性动作。”一位大模型的投资人对暗涌Waves形容道。

在一些投资人看来，虽然杨植麟“长板很长”，比如他研究、技术禀赋过人，但短板同样明显，比如“缺乏商业和管理经验”。最终能让阿里如此重注，除了战略层面的耦合之外，其实还和一人有关。

她就是金沙江创投管理合伙人张予彤。多位投资界人士对暗涌Waves表示，月之暗面融资背后，张予彤是至关重要的推动者。但有意思的是，金沙江并没有直接投资月之暗面——尽管他们投资了杨植麟的上一家公司“循环智能”，且这家机构的标志性人物、其管理合伙人朱啸虎在近期接受腾讯新闻访谈时，甚至鲜明旗帜地表示：中国大模型公司都没戏，也不会投资任何一家。

张予彤和杨植麟的交集早有渊源。在月之暗面成立之前，同样是清华大学毕业的张予彤，就已经投资了杨植麟的上一个创业项目“循环智能”。

让阿里下如此重注，一位大模型投资人认为很大一部分来自张予彤从中的穿针引线，“毕竟说服巨头转变战略大手笔支持你，并想出一个理想的交易结构都不是一件容易的事。”

2013年，金沙江创投在斯坦福大学举办了一场中国留学生创业比赛。二十多支参赛团队中，张予彤和同事仅投资了后来的小红书创始人兼CEO毛文超一人。一位参与过大模型创业公司融资的AI投资人，用这段经历强调这位继朱啸虎之后，第二位依循业绩机制晋升至主管合伙人的投资人“见过大世面”。

另一个参与过MiniMax投资的投资人则认为，月之暗面从阿里拿到更多钱的关键策略是“主动做了大幅妥协”的“先下手为强”。

毕竟，融入更多资金，也意味着股权将被稀释。在他看来，之所以月之暗面愿意妥协，是更想保持独立性发展的公司所排斥的，比如“阿里将成为月之暗面持股40%的单一大股东”，且融资中很多一部分“将用算力支付，最终变成阿里云的消耗”。

但这种说法被月之暗面的投资人否认。一位投资人对暗涌Waves说，融资过程中月之暗面所谓被阿里强控的说法，“不存在的”。“月之暗面在谈判中，已经把一些苛刻条款逐一谈掉了”，具体则包括“做了AB股处理，使得团队保有绝对的决策权和控制权”等。

在这位投资人看来，这轮融资是“杨植麟深深明白冲击AGI需要很多算力和钱”，所以本质是一种“以合理代价获得这些资源”的“理性选择”。

月之暗面新一轮融资，显然给其他大模型公司也带来某种紧迫感，尤其是正在进行新一轮融资的MiniMax。

据暗涌Waves了解，MiniMax新一轮阿里领投的超6亿美金融资，已基本交割完成，投后估值也在25亿美金左右。有MiniMax的投资人对我们表示，新一轮还正在持续中，“两轮加起来会超过10亿美金”。

但据我们了解，关于阿里部分的投资数额显然少于月之暗面。当然，一位知情人向我们透露，“阿里在MiniMax所占股权比也不到20%”，不过MiniMax和阿里至今未对这笔融资官宣。

一名美元基金的AI投资人认为MiniMax没有从阿里拿更多钱，是因为融资策略不同，或许他们想要一种“更平衡的股权结构”。毕竟选择一个巨头，也意味着对其他巨头的放弃，另外被巨头强控制的公司来说，它的资本退出通道通常也不会清晰，这必然加大很多财投参与的难度。

因为两者的商业模式同样是在C端发力，且都是美元架构，所以它素来被视为与月之暗面最针锋相对者。

相较于月之暗面，MiniMax始终是个神秘的公司。创始团队的所有人至今对外都是一个模糊的形象。网上能搜罗到的唯一一篇专访，也出自副总裁和开放平台负责人魏伟。

其实，早在创立MiniMax前，创始人闫俊杰就已是商汤的风云人物。在一位参与过MiniMax融资的投资人看来，闫俊杰堪称商汤史上最强悍的实习生：4年时间，从2015年的实习生升至2019年的商汤科技副总裁、通用智能技术负责人。

这期间，他不仅负责搭建了商汤科技的深度学习工具链和底层算法，以及通用智能的技术发展，还负责搭建了商汤的人脸识别和智慧城市等相关技术体系。

大模型公司的一号位必须在技术上有权威才能服众，而闫俊杰就是符合这个标准的人：在深度学习和计算机视觉领域，闫俊杰发表顶级会议和期刊论文100多篇，Google scholar引用超过10000次。2021年底，闫俊杰和他在中科院校友杨斌等人一起创立了MiniMax。

一位大模型投资人对暗涌Waves表示，MiniMax的早期融资都异常顺利。尤其是2021年的第一次融资，“从开始决定正式融资到敲定份额也就一周时间”。2023年4月，MiniMax被曝出在以超十亿美金的价格进行新一轮的融资。此轮融资后，MiniMax的投资机构名单里，不仅有甚少露面的米哈游，有高瓴创投、红杉中国及最早投过商汤的IDG等资本巨头，还包括第一次被曝光已出手大模型的腾讯。

MiniMax是国内第一家估值达到10亿美元的大模型创业公司，也是2023年上海猎头口中除Shein外，唯一能从字节逆向挖人的公司。事实上，2023年加入MiniMax的，就包括今日头条前用户产品负责人张前川。

巧合的是，据多位投资人透露，MiniMax的融资也和一位女性密切相关：MiniMax(稀宇科技）的联合创始人和首席运营官贠烨祎。公开信息几乎没有关于她的内容，但据暗涌Waves了解，创立MiniMax之前，她曾在商汤CEO办公室负责战略等业务。

多位接近闫俊杰的人士表示，“闫俊杰是典型的技术宅，说话声音小，可能并不擅长对外”，所以平时公司对外融资、以及一些管理、外部活动也通常由贠烨祎负责。

在一名MiniMax的早期投资人眼中，生于1994年的贠烨祎“干练、有气场、执行力强”，“有种超出其年龄的成熟”。和闫俊杰一样，商汤也是贠烨祎从学校毕业后的第一份工作。在商汤的几年里，贠烨祎作为商汤联合创始人徐立的助理，见证了商汤从一家初创公司历经12轮、融资52亿美元，上市前成长为全球估值最高的百亿美金AI独角兽的全过程。

在一位参与过两波AI浪潮的投资人看来，经历过AI四小龙频繁融资那个时代的人，“难免有一种乐观。”不过，即便阿里投注的数额不及月之暗面，但如果顺利完结，阿里也将成为MiniMax的最大股东。除阿里外，MiniMax的股权结构中，还包含了各投了上亿美金的米哈游和高瓴创投。一位知情人士向我们透露，红杉中国对MiniMax的投资，也是目前它下注最多的一家大模型公司。

月之暗面与MiniMax在融资上的“短兵相接”，至少说明了：仅隔一年，挤上牌桌的几家基础大模型创业公司就要因为资本环境的收缩、以及巨头战略的调整，在融资端大幅收敛。

经过一年淘洗，参与融资的中国大模型创业公司牌桌上，除月之暗面和MiniMax外还剩下：智谱AI、百川智能和零一万物。除智谱AI是鲜明人民币架构、围聚的是典型人民币基金财投和国资、政府一些产业基金外，更多时候，几家公司都要在相同的池子里争夺有限的钱。

“2024将是几家大模型创业公司淘汰赛的关键一年。”一家美元基金的AI投资人对我们说。

相比模型能力的追赶，中国大模型的融资危机显然要更早到来。

阿里的恐惧和野心

说服巨头转变战略不是一件容易事，除非巨头主动求变。某种意义上，月之暗面赶上的恰好也是这样一个时间窗口。

在一家美元基金的AI投资人看来，阿里在大模型投资上的突然激进，是因为一度主导战略与投资的战投之王蔡崇信和兼具“技术”与“投资”双重视角的VC“吴妈”吴泳铭的回归。因为这意味着“更坚定、更快的决策速度”以及“更敢赌”。

早年操盘过收购中国雅虎，后来参与过收购饿了么等项目的蔡崇信是阿里投资业务的缔造者。在他的主导下，阿里在2013年开始放弃财务投资，走上强调业务耦合的战投路线。

回归阿里前，吴泳铭也早已是一名职业投资人：2015年，吴泳铭在阿里外部创立了元璟资本。截至2023年9月，元璟资本在硬核科技、工业智造、产业数智化、跨境出海等方向，至少投资了一百五十多个集中在A轮、B轮等轮次的投资标的。

关于对早期投资的理解，吴泳铭最广为人知的一句是：“早期来承担不确定性的，就是要认可和理解奇怪的想法，理解看似不可能的想法”。

两位职业投资人的回归也给阿里在大模型投资上带来明显的风格偏移。如果说之前，阿里在大模型创业公司投资上，更偏好那些老司机风格的创业者，比如零一万物的李开复，百川智能的王小川甚至智谱AI的唐杰，当下一个明显的转变，则是重押更年轻的杨植麟和MiniMax的闫俊杰，这也完全吻合当下阿里内部业务调整的两个底层逻辑：押注“技术”和“年轻人”。

这种境况，也难免令人从如今的杨植麟联想到当年的蒋凡。

早年间，在淘宝从PC端到手机端的迁移中，颇具技术前瞻性的吴泳铭因为更早感知到潮水方向，推动阿里提早做了很多布局。其中就包括参与了从创新工场手中收购蒋凡友盟的案例。

事实也证明，蒋凡在引入阿里后，也给日后的手机淘宝带来爆炸式增长。不仅友盟的案例如此，吴泳铭参与投资并购的高德，后来也成为阿里不可多得的流量入口。

在上述投资人看来，这波AI是新一轮的平台级流量入口争夺，阿里“带着五个大模型公司打群架”的策略，上限显然是又一次“新的流量入口的布局”。至于下限，则可以完成，让自家的云服务成为诸多大模型公司的算力基础设施，“各家多少都会给股东面子，消耗阿里云，这样阿里就是最大赢家。”

在很多AI投资人看来，月之暗面与阿里的绑定是非常自然的一个结果，“这就像OpenAI绑定微软，Anthropic绑定AWS和谷歌一样”，但问题是中国只有阿里。

其实，在大模型创业公司发展的早期，很多互联网巨头也是不吝于撒钱看牌的。

在重投月之暗面和MiniMax之前，阿里已投资了零一万物，智谱AI以及百川智能三家公司；腾讯则投资了智谱AI、百川智能以及MiniMax三家公司；美团投资了智谱 AI，并投资和收购了光年之外；雷军不仅亲自去MiniMax和智谱 AI 拜访，他创立的顺为资本也投资了百川智能、智谱 AI 和 MiniMax。

但当大模型创业公司吸金能力进一步膨胀，看牌的代价变大时，各家则陷入不同的犹疑中。

针对腾讯开年后的沉寂，有投资人将之归因为“可能腾讯更想做好自己的混元大模型”，以及“腾讯云向来没有阿里云对阿里那么重要。”

一位参与过多家大模型公司融资的AI投资人向暗涌Waves透露，去年底，在游戏版号收紧后，腾讯内部曾有过一次复盘会议。大意是要收紧不必要的投资，如果投新的钱出去，就要算一算是否跑得过回购腾讯股票。在他看来，这或许是腾讯后来没有积极投资大模型的原因，另外按照腾讯既往的，无论游戏、视频还是音乐等赛道的操作路径来看，腾讯都不是激进出击型，但后边照样能赶上来。

至于美团和小红书，一位美元基金的AI投资人透露，月之暗面的新一轮融资中，他们本有意参与战略投资，但因为“阿里将月之暗面估值提升了50%，且重仓持股40%，最终就放弃了。”当然，也有AI投资人告诉我们，“小红书还是会投moonshot。”‍‍

相比之下，有“豆包”的字节跳动和有“文心一言”的百度在大模型创业公司的投资上，基本是按兵不动的状态。

一个参与过MiniMax融资的投资人告诉暗涌Waves，其实去年6月前，字节曾有意投资MiniMax，他们甚至花了很长时间，去和另一家大厂争股权比大小，“甚至具体到小数点后”，但后来可能因为顾虑监管压力等原因，最终还是退出了。不仅如此，字节也退出了一度有意投资的，由微软全球合伙人、副总裁、前微软亚洲研究院首席科学家姜大昕创立的阶跃星辰。

唯有阿里重拳出击，在很多投资人看来，也是因为阿里危机感最重。

几年前，阿里8000亿美金市值时，微软和阿里几乎一个水平，而最近微软市值已达3.12万亿美金，并超过苹果，再次登顶全球第一。很多行业人士认为微软云业务的高速增长与阿里云业务的滞缓背后，除了双方软件市场的成熟度外，还有一个最大的不同是，微软有openAI。微软财报会上曾透露过的一个数据显示，目前微软拥有的5.3万个Azure AI用户，其中三分之一是过去12个月加入的，AI相关业务(如OpenAI的API服务、模型训练及微调等MaaS服务)贡献了6个百分点的增长。

某种意义上，阿里寻找自己OpenAI的意愿前所未有的强烈，是这次重押月之暗面和MiniMax的根源。何况，这些投资同时也是订单，被投的大模型公司带来训练、推理消耗可以直接体现在与AI相关的云业务的增长上。

当然，阿里对月之暗面的重股比投资也复活了很多人对移动互联网时代的记忆。当时在蔡崇信的推动下，阿里对所投企业股占比逐渐从20%提高到了30%甚至以上。它投资的很多重要项目，包括高德、UC 等在内，也都经历了从少数股权投资、商业合作，再到被整体并购的过程，这也难免让人会去思忖这一波AI公司与阿里的未来可能。

而关于这波大模型创业公司最终能否与巨头抗衡，42章经创始人曲凯在和家办从业者莫傑麟在播客对话中，提过一个有趣的表达。在莫傑麟看来，本质上，巨头是在玩贪吃蛇的游戏，全球创业公司则在玩俄罗斯方块，所以创业公司要想赢，就要填补巨头不做或者执行出问题的空间。关键是要让自己足够快——事实上，如果巨头可以学会把自己变小、变快，同样可以像创业公司。

浪漫不过一年

月之暗面的新一轮融资，某种意义上也意味着中国大模型公司的投资，告别之前财投和巨头并存状态，正式进入巨头主导的时代。

但在这波AI浪潮中，传统风投已完全无法和早年互联网兴起时相提并论。

尽管他们并未缺席这波浪潮，甚至是反应最快的。一位参与过数家大模型创业公司融资的FA告诉暗涌Waves，在这波AI浪潮的中，主流VC的反应无疑是最快，其次是互联网战投，然后才是一些国资或政府产业基金。

早期美元VC们参与颇多，但当大模型创业公司在后续需要大量资金注入时，却很难找到过去那些一掷千金的风投机构。

过快升高的估值是原因之一。就连“快枪手”朱啸虎也在最近采访中表示，之所以没有和MiniMax聊是因为“开始就很贵”。

其次是风投们也早已与当年不可同日而语。一位参与过两波AI浪潮投资人对暗涌Waves表示，VC出手谨慎的直接原因是二级市场的惨淡导致的退出，以及募资难的加剧。这种资本困境也与整个市场的资本活跃度下降有关。“如果搁2020年，完全是另一种境况，你想想自动驾驶都融了那么多钱。”

但最核心的还是中国大模型一直存在的商业模式争议。如朱啸虎就是典型的质疑派：大模型公司缺场景，缺数据，且会始终面临开源模型竞争，所以风险极大。

就目前几家公司的商业探索来看，一切也刚刚开始。

人民币架构、坚持走本土化路线的智谱AI，是相对坚定地选择了toB路线。一个参与过智谱AI多轮融资的投资人表示，尽管这条路线并不像to C那么性感，却“最务实、可以细水长流”。它有先发性，在很多C端产品尚未上线时，可以早早对外提供服务。另外“私有化部署和定制”这样的脏活、累活通常也不会是大厂愿意太多插手的领域，从而给创业公司提供喘息可能。

MiniMax和月之暗面显然正在C端做更多探索。其中MiniMax在应用端商业化方面走的要更快，它之前在海外推出的 AI 角色扮演类产品 Talkie ，增速一度跑赢 Character.ai，后来又在国内推出一款国内AI陪聊+抽卡软件星野以及上线了AI对话机器人产品海螺问问。而月之暗面则更强调结合大模型的产品力，并在去年十月发布了首个支持输入 20 万汉字的智能助手产品 Kimi Chat。

因为侧重点不同，也有人因此笑谈这三家大模型公司的商业化探索分别是：智谱AI更务实，更像朱啸虎的市场信仰派，月之暗面更浪漫，更像杨植麟的技术信仰派，而MiniMax则正好居中。

一位大模型投资人认为，如果按照20倍的ps,这些大模型公司走到三四十亿美元估值时，意味着至少有2亿美金收入，而现在的几家公司里，即便做更稳健的toB业务的，也不过才1.5——2亿人民币收入，其中甚至还包括非大模型带来的部分。

也或许因此，大模型创业公司成为史上少有的一个一出生就要被讨论退出的风口。《投得好,还要退得好》一书的作者李刚强在朱啸虎的采访之后，也认为早期投资机构应尽快退出基础大模型投资，“尽管大模型公司在技术上还处于行业曲线的早期，但资本周期曲线很可能将达到市场的顶点。”

当然，这并非中国独有的现象。即便在硅谷，这波ai浪潮中，也有科技巨头挤走风投机构的趋势。拾象科技创始人李广密在之前张小珺｜商业访谈录的一次采访中也指出，硅谷VC在大模型，以及SpaceX、Tesla上失灵，让他一度去思考，在这些具有“重投入、商业模式不清晰，失败风险高”特点，类似“曼哈顿计划”的科学探索和发现，传统VC或许是不合适的一种金融产品。

也有人不以为然。一名MiniMax的早期投资人告诉我们，当下社会情绪中的种种疑虑，其实是不确定性导致的信心问题。

AI还是“半杯水”状态：一部分人看见的是半杯水不够，而另一部分人看到的是，已有了半杯水。在他看来，GPT3.5意味着LLM已过技术奇点，已经从一个科学问题变成工程问题，所以投资大模型不再是一场科学慈善，而是一场商业奇点尚未到来的商业投资行为。

“就如同锂电池和充电设施成本的持续下降，让新能源汽车从2019年的被唱衰、销量120万辆到2023年的950万销量一样，LLM在性能上的提升和推理成本的持续下降，也会带来新的可能。”他如此说道。

至于预期中的大模型投资回报，一个早期投资人给出了“2.5X"，另一个则给出了“要么0，要么10”的答案。

何时会是投资大模型公司的退出时点？

一个大模型投资人的答案和去年3月时一样：百亿美金时。

但不同的是，去年上半年，我们和他聊到商汤时，他觉得这是这波大模型公司的下限，而现在，他觉得“独立IPO，并达到一定体量”，已属不易。

在一位参与过两波AI浪潮的投资人回忆中，AI四小龙时期，还是“AI投资人充满耐心的时代”。当时的AI公司抓住了安防、智慧城市等风口，动辄能遇到上千万，甚至上亿的地级或省级订单，所以大部分公司总能有源源不断的投资进账，而现在的大模型公司，“想风风光光地烧钱早已没有那么容易。”

仅隔一年，这个2023还在被以浪漫主义方式想象的方向，就被拉回了更迫近的现实。