OpenAI 与 Google,暂时没有赢家
两位劲敌在 AI 赛场上正面交锋的场景再次出现。
5 月 14 日,OpenAI 在产品发布会上发布了最新的 GPT-4o 多模态大模型,具有实时的语音、视频和文本交互能力。而就在这场发布会结束后的第二天,Google 也举办了 2024 年 I/O 开发者大会,一口气发布了好几款 AI 产品,其中最引发关注的是与 GTP-4o 对标的 Project Astra。
谁会胜出?
两位 AI 领域的创业者——出门问问创始人兼 CEO 李志飞与受邀参加 OpenAI 发布会的 jobright.ai 联合创始人郑玉典,对于这个话题给出了一个有趣的观点,那就是留给 Google 和 OpenAI 两大巨头的时间都不多了。为什么会得出这样的结论?以下是与他们的对话。
文末还有完整对话音频,也可在各大音频、播客平台搜索「科技早知道」收听,不要错过。
声动活泼
玉典受邀参加了此次 OpenAI 发布会,能否分享一下你在现场的感受?
郑玉典
▲ OpenAI CEO 山姆·阿尔特曼在发布会现场。| 郑玉典 摄
发布会 95% 的时间都在介绍 GPT-4o 模型。GPT-4o 的 o 代表 omni(意为全能),用 OpenAI 官方的话说,这是它们目前最先进的旗舰版多模态模型。
OpenAI 此前的模型主要是以文字、图片和音频为主,GPT-4o 新增了一个视频维度,也就是说它的输入可以是文字、图片、音频和视频,输出可以支持文字、图片和音频。
此外最关键的一点,是该模型是面向开发者的,可以供开发者使用。
▲ OpenAI 发布会直接在公司办公室举行。| 图源:OpenAI
声动活泼
就在 Open AI 发布会的后一天,谷歌举办了 Google I/O 大会,发布了 Project Astra。志飞在 NLP 人机交互,以及虚拟个人助理(VPA)等领域深耕了数十年。你如何看待这两家公司的产品?
李志飞
在此之前的 Siri、Google Assistant,包括国内的各种语音助手,基本上只是语音交互系统,无法集成图片、视频,更不可能集成在一个模型里。但人的交互方式就是多模态的,我们在聊天的过程中,我不仅可以看着你说话,也能注意到周边的环境,这就是一个典型的多模态交互过程。过去并没有这种真正的多模态交互助理,因此看完这两场发布会,我感到两家公司在这个领域有很大的突破。
但与此同时也存在一个很大的问题,我认为他们过度抬高了消费者对产品的期待值。同样的情况就出现在 2011 年 Siri 发布期间,当时苹果把 Siri 包装为一个充分理解用户感情的语音助手,导致很多用户预设 Siri 能像人一样聪明,结果与 Siri 语音交互时的效果并不好。而 Google Assistant 的产品定位就是一个冷冰冰的工具,我认为这是更明智的选择。因此无论是 GPT-4o 还是 Project Astra,它们所彰显的多模态和实时性特点,都会把用户的期望提得很高。
但真正的使用效果,依然需要观察。如果当一个硅谷以外的普通用户也能像发布的 Demo 里展示的那样使用流畅,那我认为人机交互的革命就真的到来了,甚至能引发下一波科技革命。过去很多革命都是因为人机交互设备或方式改变后诞生了新产品、新商业场景,并最终涌现出很多新的科技公司。
▲ Google 发布最新的多模态 AI 项目 Project Astra。| 图源:Google
声动活泼
郑玉典
李志飞
硅谷徐老师
Google 在发布会上同时发布了好几个新产品的 Demo。我们能够看到,这其实是一个很宽的产品线,从这个角度来看,OpenAI 是没有可比性的。
OpenAI 更多还是技术先行,至少我并不认为 OpenAI 是能够做很多产品的公司。但是 Google 已经开始炫技,秀肌肉。尽管目前更多的还是 Demo,并未落地,到最终实现商业化还有很长的路要走,但是至少它能够给大家展示出如此宽的 AI 产品线。
所以实际上 OpenAI 和 Google 是两个截然不同的形态。一个是技术先行,一个是大量产品先行,这是我认为此次展现出的比较明显的不同点。
郑玉典
如果用几个词来描述 OpenAI 和 Google 发布会,我认为 OpenAI 是「小而美」,主要面对开发者;Google 就是「大而全」。因为 Google 本来就有很大的生态,以及强大的操作系统等,目前就需要把自己的基本盘稳住,再逐渐进行 AI 渗透。对于 OpenAI 来说,看它是不是要和 Apple 集成,如果集成得好,对于 OpenAI 意味着很大的发展空间。
声动活泼
OpenAI 发布会中,有一支 Demo 展示了 AI 可以探测情绪的功能,这项功能在我们用户看来还是十分超前的。志飞你如何看待这项功能的技术难度呢?
▲ GPT-4o 指导演示人员如何深吸慢呼平复心情。| 图源:OpenAI
李志飞
从技术上来看,这对 Google 而言并没有太大难度。我们对于 Google 的技术水平应该保持基本的信仰,作为一家科技巨头必然有它的优势所在。但 Google 的确在组织效率等各种问题上需要不断追赶。
而且科技竞争肯定是一个长期的过程,在技术上不用太纠结谁先谁后。我比较担心的, 是 Google 产品的基因是否足够好,以及 Google 能否真正改变态度。从 Google 发布会就能看出,它依然把自己当作 AI 领域的 C 位,但其实在我们的这些外人看来,它已经是老二。作为老二,就应该表现得更加开放,甚至要激进一点,不能过于保守。
比如发布会本身,OpenAI 只花了不到半个小时就完成了演示,非常年轻化,而且效果也很好。然而Google 的发布会更像一个国企汇报会,无数产品部门、研发部门分别上台展示,最后花了两个多小时,但最终效果肯定不如前者。
以及这次 Google 发布会光是产品模型的名字可能就有二三十个,但 OpenAI 的主要产品就是 GPT-4o 和 Sora。这也表明这种大公司的内部需要平衡。从这个角度来看, Google 还是没有觉醒,它还是按照以前的惯性在做产品、做发布。
硅谷徐老师
我非常同意志飞提到的大公司「船大难掉头」的问题。但是我们还是要认可 Google 至今所做出的努力,Google 已经做了很多大刀阔斧的尝试与改革。
声动活泼
除了我们刚刚提到的是否与苹果等第三方进行集成的问题,OpenAI 目前还面临了哪些挑战?
李志飞
今天我们看 OpenAI 跟 Google 竞争,或者看 OpenAI 自身发展时,很多时候都在关注技术,这虽然很重要,但我认为最紧急的一个问题,在于 ChatGPT 是否是一个正确的产品,会员收费和 API 收费是否是一个正确的商业模式。
这两个问题才是决定 OpenAI 生与死的一点。关于 ChatGPT 是否是正确的产品,也就是说用户是否真的对这个产品有需求而且愿意持续使用。目前来看,OpenAI 的活跃用户不再增长。在渗透率还很低的情况下,说明这款产品其实并没有真正进入大众生活圈。
此外就是 OpenAI 的商业模式。目前一个是靠收会员费,另一个就是靠 API 收费。但会员营收迟早会消失,因为竞争越来越激烈,消费者是不会为这种东西付钱的,会员模式不一定能够持续。
而此后 API 领域的竞争者也会越来越多,还有小公司参与进来,那 API 只会越来越便宜,甚至可能慢慢逼近于零。所以这两个商业模式目前来看都不太可持续。
OpenAI 能否成功,就是看它能否在这两个问题上找到突破点,这也是它能否成为一个伟大的公司,或者说进入到下一个阶段的重要考验。
▲ GPT-4o 帮助盲人用户观察环境。| 图源:OpenAI
硅谷徐老师
我觉得这里面还有一个点,就是要看 OpenAI 和行业第二、第三的差距有多大。当Anthropic 和 Gemini 紧紧追赶,OpenAI 公司价值的领先地位是否能长久地保持下去?这是一个问题。
李志飞
尽管我们现在无法预判开源和闭源的终局。但是我觉得留给 OpenAI 的时间越来越少,尤其是在技术的迭代曲线上,OpenAI 没有像大家预测地那样一骑绝尘。而其他公司都达成了「All in AI」的共识,相信今后的社会资源,例如开源资源会越来越多,这是一个现状。
所以在我看来,OpenAI 的模型就算纯在技术层面也应该更加专注。当年 OpenAI 能够倾尽一个创业公司所有资源开发 GPT 1,乃至 GPT 3,我认为是非常厉害的决策。但如今来看,OpenAI 在很多事上都存在机会主义,或者说惯性动作。比如说发布 GPT Store,搞个新插件,这些在我看来就是浪费时间。包括前一阵子所说的 AI 搜索等产品,我觉得都已经晚了。
科技创业公司要想取得成果,从我自己创业的体感来说,时机特别重要,这也是非常残酷的一件事。有些东西的时间窗口一过,后续将会越发艰难。无论是 OpenAI 还是 Google,都应该有很强的危机感。当然我们作为普通群众,还是希望两家公司竞争得越厉害越好。
硅谷徐老师
如果 Google 大手笔把 Gemini 开源,那留给 OpenAI 的时间就没有了。好在对 OpenAI 来讲,它今天最大的竞争对手 Google 还没有那么高的觉悟。
有趣的是,就在这场对话结束后不久,360 集团创始人周鸿祎也发表了类似的观点,他说留给 Google 的时间不多了,建议把所有产品都开源。
OpenAI 与 Google 的 AI 竞赛,不仅是技术的较量,也考验着两家公司对产品价值和商业模式的理解与创新。能在多模态交互世界中真正赢得用户芳心的一方,或许也将决定未来科技的走向。
GPT-4o 和 Project Astra,你更看好哪一个?来评论区聊聊吧。
以上内容整理自
声动活泼旗下播客「科技早知道」
想了解更多 AI 前沿动态
欢迎点击收听
也可在各大音频、播客平台搜索本期节目
监制/徐涛
编审/东君
设计/Mori
排版/Xinghan
运营/George
更多有趣问题
欢迎来声动活泼找答案
微信扫码关注该文公众号作者