Bendi新闻
>
OpenAI 与 Google,暂时没有赢家

OpenAI 与 Google,暂时没有赢家

5月前

两位劲敌在 AI 赛场上正面交锋的场景再次出现。


5 月 14 日,OpenAI 在产品发布会上发布了最新的 GPT-4o 多模态大模型,具有实时的语音、视频和文本交互能力。而就在这场发布会结束后的第二天,Google 也举办了 2024 年 I/O 开发者大会,一口气发布了好几款 AI 产品,其中最引发关注的是与 GTP-4o 对标的 Project Astra。


谁会胜出?


两位 AI 领域的创业者——出门问问创始人兼 CEO 李志飞与受邀参加 OpenAI 发布会的 jobright.ai 联合创始人郑玉典,对于这个话题给出了一个有趣的观点,那就是留给 Google 和 OpenAI 两大巨头的时间都不多了。为什么会得出这样的结论?以下是与他们的对话。


文末还有完整对话音频,也可在各大音频、播客平台搜索「科技早知道」收听,不要错过。






声动活泼

玉典受邀参加了此次 OpenAI 发布会,能否分享一下你在现场的感受?



郑玉典

Open AI 这次发布会规模并不大,只有 40 多人参加,CEO 山姆·阿尔特曼(Sam Altman)没有上台发言,并且在发布会结束后很快离开了。



▲ OpenAI CEO 山姆·阿尔特曼在发布会现场。| 郑玉典 摄


发布会 95% 的时间都在介绍 GPT-4o 模型。GPT-4o 的 o 代表 omni(意为全能),用 OpenAI 官方的话说,这是它们目前最先进的旗舰版多模态模型。


OpenAI 此前的模型主要是以文字、图片和音频为主,GPT-4o 新增了一个视频维度,也就是说它的输入可以是文字、图片、音频和视频,输出可以支持文字、图片和音频。


此外最关键的一点,是该模型是面向开发者的,可以供开发者使用。


▲ OpenAI 发布会直接在公司办公室举行。| 图源:OpenAI



声动活泼

就在 Open AI 发布会的后一天,谷歌举办了 Google I/O 大会,发布了 Project Astra。志飞在 NLP 人机交互,以及虚拟个人助理(VPA)等领域深耕了数十年。你如何看待这两家公司的产品?



李志飞

这两家科技巨头此次发布会聚焦人机交互,在发布的大模型中,重要的关键词就是多模态和实时。这也是人机交互里非常重要的两个维度。


在此之前的 Siri、Google Assistant,包括国内的各种语音助手,基本上只是语音交互系统,无法集成图片、视频,更不可能集成在一个模型里。但人的交互方式就是多模态的,我们在聊天的过程中,我不仅可以看着你说话,也能注意到周边的环境,这就是一个典型的多模态交互过程。过去并没有这种真正的多模态交互助理,因此看完这两场发布会,我感到两家公司在这个领域有很大的突破。


但与此同时也存在一个很大的问题,我认为他们过度抬高了消费者对产品的期待值。同样的情况就出现在 2011 年 Siri 发布期间,当时苹果把 Siri 包装为一个充分理解用户感情的语音助手,导致很多用户预设 Siri 能像人一样聪明,结果与 Siri 语音交互时的效果并不好。而 Google Assistant 的产品定位就是一个冷冰冰的工具,我认为这是更明智的选择。因此无论是 GPT-4o 还是 Project Astra,它们所彰显的多模态和实时性特点,都会把用户的期望提得很高。


但真正的使用效果,依然需要观察。如果当一个硅谷以外的普通用户也能像发布的 Demo 里展示的那样使用流畅,那我认为人机交互的革命就真的到来了,甚至能引发下一波科技革命。过去很多革命都是因为人机交互设备或方式改变后诞生了新产品、新商业场景,并最终涌现出很多新的科技公司。


▲ Google 发布最新的多模态 AI 项目 Project Astra。| 图源:Google



声动活泼

Google 发布了多模态模型 Project Astra 意在与 GPT-4o 同台竞争,那么 Astra 是否比 GPT-4o 更胜一筹?


郑玉典

实际上,Google 的新模型还只是提前调试和录制好的 Demo,与真实投入使用的产品仍有差距与之相对,OpenAI 不仅录了好几段 Demo,还由专门人员在现场演示了 Demo 里的功能。这样对比来看,大家看了 OpenAI 再看 Google,确实不太有惊喜感。目前来看,OpenAI 仍然领先,因为它至少将 API 公布了出来,能使更多人受益。


李志飞

从技术能力和表现出的产品形态来看,两家公司其实半斤八两。毕竟从长期竞争过程来看,这两三个月的研发时间并不长。

在我看来,这类 AI 语音助手有几大类应用。第一类是闲聊,即表现得像一个真人,能够陪伴用户聊天;第二类是命令,即发布指令让助手帮你完成某项操作,这也是语音助手最常见的功能;第三大类则是回答信息或知识类的问题。

从这三个角度来说,在闲聊方面,OpenAI 肯定能做得很好,可以说 Google 的产品在某种程度上来说并不太会聊天但是命令类功能,尤其是在手机平台中,需要获得系统权限,跟硬件深度整合,相应的体验也会非常不一样。因此我认为 Google 未来的语音助手在这方面会有更大优势。

但事实上,闲聊和命令这两类对用户而言价值不一定大,信息知识类才是未来。信息和知识类是能基于上下文的,假如像 Google 这样的公司能够给语音助手提供更多不同应用的权限,那这些应用都可以成为语言大模型的上下文来源。它不再只是一个知识库,而是可以做得更加个性化。

作为一个语音助手,最核心的要求就在于无处不在、无所不能,如同一个私人秘书。基于这点,目前来看,Google 的生态系统足够完善,有海量的用户,每一个用户又基本上拥有很多数据,基于上下文就更可以做到个性化。所以这是我觉得 Google 相对于 OpenAI 来说,可能更加有优势的地方。





硅谷徐老师

Google 在发布会上同时发布了好几个新产品的 Demo。我们能够看到,这其实是一个很宽的产品线,从这个角度来看,OpenAI 是没有可比性的。


OpenAI 更多还是技术先行,至少我并不认为 OpenAI 是能够做很多产品的公司。但是 Google 已经开始炫技,秀肌肉。尽管目前更多的还是 Demo,并未落地,到最终实现商业化还有很长的路要走,但是至少它能够给大家展示出如此宽的 AI 产品线。


所以实际上 OpenAI 和 Google 是两个截然不同的形态。一个是技术先行,一个是大量产品先行,这是我认为此次展现出的比较明显的不同点。



郑玉典

如果用几个词来描述 OpenAI 和 Google 发布会,我认为 OpenAI 是「小而美」,主要面对开发者;Google 就是「大而全」。因为 Google 本来就有很大的生态,以及强大的操作系统等,目前就需要把自己的基本盘稳住,再逐渐进行 AI 渗透。对于 OpenAI 来说,看它是不是要和 Apple 集成,如果集成得好,对于 OpenAI 意味着很大的发展空间。



声动活泼

OpenAI 发布会中,有一支 Demo 展示了 AI 可以探测情绪的功能,这项功能在我们用户看来还是十分超前的。志飞你如何看待这项功能的技术难度呢?


▲ GPT-4o 指导演示人员如何深吸慢呼平复心情。| 图源:OpenAI



李志飞

从技术上来看,这对 Google 而言并没有太大难度。我们对于 Google 的技术水平应该保持基本的信仰,作为一家科技巨头必然有它的优势所在。但 Google 的确在组织效率等各种问题上需要不断追赶。


而且科技竞争肯定是一个长期的过程,在技术上不用太纠结谁先谁后。我比较担心的, 是 Google 产品的基因是否足够好,以及 Google 能否真正改变态度。从 Google 发布会就能看出,它依然把自己当作 AI 领域的 C 位,但其实在我们的这些外人看来,它已经是老二。作为老二,就应该表现得更加开放,甚至要激进一点,不能过于保守。


比如发布会本身,OpenAI 只花了不到半个小时就完成了演示,非常年轻化,而且效果也很好。然而Google 的发布会更像一个国企汇报会,无数产品部门、研发部门分别上台展示,最后花了两个多小时,但最终效果肯定不如前者。


以及这次 Google 发布会光是产品模型的名字可能就有二三十个,但 OpenAI 的主要产品就是 GPT-4o 和 Sora。这也表明这种大公司的内部需要平衡。从这个角度来看, Google 还是没有觉醒,它还是按照以前的惯性在做产品、做发布。



硅谷徐老师

我非常同意志飞提到的大公司「船大难掉头」的问题。但是我们还是要认可 Google 至今所做出的努力,Google 已经做了很多大刀阔斧的尝试与改革。






声动活泼

除了我们刚刚提到的是否与苹果等第三方进行集成的问题,OpenAI 目前还面临了哪些挑战?



李志飞

今天我们看 OpenAI 跟 Google 竞争,或者看 OpenAI 自身发展时,很多时候都在关注技术,这虽然很重要,但我认为最紧急的一个问题,在于 ChatGPT 是否是一个正确的产品,会员收费和 API 收费是否是一个正确的商业模式。


这两个问题才是决定 OpenAI 生与死的一点。关于 ChatGPT 是否是正确的产品,也就是说用户是否真的对这个产品有需求而且愿意持续使用。目前来看,OpenAI 的活跃用户不再增长。在渗透率还很低的情况下,说明这款产品其实并没有真正进入大众生活圈。


此外就是 OpenAI 的商业模式。目前一个是靠收会员费,另一个就是靠 API 收费。但会员营收迟早会消失,因为竞争越来越激烈,消费者是不会为这种东西付钱的,会员模式不一定能够持续。


而此后 API 领域的竞争者也会越来越多,还有小公司参与进来,那 API 只会越来越便宜,甚至可能慢慢逼近于零。所以这两个商业模式目前来看都不太可持续。


OpenAI 能否成功,就是看它能否在这两个问题上找到突破点,这也是它能否成为一个伟大的公司,或者说进入到下一个阶段的重要考验。


▲ GPT-4o 帮助盲人用户观察环境。| 图源:OpenAI



硅谷徐老师

我觉得这里面还有一个点,就是要看 OpenAI 和行业第二、第三的差距有多大。当Anthropic 和 Gemini 紧紧追赶,OpenAI 公司价值的领先地位是否能长久地保持下去?这是一个问题。



李志飞

尽管我们现在无法预判开源和闭源的终局。但是我觉得留给 OpenAI 的时间越来越少,尤其是在技术的迭代曲线上,OpenAI 没有像大家预测地那样一骑绝尘。而其他公司都达成了「All in AI」的共识,相信今后的社会资源,例如开源资源会越来越多,这是一个现状。


所以在我看来,OpenAI 的模型就算纯在技术层面也应该更加专注。当年 OpenAI 能够倾尽一个创业公司所有资源开发 GPT 1,乃至 GPT 3,我认为是非常厉害的决策。但如今来看,OpenAI 在很多事上都存在机会主义,或者说惯性动作。比如说发布 GPT Store,搞个新插件,这些在我看来就是浪费时间。包括前一阵子所说的 AI 搜索等产品,我觉得都已经晚了。


科技创业公司要想取得成果,从我自己创业的体感来说,时机特别重要,这也是非常残酷的一件事。有些东西的时间窗口一过,后续将会越发艰难。无论是 OpenAI 还是 Google,都应该有很强的危机感。当然我们作为普通群众,还是希望两家公司竞争得越厉害越好。



硅谷徐老师

如果 Google 大手笔把 Gemini 开源,那留给 OpenAI 的时间就没有了。好在对 OpenAI 来讲,它今天最大的竞争对手 Google 还没有那么高的觉悟。





有趣的是,就在这场对话结束后不久,360 集团创始人周鸿祎也发表了类似的观点,他说留给 Google 的时间不多了,建议把所有产品都开源。


OpenAI 与 Google 的 AI 竞赛,不仅是技术的较量,也考验着两家公司对产品价值和商业模式的理解与创新。能在多模态交互世界中真正赢得用户芳心的一方,或许也将决定未来科技的走向。


GPT-4o 和 Project Astra,你更看好哪一个?来评论区聊聊吧。






以上内容整理自

声动活泼旗下播客「科技早知道」

 想了解更多 AI 前沿动态 

 欢迎点击收听

也可在各大音频、播客平台搜索本期节目


监制/徐涛

编审/东君

设计/Mori

排版/Xinghan

运营/George


更多有趣问题

欢迎来声动活泼找答案


微信扫码关注该文公众号作者

来源:声动活泼

相关新闻

一分钱没花!苹果与OpenAI合作没有支付任何费用,是谁赚了微软苹果与OpenAI「分道扬镳」,纷纷放弃董事会席位礼来与OpenAI合作,利用生成式人工智能研发新型抗生素Ilya Sutskever 创业!新公司的一切都与OpenAI反着来理想车友聚会多车追尾;段永平力挺贵州茅台;12306回应实行男女分车厢;蔡崇信:微软与OpenAI未来可能分道扬镳...蔡崇信:微软与OpenAI未来可能分道扬镳|中企荐读又一AI独角兽获战略投资;曝苹果与OpenAI合作或将采取分销;小爱同学接入豆包,手机SU7已搭载丨AI情报局OpenAI与核聚变公司寻求合作,白宫拨款1.8亿美元用于核聚变商业化研究OpenAI与普华永道达成合作,咨询公司纷纷入局AI赛道AI教父背书,OpenAI与谷歌员工联合签署公开信,呼吁公司重视AI安全奥特曼个人投资引纠纷,手持400多家公司28亿美元,部分投资与OpenAI有利益冲突!当NG开始主动回国,没有赢家马斯克人工智能公司xAI完成60亿美元B轮融资;苹果据悉已与OpenAI达成协议,将ChatGPT引入iOS 18丨AIGC日报大模型降价,一场没有赢家的战争网暴下的“胖猫之死”,没有赢家胖猫之死真相大白,恋爱开销账单明细曝光,但枪响之后已没有赢家发布屡次截胡?OpenAI与谷歌携新版大模型再度交锋 | 大模型一周大事AI早知道|抖音内测AI购物小助手;OpenAI与Reddit合作没有赢家的校园欺凌突发 | ChatGPT 即将登陆 iPhone!苹果接近与 OpenAI 达成协议突发 | ChatGPT 即将登陆 iPhone!苹果接近与 OpenAI 达成协议,我们挖出了这些新功能细节微软推 AI 模型 MAI-1,与 OpenAI 竞争;问界正式回应山西追尾事故;美空军部长亲自体验 AI 战斗机|极客早知道苹果或在今晚发布 Apple Pencil Pro/雷军:逛完北京车展后「很绝望」/微软或开发新模型与 OpenAI 竞争苹果与 OpenAI 重启谈判,Siri 或引入 ChatGPT,网友:国行用文心一言?
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。