Bendi新闻
>
OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折

OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折

7月前

夕小瑶科技说 原创
编辑 | 夕小瑶编辑
小伙伴们,我们几天前的推文《两重惊喜!奥特曼预告GPT-4和ChatGPT重大更新,Open AI要放大招》中承诺过:小编我会帮你们蹲点今天OpenAI发布会的!

小编我来兑现承诺了!

并且,这个大夜没白熬,这次发布会属实太炸裂了

先贴发布会视频(欢迎关注视频号,老粉后面会送福利!):

在这次OpenAI的发布会上,Mira Murati详细介绍了几项重要的更新和新功能:

  1. 新模型GPT-4o发布,免费开放!可实时语音交互,支持复杂视觉理解

GPT-4o是OpenAI的新旗舰模型,并且免费提供给用户使用。

Mira 解释说,过去几年中,OpenAI 一直专注于提升这一模型的智能水平,现在首次在易用性上取得了重大突破。

要知道,一年前的今天,GPT-4的对话价格还是几毛钱一条,仅仅一年,竟然免费了。这意味着GPT3.5级别能力的免费大模型将在市场上失去竞争力,毕竟GPT-4和GPT3.5的差距还是很大的。

从模型能力更新上来说,GPT-4o不仅加强了多语言支持,改进了对50种不同语言的处理质量和速度。而且,比较值得关注是其跨模态的能力升级。

其中,GPT-4o 的一大看点就是其具备了实时语音交互的能力,这意味着,你可以像跟真人通话一样去跟ChatGPT语音聊天了。而且,其在语音模式下具备包括讲话打断、即时反应和情感识别能力。

人与AI的界限被进一步模糊化了。

这种高阶的语音能力,将使得 GPT-4o 有望打破人机交互界面的局限性,未来的ChatGPT,可以无处不在——比如可以嵌入到没有屏幕的设备上随时交谈。总之,GPT-4o可以让人们更专注于与 ChatGPT 的协作,而不是受限于屏幕UI界面本身。

此外,GPT-4o 的视觉能力也得到了大幅强化。

GPT-4o 可整合处理视觉和文本信息——GPT-4o 能够同时处理和理解图像以及图像中包含的文本内容。这意味着用户可以上传包含文本的截图、照片或文档,GPT-4o能够识别并解析这些图像中的文字信息,与传统的文本输入方式无缝整合。

在发布会上,Mira展示了GPT-4o如何分析包含图文的复杂文档,并从中提取和利用信息。例如,用户可以上传含有表格和图像的商业报告,GPT-4o能够识别并处理其中的文本和视觉数据,为用户提供深入的内容分析。

  1. 针对开发者的GPT-4o API,价格便宜一半

除了向用户提供GPT-4o之外,OpenAI还将其作为API提供给开发者,这意味着开发者可以使用这一强大的模型来构建自己的应用程序,并且在速度、成本和功能上都有所提升。

而且,相比如今的GPT-4-Turbo系列API,GPT-4o不仅能力更强,速度更快,而且API价格也仅为前者的一半。

  1. 桌面版APP发布

发布会还宣布了桌面版 ChatGPT APP 的发布,这一版本旨在使用户界面更加简单自然,提升用户体验。

大模型友商:残酷打击

我觉得在这场发布会之后,最崩溃的就是OpenAI的竞争对手了——尤其是国外的大模型厂商。当大家还在不计成本的苦苦研究如何真正追上GPT-4的体验的时候,竞争对手竟然直接将这个模型免费开放给用户使用了。

这对友商来说,可以说是一个非常残酷的打击。

尽管OpenAI当下最为强有力的竞争对手Anthropic发布的Claude 3 Opus已经在体验上超越了GPT-4,并且其在用户端积累了一定的共识,但Claude 3 Opus的价格相比GPT-4非常昂贵,且不稳定,经常出现无法连接的情况。

如果GPT-4o真的效果显著反超了Claude 3 Opus而且还免费,那么可以说Anthropic弯道超车的可能性就更加渺茫了。

具身智能爆发前夜?

不要小看了这次的语音交互能力的升级。要知道,如今各大厂的语音交互的体验,都与真人的语音交互差的非常远。

比如有的需要用固定的唤醒词,有的语音识别非常不准,而且普遍语义理解能力非常有限,更为重要的是,如今的语音产品普遍不具备类人的对话打断和情感能力,这使得真实使用的时候非常恼人——你明知他在胡说八道了,骂它一顿结果它还听不懂,甚至它还在那儿自说自话停不下来。

而GPT-4o的发布,使得这个糟糕的体验有望出现大幅转折——人工智障时代可能要结束了。如果体验真如发布会所称的这么好,那么毫无疑问,这对于智能硬件行业是一个不小的变量。

具身智能也从此有了更和谐的交互能力,人与AI的距离被极大的拉近了。

AI应用生态的爆发催化剂

值得注意的是,GPT-4系列的API价格正在以远超摩尔定律的速度疯狂降价,这意味着先进AI的访问成本将快速的、无限的接近0。

由此,未来开发者将有能力支撑起巨大C端访问量的复杂AI原生应用,而不会像如今一样,为了覆盖成本,只能收费使用。而一旦收费,这个应用的门槛将极大的提升,网络效应难以成立,破圈的可能性将极大的降低。

GPT-4o不仅玩法上给AI原生应用提供了更多可能性,访问成本的大幅降低,可能会进一步催生AI应用生态的爆发。

2024下半年,将是一个非常令人期待的时代。


微信扫码关注该文公众号作者

来源:夕小瑶科技说

相关新闻

OpenAI 官宣旗舰模型 GPT-4o,完全免费、无障碍与人交谈!奥特曼:这是我们最好的模型逼近GPT-4的新模型发布!「欧洲版OpenAI 」联手微软,却被质疑违背初心OpenAI发布GPT-4o模型卡:概述AI安全和风险缓解措施;波士顿动力人形机器人又整新活,一口气做8个俯卧撑丨AIGC日报OpenAI 用 26 分钟改变世界!免费版 GPT-4 来了,视频语音交互快进到科幻片OpenAI一夜干翻语音助手!GPT-4o模型强到恐怖,ChatGPT学会看屏幕,现实版Her来了OpenAI“草莓”落地了?ChatGPT惊现神秘GPT-4o模型,网友热议:新版本提升不多,但逻辑推理有改进OpenAI新研究破解GPT-4大脑,分解1600万个特征打开“黑匣子”,Ilya 、Jan Leike也参与了!OpenAI出手后,GPT-4真的不懒了?网友不买账:只靠打补丁恐怕无济于事!OpenAI发布新旗舰模型GPT-4o;字节跳动正式发布豆包大模型|AIGC周观察第四十三期【行业日报】 OpenAI推出新人工智能模型GPT-4o!沃尔玛计划裁减数百名公司员工!开源Llama 3.1一夜成最强大模型!超越闭源GPT-4o,OpenAI坐不住了OpenAI深夜发布GPT-4o!跟所有公司、所有企业主都有关!OpenAI王炸更新GPT-4o,干掉所有语音助手!丝滑如真人引爆全网科幻成真!OpenAI颠覆世界:GPT-4o完全免费,实时语音视频交互震撼全场,直接进入科幻时代OpenAI再压谷歌一头,最强模型GPT-4o免费发布,语言对话媲美人类反应OpenAI发布全新模型GPT-4o;淘宝改版首页:频道入口由三栏变双栏呈现……OpenAI震撼发布GPT-4o:打造全能AI助理,将向所有用户免费提供 | 环球科学要闻OpenAI突破性发布GPT-4o!电影《她》真的来了|亮马桥小纪严选OpenAI 突然发布 GPT-4o mini !更快更便宜,人人免费可用,GPT-3.5 成为历史用GPT-4纠错GPT-4!OpenAI推出CriticGPT模型;谷歌Gemma 2发布,与第一代相比性能更高丨AIGC日报曝苹果国行 AI 与百度、阿里、百川接触/华为盘古大模型 5.0 发布/OpenAI CTO 称 GPT-4「智商」相当于高中生重磅惊喜!OpenAI突然上线GPT-4o超长输出模型!「Her」高级语音模式已开放测试!AI集体失智!9.11比9.9大?微软回应全球死机蓝屏事件:影响850万设备;OpenAI发布GPT-4o mini | Q资讯OpenAI抓内鬼出奇招,奥特曼耍了所有人:GPT搜索鸽了!改升级GPT-4
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。