我们上手实测GPT-4o：速度快到飞起，还能直出板书，但视频分析逊色

国际科技财经移民娱乐民生时事体育

Bendi新闻

8月前

机器之能原创

作者：山茶花 Cardina

作为 OpenAI 有史以来最好的模型， GPT-4o 究竟强在哪里？

你要知道，它是一个原生的多模态大模型，可以跨文本、音频和视频进行实时推理——能听、能说、能看、零延时、可打断，还会「看人脸色」。

更重要的是，它还免费！

赶紧薅一把，你会知道什么是真・科幻照进现实！

实测 GPT-4o：速度飞快，视觉能力惊艳

打开 ChatGPT 官网，就会收到 GPT-4o 的试用邀请，点击「立即试用」即可进入对话页面。

如果没有收到邀请，可能是灰度测试阶段，稍等一会再重新进入。

然后，直接在下方的对话框中与其进行对话，系统会自动切换到 4o 版本。

值得注意的是，免费用户每天使用 GPT-4o 的次数有限，超出限制后要么升级为付费用户，要么只能用 GPT-3.5。

Plus 用户每月 20 美元，可享受高达 5 倍的消息上限。

许多 AI 公司正在将 GPT-4o 引入他们的界面。比如，Poe 用户可以直接勾选 GPT-4o 服务。

我们简单薅了一把羊毛，还是被 GPT-4o 的效果惊到了。

首先，这个响应速度太爽了！快到飞起，问题刚输入，答案就哗啦哗啦出来了。

有网友发现制作单个 html 文件，仅需 6 秒；分析电子表格数据不到 30 秒......

其次，GPT-4o 具备联网功能，可以搜集最新的新闻信息。

我们让它搜集 2024 年 5 月 13 日 AI 领域的新闻，它不仅对新闻进行了概括整理，还附上链接。

面对同样的要求，GPT-4 却直接「罢工」：

最后，GPT-4o 的视觉能力也挺惊艳。我们分别上传了樱桃和手写字迹的图片，让它辨认，全部回答正确。

网友发现，即使是 1800 年代的手写笔迹，也能出色地识别...... 了不起。

更离谱的是，GPT-4o 还能生成板书图片，图中的板书简直跟人类写的没啥差别。要知道，对于大模型来说，「写字」可是一大难题。

贾樟柯纪录片《一直游到海水变蓝》的海报设计极具巧思，正着看是波涛汹涌的大海，正好扣题，倒过来则是连绵不绝的群山，又与片中核心思想相呼应。

我们就把这张海报「喂」给 GPT-4o，还真别说，它回答的有板有眼，其中的深意均被 get 到。

不过，它的视频分析能力就逊色一些。

我们上传了一段 7 秒的《泰坦尼克号》经典片段，并让 GPT-4o 分析这个视频。

它迅速概括了该视频时长、每秒帧数以及分辨率等。不过，当问及这出自哪部电影以及画面中的男女主分别由谁扮演时，它「一问三不知」。

网友们疯狂「调戏」GPT-4o

眼下，给 GPT-4o 疯狂「整活」的视频已经在社交媒体上发酵，相当一部分可以归为「饭碗不保」系列。

当初 ChatGPT 刚上线，编辑们惊呼「完蛋，饭碗要砸」；GPT Store 推出后，创业公司老板们大惊失色；年初时 Sora 只是放出了 Demo 视频，就让演员们人心惶惶……

如今 GPT-4o 一出，客服、家教、秘书、同声传译「岌岌可危」，就连导盲犬也要「下岗」。

1.「充当」导盲犬

GPT-4o 现在可以实时查看和分析事物，可以帮助盲人描述当前环境，还能帮忙打车。唯一的 bug 是需要随时举着手机，要是能做成眼镜就更 perfect 了。

2.「充当」语音客服

给客服 GPT-4o 找茬儿？很难！哪怕是处女座！

一名叫 Joe 的小哥编了一个情景：ACME Telco 寄的新 iphone 无法使用，他让一个 GPT-4o 充当客服，另一个充当他的助手，帮他处理这事。

助手小 A 先陈述了事情的经过，接着客服小 B 就开始「连环问」：

Joe 是什么时候收到新 iphone 的？你能告诉我订单号码吗？设备有物理性损坏吗？Joe 是想把 iphone 退回店里还是邮寄回去？你能告诉我 Joe 的邮件地址吗？你能帮他看一下我刚发的邮件吗？

最终，事情完美解决 ——AI 客服对答如流，情绪稳定，找不出瑕疵。

3.「充当」家教老师

在一段广为传播的视频中，OpenAI 邀请可汗学院的可汗和他儿子一起使用 GPT-4o 来辅导孩子做数学题。

期间，GPT-4o 循循善诱，即使孩子回答错了，它仍耐心地进行指导和鼓励。帮助家长降低心梗几率的「人」有了，还要继续砸银子给家教吗？

4.「充当」会议秘书

大语言模型产品天生是个打工人的命，GPT-4o 也不例外 —— 当完了老师又被拉进了线上会议，跟一群「不正经」的员工们掰扯着经典的「猫狗大战」。

它不仅能充当会议秘书，总结会议内容，还能在领导 cue 时对答如流。

5.「充当」翻译

因为外语能力出色，GPT-4o 还能充当同传，实时翻译，一如那条巴别鱼。

搞笑的是，GPT-4o 还化身「中文老师」教一群老外学中文，不过水平「一瓶不满，半瓶咣当」，教出的学生个个自带口音，还夸人家「真是个语言天才」。

此外，GPT-4o 还有一堆虚头巴脑的玩法，情绪价值直接拉满。

例如，凭借出色的语音合成能力，OpenAI 总裁 Greg Brockman 亮出了「拿手绝活」—— 让两个 GPT-4o 实时唠嗑。

下次开长途，如果将 GPT-4o 连接到汽车的语音功能，启动对聊模式，是不是就有人陪咱一路聊天了？

Greg 甚至让他们即兴创作了一首歌曲，当然啦，唱功不咋地，旋律很「感人」。

下面这个视频中的小姐姐更「简单粗暴」。

直接让 GPT-4o 分饰两角 ——ChatGPT 和 O，其中 ChatGPT 声音低沉洪亮，像一把大提琴，而 O 则有着法国女高音般的激昂声音。

它们要以「五月十日的旧金山」这一主题来个男女二重唱，期间还各种刁难，例如加和声，节奏加快等，它通通能搞定。

GPT-4o 还能自编自唱轻柔摇篮曲、唱生日歌，那调皮的语气活脱脱地就是个真人。

此外，朋友聚会可以请 GPT-4o 当裁判；出门面试，让 GPT-4o 当穿搭助理；讲冷笑话尴尬冷场，GPT-4o 专业捧哏；心情不爽它闭着眼一顿猛夸…… 它还能化身「AI 女友」，如果安在人形机器人上，《Her》就真的来了。

GPT-4o 刚热了个身就遭到全网热捧，天知道后面还会整出什么石破天惊的玩法？

转载请联系本公众号获得授权

投稿或寻求报道：[email protected]

微信扫码关注该文公众号作者

来源：机器之能

我们上手实测GPT-4o：速度快到飞起，还能直出板书，但视频分析逊色

相关新闻