Bendi新闻
>
我们上手实测GPT-4o:速度快到飞起,还能直出板书,但视频分析逊色

我们上手实测GPT-4o:速度快到飞起,还能直出板书,但视频分析逊色

6月前

机器之能原创

作者:山茶花 Cardina

作为 OpenAI 有史以来最好的模型, GPT-4o 究竟强在哪里?
你要知道,它是一个原生的多模态大模型,可以跨文本、音频和视频进行实时推理——能听、能说、能看、零延时、可打断,还会「看人脸色」。
更重要的是,它还免费!
赶紧薅一把,你会知道什么是真・科幻照进现实!
实测 GPT-4o:速度飞快,视觉能力惊艳
打开 ChatGPT 官网,就会收到 GPT-4o 的试用邀请,点击「立即试用」即可进入对话页面。
如果没有收到邀请,可能是灰度测试阶段,稍等一会再重新进入。
然后,直接在下方的对话框中与其进行对话,系统会自动切换到 4o 版本。
值得注意的是,免费用户每天使用 GPT-4o 的次数有限,超出限制后要么升级为付费用户,要么只能用 GPT-3.5。
Plus 用户每月 20 美元,可享受高达 5 倍的消息上限。
许多 AI 公司正在将 GPT-4o 引入他们的界面。比如,Poe 用户可以直接勾选  GPT-4o 服务。
我们简单薅了一把羊毛,还是被 GPT-4o 的效果惊到了。
首先,这个响应速度太爽了!快到飞起,问题刚输入,答案就哗啦哗啦出来了。
有网友发现制作单个 html 文件,仅需 6 秒;分析电子表格数据不到 30 秒......
其次,GPT-4o 具备联网功能,可以搜集最新的新闻信息。
我们让它搜集 2024 年 5 月 13 日 AI 领域的新闻,它不仅对新闻进行了概括整理,还附上链接。
面对同样的要求,GPT-4 却直接「罢工」:
最后,GPT-4o 的视觉能力也挺惊艳。我们分别上传了樱桃和手写字迹的图片,让它辨认,全部回答正确。
网友发现,即使是 1800 年代的手写笔迹,也能出色地识别...... 了不起。
更离谱的是,GPT-4o 还能生成板书图片,图中的板书简直跟人类写的没啥差别。要知道,对于大模型来说,「写字」可是一大难题。
贾樟柯纪录片《一直游到海水变蓝》的海报设计极具巧思,正着看是波涛汹涌的大海,正好扣题,倒过来则是连绵不绝的群山,又与片中核心思想相呼应。
我们就把这张海报「喂」给 GPT-4o,还真别说,它回答的有板有眼,其中的深意均被 get 到。
不过,它的视频分析能力就逊色一些。

我们上传了一段 7 秒的《泰坦尼克号》经典片段,并让 GPT-4o 分析这个视频。

它迅速概括了该视频时长、每秒帧数以及分辨率等。不过,当问及这出自哪部电影以及画面中的男女主分别由谁扮演时,它「一问三不知」。
网友们疯狂「调戏」GPT-4o
眼下,给 GPT-4o 疯狂「整活」的视频已经在社交媒体上发酵,相当一部分可以归为「饭碗不保」系列。
当初 ChatGPT 刚上线,编辑们惊呼「完蛋,饭碗要砸」;GPT Store 推出后,创业公司老板们大惊失色;年初时 Sora 只是放出了 Demo 视频,就让演员们人心惶惶……
如今 GPT-4o 一出,客服、家教、秘书、同声传译「岌岌可危」,就连导盲犬也要「下岗」。
1.「充当」导盲犬
GPT-4o 现在可以实时查看和分析事物,可以帮助盲人描述当前环境,还能帮忙打车。唯一的 bug 是需要随时举着手机,要是能做成眼镜就更 perfect 了。
2.「充当」语音客服
给客服 GPT-4o 找茬儿?很难!哪怕是处女座!
一名叫 Joe 的小哥编了一个情景:ACME Telco 寄的新 iphone 无法使用,他让一个 GPT-4o 充当客服,另一个充当他的助手,帮他处理这事。
助手小 A 先陈述了事情的经过,接着客服小 B 就开始「连环问」:
Joe 是什么时候收到新 iphone 的?你能告诉我订单号码吗?设备有物理性损坏吗?Joe 是想把 iphone 退回店里还是邮寄回去?你能告诉我 Joe 的邮件地址吗?你能帮他看一下我刚发的邮件吗?
最终,事情完美解决 ——AI 客服对答如流,情绪稳定,找不出瑕疵。
3.「充当」家教老师
在一段广为传播的视频中,OpenAI 邀请可汗学院的可汗和他儿子一起使用 GPT-4o 来辅导孩子做数学题。
期间,GPT-4o 循循善诱,即使孩子回答错了,它仍耐心地进行指导和鼓励。帮助家长降低心梗几率的 「人」有了,还要继续砸银子给家教吗?
4.「充当」会议秘书
大语言模型产品天生是个打工人的命,GPT-4o 也不例外 —— 当完了老师又被拉进了线上会议,跟一群「不正经」的员工们掰扯着经典的「猫狗大战」。
它不仅能充当会议秘书,总结会议内容,还能在领导 cue 时对答如流。
5.「充当」翻译
因为外语能力出色,GPT-4o 还能充当同传,实时翻译,一如那条巴别鱼。
搞笑的是,GPT-4o 还化身「中文老师」教一群老外学中文,不过水平「一瓶不满,半瓶咣当」,教出的学生个个自带口音,还夸人家「真是个语言天才」。
此外,GPT-4o 还有一堆虚头巴脑的玩法,情绪价值直接拉满。
例如,凭借出色的语音合成能力,OpenAI 总裁 Greg Brockman 亮出了「拿手绝活」—— 让两个 GPT-4o 实时唠嗑。
下次开长途,如果将 GPT-4o 连接到汽车的语音功能,启动对聊模式,是不是就有人陪咱一路聊天了?
Greg 甚至让他们即兴创作了一首歌曲,当然啦,唱功不咋地,旋律很「感人」。
下面这个视频中的小姐姐更「简单粗暴」。
直接让 GPT-4o 分饰两角 ——ChatGPT 和 O,其中 ChatGPT 声音低沉洪亮,像一把大提琴,而 O 则有着法国女高音般的激昂声音。
它们要以「五月十日的旧金山」这一主题来个男女二重唱,期间还各种刁难,例如加和声,节奏加快等,它通通能搞定。
GPT-4o 还能自编自唱轻柔摇篮曲、唱生日歌,那调皮的语气活脱脱地就是个真人。
此外,朋友聚会可以请 GPT-4o 当裁判;出门面试,让 GPT-4o 当穿搭助理;讲冷笑话尴尬冷场,GPT-4o 专业捧哏;心情不爽它闭着眼一顿猛夸…… 它还能化身「AI 女友」,如果安在人形机器人上,《Her》就真的来了。
GPT-4o 刚热了个身就遭到全网热捧,天知道后面还会整出什么石破天惊的玩法?


© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]


微信扫码关注该文公众号作者

来源:机器之能

相关新闻

「Sora平替」来了!一键生成5秒视频,还免费,我们实测:很顶!实测钉钉 AI 助理大更新:除了卷到飞起的长文本,我们还发现了这些细节Claude 3全面超越GPT-4?我们上手实测了一波。A16Z分析:游戏Demo又火了,但我们能回到Demo时代吗?百岁齐邦媛去世:我们这代人还能活出她的优雅与骨气吗剑桥提出RLHF平替方案:在SFT以外,我们还能拿SFT数据做什么?批评不等于教育:除了发泄我们的情绪,批评还能解决什么问题 | 彭小华续航 823 公里!全球「能效最高」的电车发布,但我们还买不到养老金又又又涨了!但涨幅却下降了,等我们老了还能领到么?「如果AI会“黑化”」最新研究揭露:AI已学会撒谎欺骗、背叛、阿谀奉承,生物医药产业寄予厚望的AI,我们还能盲目相信它吗?王长虎:PixVerse 实测效果已超过 Pika,抖音经验让我们有足够优势微软秒删堪比 GPT-4 的开源大模型!研发总部还被爆在北京?官方:我们只是忘了测试微软秒删堪比GPT-4的开源大模型!研发总部还被爆在北京?官方:我们只是忘了测试3 个月砸 1000 万美元肝出“最强”大模型?黑马 Databricks:我们完虐 Grok、Llama,还更开放3个月砸1000万美元肝出“最强”大模型?黑马Databricks:我们完虐Grok、Llama,还更开放OpenAI 突然收购实时分析数据公司,传统数据库厂商:快来,OpenAI 又带我们玩了OpenAI 官宣旗舰模型 GPT-4o,完全免费、无障碍与人交谈!奥特曼:这是我们最好的模型一大波银行理财也开始亏了!我们还能怎么办?大模型引领软件行业变革,除了拥抱变化,我们还能做些什么?| QCon我们还能克服自恋和犬儒吗?华人输了!驱逐孙维提案结束,仅5000人投票!看着资产千万的她,我们还能等到正义到来吗AI、出海、IP授权,今年的ChinaJoy还能给我们什么惊喜?老外扎堆来中国旅游!狂拍视频:“我们都被西方媒体骗了!”冯仑:我们为什么还要向「东」学习?
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。