Bendi新闻
>
视觉语音交互毫无延迟,都成精了居然还不是GPT-5?
视觉语音交互毫无延迟,都成精了居然还不是GPT-5?
7月前
作者|王兆洋
邮箱|[email protected]
“如果你之前使用过我们的语音模式,你会注意到几个关键的区别。首先,你现在可以打断模型了。你不需要等它结束你的回合,你可以随时开始说话,随时插话。其次,模型的响应是实时的。这意味着你不需要再经历那种尴尬的两到三秒的延迟,等待模型回应。最后,当我刚才呼吸非常急促时,模型能够感知到情绪。它会提醒你,或许你需要放松一下,你的节奏快得有点过头了。所以你知道,它确实具有全面感知情绪的能力。不仅如此,这个模型还能以各种不同的情感风格生成声音,它真的具有非常广泛的动态范围。”
1 这些操作全程没有多余的点击操作的交互。
2 没有丝毫延迟的视觉和声音反馈。
3 不仅能感受到你的情感,ChatGPT也自带情绪和情感。
4 能对桌面等更数字化的世界有更全面的信息感知。
5 全部集成在一个产品里,而且可能是对所有人免费的。
目前有两种构建人工智能的策略:一种是假设模型不会改进,然后在现有的能力上建设一堆小东西;另一种是假设 OpenAI 将保持相同的增长轨迹(继续疯狂迭代)。我认为,95% 的人应该押注在第二种策略上。我们有改进模型的使命,不是我不喜欢你们,但我们将碾压你。 ——Sam Altman,2023年4月17日
微信扫码关注该文公众号作者
来源:硅星人Pro
相关新闻
都5月份了~~你还没给孩子找好夏令营吗?听劝吧OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折不仅知道520,GPT 4o还特意写了一首诗!62℃,“屁股都烫烂了”!上海热到非洲朋友受不了:太热了,不接受!杭州地面都57℃了,气象为啥还不报40℃?我处理了 5 亿 GPT tokens 后:LangChain、RAG 等都没什么用我处理了 5 亿 GPT tokens 后:langchain、RAG 等都没什么用身体上长了5个头,敌人来了都不知道要攻击哪个头!这头还能当武器甩动Switch都快下岗了,小红书还能把这游戏炒到¥500多?突然暴涨!54元/公斤,半个月翻了一番!有人懵了,怎么贵成这样了!商家郁闷:都不敢进货……OpenAI大招要来了!AI语音助手狙击谷歌苹果,官宣下周二上新,GPT-5年前见ChatGPT 之父最新专访:发现 GPT-4o 惊喜用途,下一代模型可能不是 GPT-5OpenAI下周要有大动作,奥特曼在线剧透:不是GPT-5,不是搜索引擎不是搜索、不是GPT 5,下周一OpenAI要展示的是这个?刚刚!奥特曼放出来了GPT-5的内容:能力提升幅度超乎想象电召车司机好危险!纽约男接载“蒙面客” 谈不拢就跳车 还开了5枪!GPT-5来了?假的!GPT Store上线即乱:山寨、刷量、违禁内容层出!钱几乎没花,娃的视力稳住了,还窜高5厘米!看看他们5个都干了啥!奥特曼「草莓」推文引爆全网大猜想,神秘新模型现身,GPT-5 马上要来了?项目都快完工了,EB-5投资进去更安全抑或是坑?|过桥贷款利弊辨析一看就会,一做就成!5分钟解决一顿饭,还能让你营养圈里横着走5年了,为什么B站还要做毕业歌会?刚刚,苹果5月发布会都说了啥?一图带你看亮点!5月了!是谁还没找到靠谱的暑期科研项目?