Bendi新闻
>
黄学东分享:Zoom AI如何正确地「碾压GPT-4」

黄学东分享:Zoom AI如何正确地「碾压GPT-4」



  新智元报道  

编辑:润
【新智元导读】Zoom AI通过独创的「联邦AI」的技术路线,联合多个大模型,在特定任务上超越GPT-4,体现出了多个大模型互帮互助的强大能力,而且成本也能控制在GPT-4一半的水品。

去年底,从微软离职加入Zoom的华人AI大佬黄学东以Zoom CTO的身份发表了一篇技术博客,介绍了Zoom推出的联邦AI技术——

差异化地利用不同成本的AI工具,让能力强成本高的AI完成难度大的任务;成本低能力弱的AI完成简单的任务,从而在完成质量和GPT-4几乎一致的前提下,将AI完成任务的推理成本降到了GPT-4的6%。

在去年底,对标GPT-4,Zoom AI就做到了「质量一样,成本打1折」!

文章地址:https://www.zoom.com/en/blog/federated-ai-approach-best-quality-for-most-popular-features/

3月26号,黄院士又发表了一篇新的技术博客,宣布联邦AI技术取得的最新进展:

通过整合Claude 3等新推出的强力LLM,「联邦 AI」在特定的任务场景中,完成质量已经超过了GPT-4——

在Zoom提供的会议摘要功能「Meeting recap」上,Zoom AI的结果相比GPT-4将错误率减少了20%,在自动预测下一步操作的「Next Steps」上,Zoom AI的正确率提高了60%。

具体来说,Zoom AI将市面上的所有可用的LLM都整合了起来。

集众家之所长,从而在产品层面做到了质量「碾压GPT-4」!

这样的技术路径不但大大降低了使用大模型的成本,而且随着市面上不同公司的大模型性能的变化,可以灵活选择最适合任务的模型进行搭配。

从避免了与某一个模型深度绑定后,反而限制了产品服务质量的情况。

在Zoom最新的内部基准测试中,通过让人类评委盲选最准确的会议摘要的方式进行了测试。Zoom LLM和Claude-3配合下在会议总结和提取下一步操作两个任务上的表现都优于英文版的GPT-4。

将Zoom LLM与GPT-4总结日语会议的结果相比较。Zoom LLM也能够提供更好的结果,降低了接近15%的错误率。

根据Zoom委托GigaOm进行的一项研究显示,Zoom AI Companion的会议转录的准确率高达95%以上。

在会议提问场景中,Zoom AI Companion提供的结果比ChatGPT-4 web快四倍。

而在安全性上,Zoom AI组建一个由Claude-3、Gemini和GPT-4等多个LLM组成的「委员会」,降低了大多数LLM输出的固有偏差,从而减少了幻觉,进一步提高了输出的质量。

最主要的原因是不同的LLM不太可能犯同样的幻觉错误,所以Zoom LLM可以生成更一致的回应,进一步减少幻觉的影响。

而且根据黄院士透露,在性能表现超越GPT-4的任务中,推理成本有所上升,但依然只有GPT-4一半左右。

虽然要取得超越GPT-4的性能,Zoom AI成本要比去年底的「成本打一折」时高上不少,但是依然比仅仅使用GPT-4要便宜很多。

参考资料:

https://www.zoom.com/en/blog/federated-ai-approach-best-quality-for-most-popular-features/



微信扫码关注该文公众号作者

来源:新智元

相关新闻

苹果 AI 部分功能或需付费订阅;Altman 称 GPT-5 有「巨大飞跃」;马斯克大赞黄仁勋扫厕所:绝对正确 | 极客早知道GPT-4「荣升」AI顶会同行评审专家?斯坦福最新研究:ICLR/NeurIPS等竟有16.9%评审是ChatGPT生成月薪4万的“关键”新兴岗位:研究如何向AI发出专业提问如何把商业交给大模型?京东科技何晓冬:需要更严肃地把大模型“幻觉率”降下来醒着的每分每秒都用来备考:“学神”是如何养成的?蚂蚁集团启动组织升级,任命韩歆毅为集团总裁;OpenAI CEO阿尔特曼:GPT-4“有点糟糕”……酷比魔方小酷状元平板 3 月 29 日发布:主打“AI 精准学”、首发价 899 元对话 Soul App 张璐:「AI 会如何改变社交」解密PC的AI进化:AI大模型如何“压”进PC?从足球老将到国羽小将:急救如何抓住“黄金4分钟”?印象笔记唐毅:AI如何升级你的“第二大脑”|中国AIGC产业峰会“AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!给“后浪”做饭的AI创业者:思考如何让它穿越周期当消费遇上AI:大模型如何成为行业“网红”?行者AI尹学渊:AI打破内容创作“不可能三角”,推动美术/音乐大模型落地“最后一公里”|GenAICon2024黄仁勋,如何成为 AI 届的「明星」| 现场OpenAI CTO称 GPT-4「智商」相当于高中生/华为盘古大模型5.0发布/曝苹果国行AI与百度阿里百川接触曝苹果国行 AI 与百度、阿里、百川接触/华为盘古大模型 5.0 发布/OpenAI CTO 称 GPT-4「智商」相当于高中生“AI刘强东”直播首秀引热议:谁将无工可打?全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用ChatGPT如何「思考」?心理学和神经科学破解AI大模型,Nature发文日本东京地方法院驳回AI“发明”专利申请:发明人仅限于人类;Meta首发「变色龙」挑战GPT-4o,引领多模态革命丨AIGC日报“向量数据库”还是“向量搜索插件 + SQL 数据库”?PingCAP 黄东旭:我对 2024 年数据库发展趋势的思考解码临床心理学:在申请时如何利用“层进式”模型确定研究方向?|直播回顾
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。