Bendi新闻
>
Meta表示Llama 3击败了包括Gemini在内的大多数其他人工智能模型

Meta表示Llama 3击败了包括Gemini在内的大多数其他人工智能模型

8月前

点击蓝字 关注我们

SUBSCRIBE to US


Illustration by Nick Barclay / The Verge


该公司在一篇博客文章中表示(https://ai.meta.com/blog/meta-llama-3/),Meta的下一代大型语言模型Llama(https://www.theverge.com/2024/4/18/24133808/meta-ai-assistant-llama-3-chatgpt-openai-rival)将向AWS等云提供商和Hugging Face等模型库发布,其性能优于大多数当前的人工智能模型。


Llama 3目前有两个模型权重,分别为8B和70B参数(包含80亿参数的Llama 3 8B和包含700亿参数的Llama 3 70B。)。到目前为止,它只提供基于文本的响应,但Meta表示,这是对前一版本的“重大飞跃”( https://ai.meta.com/blog/meta-llama-3/)。Llama 3在回答提示方面表现出更多的多样性,拒绝回答问题的错误拒绝更少,而且可以更好地推理。Meta还表示,Llama 3比以前理解了更多的指令,编写了更好的代码。


Meta在帖子中声称,在某些基准测试中,两种尺寸的Llama 3都击败了谷歌的Gemma和Gemini(https://www.theverge.com/2024/2/21/24078610/google-gemma-gemini-small-ai-model-open-source)、Mistral 7B和Anthropic的Claude 3等尺寸相似的型号。在通常衡量常识的MMLU基准中,Llama 3 8B的表现明显好于Gemma 7B和Mistral 7B,而Llama 2 70B的表现略好于Gemini Pro 1.5(https://www.theverge.com/2024/2/15/24073457/google-gemini-1-5-ai-model-llm)。


(值得注意的是,Meta 2700字的帖子中没有提到OpenAI的旗舰机型GPT-4。)


还应该注意的是,基准测试人工智能模型虽然有助于了解它们的强大程度,但并不完美(https://www.theverge.com/2024/4/15/24131097/measuring-ai-models-needs-an-overhaul)。用于对模型进行基准测试的数据集已被发现是模型训练的一部分,这意味着模型已经知道评估人员会问它的问题的答案。


Screenshot: Emilia David / The Verge


Meta表示,人类评估人员对Llama 3的评分也高于其他模型,包括OpenAI的GPT-3.5。Meta表示,它为人类评估人员创建了一个新的数据集,以模拟可能使用Llama 3的真实世界场景。这个数据集包括一些用例,如征求建议、总结和创造性写作。该公司表示,研究该模型的团队无法获得这些新的评估数据,也不会影响模型的性能。


Meta在其博客文章中表示:“该评估集包含1800个提示,涵盖12个关键用例:征求建议、头脑风暴、分类、封闭式问题回答、编码、创造性写作、提取、角色/伪装、开放式问题回答,推理、重写和总结。”


Llama 3有望获得更大的模型尺寸(可以理解更长的指令和数据串),并能够做出更多的多模式响应,如“生成图像”或“转录音频文件”。Meta表示,这些较大的版本参数超过400B,理想情况下可以比较小版本的模型学习更复杂的模式,目前正在训练中,但初步性能测试表明,这些模型可以回答基准测试提出的许多问题。


不过,Meta没有发布这些大型模型的预览,也没有将它们与GPT-4等其他大型模型进行比较。


微信号|IEEE电气电子工程师学会

新浪微博|IEEE中国

 · IEEE电气电子工程师学会 · 


人工智能如何帮助抵御网络攻击

人工智能引领数据中心发展新趋势

汽车知晓你的信息?解读隐私与安全挑战

汽车成为信息时代的移动计算机:5大数据收集方式解析

微信扫码关注该文公众号作者

来源:IEEE电气电子工程师学会

相关新闻

比Llama 3 推理更强的开源大模型出现了! Leetcode击败80%人类半数企业主认为ChatGPT比学位更重要,Meta发布免费人工智能模型Llama 3叫板李彦宏、Llama 3 发布,大模型的开源闭源到底在争什么?最强开源大模型Llama 3来了!4000亿参数狙击GPT-4,训练数据达Llama 2七倍阿里云汪军华:大模型时代的人工智能+大数据平台,加速创新涌现中国互联网30年:站在与人工智能大模型交汇的十字路口OpenAI的模型规范概述了人工智能的一些基本规则​第一个基于Llama 3的多模态大模型!Bunny-Llama-3-8B-V上线!哈尔滨啤酒检出呕吐毒素;Meta发布开源大模型Llama 3丨大公司动态如何定量分析 Llama 3,大模型系统工程师视角的 Transformer 架构从专用到通用-预训练大模型和AI agent,浅谈人工智能的趋势和展望对李飞飞老师空间智能的思考!空间大模型SpatialBot来了!张核子回应张姗姗身份;雷军直播回应造车亏损;Meta发布最强开源大模型Llama 3;阿里拍卖回应前员工指控高管职场霸凌|邦早报闭源赶超GPT-4 Turbo、开源击败Llama-3-70B,歪果仁:这中国大模型真香别再说国产大模型技术突破要靠 Llama 3 开源了周鸿祎向李彦宏“开炮”:有些名人胡说八道别被忽悠了;全球最强开源大模型Llama 3发布:最大模型参数将超4000亿丨AI周报Meta震撼发布Llama 3,一夜重回开源大模型铁王座卷疯了!最强开源大模型Llama 3发布,最大参数4000亿,小扎内心:大模型比元宇宙香多了Meta 宣布改组旗下 AI 部门,正训练自家下一代大语言模型 Llama 3;国内首个网络安全大模型评测平台发布丨AIGC日报P70系列有3或4款新品;国内首个开源千亿参数MoE大模型来了,对标马斯克的Grok……Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了大模型“脑回路”统一了?LLMs竟然能正确回答其他模型虚构的题目AI早知道|Apple 发布 MM1多模态大语言模型;xAI 是市场上薪酬最高的人工智能公司警惕AI大模型的“共情鸿沟”!剑桥团队呼吁:我们需要“儿童安全人工智能”框架
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。