Bendi新闻
>
Llama 3 上线4天,井喷1000多个变种!中文版也有了!Groq上推理速度800token每秒

Llama 3 上线4天,井喷1000多个变种!中文版也有了!Groq上推理速度800token每秒

 夕小瑶科技说 原创
 作者 | Zicy

4月19号,Meta发布了其最新的大型语言模型Llama 3的早期版本,反响热烈,短短4天,就有了1000多个变种,而且这个数字还在持续增加...

井喷式变种

19号凌晨,Meta发布的Llama 3可谓是向开源社区扔了一颗重磅炸弹,刚过4天,截至到目前4月23号上午10点,Hugging Face已经拥有了1013种Llama的变体,这个数字在21号晚上还是700多。有网友说Llama 3每分钟都在增长。


可是前几天不是刚过周末吗?


Hugging Face的联合创始人兼首席执行官Clem Delangue说到,到下周末可能将有10,000种变体可用!

而且Hugging Face的技术主管Philipp Schmid还贴心地发布了一份Llama 3-70B的微调指南,这个指南可以在他的个人网站上找到:

https://www.philschmid.de/fsdp-qlora-llama3

这份指南包括:设置开发环境、创建和准备数据集、使用PyTorch FSDP、Q-Lora和SDPA微调LLM以及测试模型和运行推理。

Llama 3中文版

在Llama 3的众多型号中,有一个清华系团队开发的Llama3-8B-Chinese-Chat还挺火,目前Llama 3 Models的Trending中排名第三。它是基于Llama3-8B通过ORPO微调的中文聊天模型,该模型显著减少了Llama3-8B“中文问题英文回答”和混合中英文回答的问题。

与Llama-3-8B-Insturct相比,模型在回答中文提示时一直都能做出更好的反应,而且在逻辑、编码、数学和写作方面表现出色。此外,相较于原模型,新模型在回答中大量减少了表情符号的使用,使得回应更加正式。

从网友测评的弱智吧case看,该模型的中文能力是相当不错的

模型的下载链接:

https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat

AI芯片的闪电级推理速度

除了开源社区在模型上的努力之外,初创芯片公司Groq似乎通过一系列实验证实,其芯片能够以每秒超过800个token的推理速度为LLaMA 3提供服务。

众所周知,矩阵乘法运算是深度学习的计算核心,Groq的张量流处理器对矩阵乘法做了芯片级优化,避开了传统CPU和GPU的缓存和复杂的控制逻辑,转而采用针对AI工作负载量身定制的简化、确定性执行模型。

虽然目前该芯片还在测试阶段,但其断层领先式的卓越性能似乎是坐实了,一直在对LLaMA 3性能进行基准测试的工程师Dan Jakaitis说到:每秒800个token的推理速度足以每秒生成约500个单词的文本,这几乎比传统GPU快了一个数量级,如果这钟性能的芯片进入市场,无疑会撼动人工智能推理的竞争格局,挑战Nvidia在芯片领域的霸主地位。

参考资料

[1] https://huggingface.co/models?sort=trending&search=llama3
[2] https://xiaohu.ai/p/6602
[3] https://venturebeat.com/ai/groqs-breakthrough-ai-chip-achieves-blistering-800-tokens-per-second-on-metas-llama-3/ 

微信扫码关注该文公众号作者

来源:夕小瑶科技说

相关新闻

AI在用| 没错,树莓派5也能飙上Llama 3了!最强开源大模型Llama 3来了!4000亿参数狙击GPT-4,训练数据达Llama 2七倍Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了Code Llama 70B霸榜3连发,练习5个月击败GPT-4!小扎LeCun亲自官宣上新面壁低调开源新模型:早于Llama 3、比肩Llama 3、推理超越Llama 3!Llama 4最新消息来了!黄仁勋、扎克伯格对谈一文浓缩,揭开Meta布局AI野望​第一个基于Llama 3的多模态大模型!Bunny-Llama-3-8B-V上线!全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用RAG微调Llama 3竟超越GPT-4!英伟达GaTech华人学者提出RankRAG框架超越Llama-2!微软新作Phi-3:手机上能跑的语言模型最强开源大模型深夜炸场! Llama 3 王者归来,直逼 GPT-4, 马斯克点赞 | 附体验链接Llama 3每秒输出800个token逼宫openAI!下周奥特曼生日或放出GPT-5?Llama 3突然来袭!开源社区再次沸腾:GPT-4级别模型可以自由访问的时代到来开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4卷疯了!最强开源大模型Llama 3发布,最大参数4000亿,小扎内心:大模型比元宇宙香多了Llama 3低比特量化性能下降显著!全面评估结果来了 | 港大&北航&ETH太酷了!iPhone、iPad、MacBook老旧设备组成异构集群,能跑Llama 3Llama 3加持,用户实测Meta AI还是弱爆了!小扎弯道超车的策略竟是「免费+不限量」?Llama 3被爆7月解禁剑指GPT-4,最大参数超1400亿!2名核心团队成员却离职最强智能体Agent Q发布!Llama 3零样本成功率提升340%最强智能体Agent Q发布!Llama 3成功率飙升3倍,OpenAI神秘「草莓」遭截胡?最全!LLaMA 3/2/1模型结构总览 & 亮点分析全网首发!Llama 3技术剖析、微调、部署以及多模态训练Meta 疯狂卷!继 Llama 3 后,重磅发布MR界的“安卓”操作系统
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。