Bendi新闻
>
GPT-4级模型Grok开源可商用!卷底层大模型的公司危了

GPT-4级模型Grok开源可商用!卷底层大模型的公司危了

夕小瑶科技说 原创
作者 | 醒醒
上周,马斯克宣布 xAI 将开源 Grok。

刚刚,马斯克终于兑现诺言,xAI 宣布开源了 Grok-1 的模型权重和网络架构。

Grok-1 是一个拥有 3140亿 参数的专家混合模型,由xAI从头开始训练,模型实际只有 25% 的参数被激活,也就是实际激活的参数数量只有 86B。

这个架构和参数量,与网传的GPT-4模型高度相似,完全可以说是有意为之的GPT-4复刻版了。

xAI 官方博客中 提到Grok-1模型由8个专家组成,64层Transformer,每层包括多头注意力块和密集块。模型的上下文长度为 8192个token,采用bf16计算精度,权重使用 8bit 量化。

Grok-1 模型是在大量文本数据上训练,训练完成和模型权重保存截止到 2023年10月,未针对任何特定任务进行微调。

此外,还包含了模型的技术细节:

• 使用了旋转位置嵌入(Rotary Embeddings),提高了模型的位置编码能力。

• 131072个词量,embedding-dim为6144,64层Transformer。

• 上下文长度达到8192个 token,采用bf16计算精度,对权重使用8位量化,用于优化模型的运行效率和资源消耗。

代码和模型权重已上线GitHub,目前github上已有6.9k标星。

模型下载地址:
https://github.com/xai-org/grok-1

Grok-1采用的是Apache 2.0 license,意味着,可商用。

有趣的是,ChatGPT的账号竟和马斯克互掐起来了,不知道ChatGPT背后是人还是机器人。

此前马斯克向法院对OpenAI提起诉讼,控告Sam违背公司创立初衷,不开源GPT。

如今马斯克以身作则,率先开源自家大模型Grok, 撇开赌气成分不谈,但马斯克的公众形象始终是站在造福人类大众一方,而本次Grok的开源,是给大模型开源社区带来一些鲶鱼效应,期待可以给社区带来惊喜。

参考资料

 [1]https://x.ai/blog/grok-os

微信扫码关注该文公众号作者

来源:夕小瑶科技说

相关新闻

微软秒删堪比 GPT-4 的开源大模型!研发总部还被爆在北京?官方:我们只是忘了测试微软秒删堪比GPT-4的开源大模型!研发总部还被爆在北京?官方:我们只是忘了测试最强开源大模型Llama 3来了!4000亿参数狙击GPT-4,训练数据达Llama 2七倍国内首个开源千亿参数MoE大模型来了!性能超Grok-1,单张GPU可跑P70系列有3或4款新品;国内首个开源千亿参数MoE大模型来了,对标马斯克的Grok……发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试媲美GPT-4的开源模型泄露!Mistral老板刚刚证实:正式版本还会更强性能直逼 GPT-4!最强大的免费开源模型出世 | 极客时间讯飞星火V3.5整体接近GPT-4 Turbo!首个13B开源大模型发布,深度适配国产算力直逼GPT-4开源模型大泄漏,AI社区炸锅!Mistral CEO自曝是旧模型,OpenAI再败一局?三个Agent顶个GPT-4,基于开源小模型的那种|中大阿里联合出品卷疯了!最强开源大模型Llama 3发布,最大参数4000亿,小扎内心:大模型比元宇宙香多了马斯克发全球最大开源模型!3140亿参数的Grok真打脸OpenAI了?苹果开源了!首次公开手机端侧大模型,AI iPhone 的细节就藏在里面Llama 3突然来袭!开源社区再次沸腾:GPT-4级别模型可以自由访问的时代到来规格拉满!Llama和Sora作者都来刷脸的中国AI春晚,还开源了一大堆大模型成果首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作最强开源大模型深夜炸场! Llama 3 王者归来,直逼 GPT-4, 马斯克点赞 | 附体验链接大模型又开“卷”!万亿参数闭源模型、四千亿开源模型来了杀疯了!全面超越Llama3的强悍开源模型,仅9B,1000k上下文;GPT-4级别模型1年降价1万倍上海AI Lab开源首个可替代GPT-4V的多模态大模型开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4最佳开源模型刷新多项SOTA,首次超越Mixtral Instruct!「开源版GPT-4」家族迎来大爆发比Llama 3 推理更强的开源大模型出现了! Leetcode击败80%人类
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。