Bendi新闻
>
Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

11月前
西风 发自 凹非寺
量子位 | 公众号 QbitAI

Stability AI开年第一个大模型来了!

名为Stable Code 3B,参数27亿,专为写代码而生。

Stable Code 3B可理解处理18种不同的编程语言,上下文长度100K token

且它对硬件要求也不高,用MacBook Air等普通笔记本电脑也能离线运行

性能方面,Stable Code 3B规模比CodeLLaMA 7B小60%,但性能却大差不差。

BigCode评估中,在包含多种编程语言的MultiPL-E数据集上,Stable Code 3B与类似大小的模型相比,都拿下了SOTA性能。

Stable Code 3B刚上线,有网友反馈已经在插件中用上了:

效果非常好!体积小,兼容各种硬件且运行速度非常快。

Stable Code 3B长啥样?

在此之前,Stability AI去年8月份就已发布了一个初代版本Stable Code Alpha 3B,Stable Code 3B是其进化版。但开发团队表示,Stable Code 3B是首个主要版本,基于Stable LM 3B基础模型打造,并增加了多项附加功能。

其中就包括支持中间填补(FIM)等新功能,并使用RoPE(旋转位置嵌入)方法,将上下文长度从16000 token拉长至100000 token。

Stable Code 3B整体架构类似于LLaMA,是一个仅解码器模型,使用Flash Attention 2算法。

支持以下18种编程语言:

C、CPP、Java、JavaScript、CSS、Go、HTML、Ruby、Rust、Markdown、Shell、Php、Sql、R、Typescript、Python、Jupyter-Clean、RestructuredText

下面是对性能比较的补充。

面对比自己大两倍多的CodeLLama 7B,Stable Code 3B的性能也差不多能与其打个平手,在Python、CPP语言上甚至略胜一筹。


在类似大小的模型中,Stable Code 3B表现突出。

不过也有吐槽声

虽然Stable Code 3B收到了一波好评,但也有不少网友认为“没有太多新东西”、“没有那么好”。

此外,它仅支持英语和编程语言,也是让大家有些许失望。


对此,你怎么看?

参考链接:
[1]https://huggingface.co/stabilityai/stable-code-3b

[2]https://twitter.com/StabilityAI/status/1747348018884493623

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

来源:量子位

相关新闻

曝小扎写信“挖角”DeepMind;我国10亿级参数大模型超百个;Stability AI开源代码生成模型丨AIGC大事日报谷歌最强开源大模型亮相!Gemini技术下放,笔记本就能跑,可商用Stability AI开源3B代码生成模型:可补全,还能DebugAI早知道|Stability AI发布最新代码模型;国内首个AI综艺导演亮相;英特尔商用客户端AI PC产品发布AI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布大佬出走后首个发布!Stability官宣代码模型Stable Code Instruct 3B集体出走的Stability AI 发布全新代码大模型,3B以下性能最优,超越Code Llama和DeepSeek-Coder国产RISC-V狂奔:端侧能跑大模型,AI计算成重头戏电脑平板组AI集群,在家就能跑400B大模型,GitHub狂揽2.5K星​Stability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩不玩“期货”的快手接棒Stability AI,国产之光可图大模型Kolors领跑开源生态AI早知道|首款基于文心大模型的学习机Z30;Stability AI 推出聊天机器人AI早知道|Stability AI 资金危机或考虑出售;腾讯混元大模型支持 16s 视频生成Stability、Mistral、Databricks、通义、A21 Labs开源五连招,其中三个是MoE!|大模型一周大事AI早知道|阿里推新项目MotionShop;Stability AI发布代码模型;Win11新增AI生成图像功能Stability AI发布全新代码模型Stable Code 3B!媲美70亿Code Llama,没GPU也能跑超越Llama-2!微软新作Phi-3:手机上能跑的语言模型开源模型穷途末路?Stability AI欠下1亿美元,四处寻求「卖身」...开源模型穷途末路?Stability AI欠下1亿美元,四处找钱寻求「卖身」Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成国产AI PC处理器来了!6nm制程,45TOPS算力,能跑百亿参数大模型喜发新模型,却被众嘲是破产“前兆”!Stability AI “最强”模型人形绘制太“阴间”,网友:因为研发太讲武德开源多模态SOTA再易主,19B模型比肩GPT-4v,16G显存就能跑iPhone就能跑!微软推出轻量级模型Phi-3,性能堪比GPT-3.5 Turbo,AI的未来在手机端?
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。