Bendi新闻
>
国产大模型:今天起,我们100万tokens只需1元!

国产大模型:今天起,我们100万tokens只需1元!

1月前
金磊 发自 凹非寺
量子位 | 公众号 QbitAI

昨天刚刚在顶会ICLR作为特邀演讲(Invited Talk)中“国内唯一”的大模型玩家智谱AI,今天又放出了一个好消息:

现在我家的大模型开放平台,1元=1000000 tokens!

具体而言,这次价格调整的对象,是智谱AI的GLM-3-Turbo

  • 之前:0.005元 / 千tokens

  • 现在:0.001元 / 千tokens

换算一下,就是1元=1000000tokens;而同样是百万tokens,ChatGPT的价格是这样的:

什么概念呢?

相当于花1元钱就能写1万条小红书(以350字计算)

这个大动作,一下子就让智谱AI成为入门级里最便宜的那一个;而且它还特别提供用户tokens优惠计划:

开放平台新注册用户获赠从500万tokens提升至2500万tokens(包含2000万GLM3-Turbo和500万GLM4)

除此之外,GLM-3 Turbo Batch批处理API进一步便宜50%——0.0005/千 tokens。

值得一提的是,这不是智谱AI第一次对价格进行调整。

早在去年10月份,它就面向开发者把调用API的价格砍掉了一个数量级。

不过有一说一,如果说大模型是AIGC时代的“商品”,那么性价比必然是一个硬指标。

所以智谱AI,用起来又如何呢?

价格便宜了,能力还上去了

没错,除了价格调整的消息之外,智谱AI官方还表示:

包括GLM-3 Turbo在内的GLM系列将迎来更新,正在部分开放测试中,即将和广大开发者和应用者见面。

至于目前的效果,我们在智谱AI大模型MaaS开放平台便可以直接体验一番。

例如在“体验中心”,我们可以先将模型设置为GLM-3-Turbo,然后问它一个专业且复杂的问题:

请你作为一名经济学的资深教授,帮助我解决一些写论文问题。我是一名经济学的学生,我想写一篇论文方向是人工智能与经济学的论文,但我不知道具体的选题方向。你能结合研究热点,给我一些有思想有深度、提供新知的选题吗? 请注意,你的回答禁止出现经济学、人工智能与经济学等词语。

不难看出,在特定领域中,GLM-3-Turbo的能力是可以做到合格上岗。

而这在智谱AI大模型MaaS开放平台还只是“开胃菜”一般的存在,主打的就是一个方方面面

多模态大模型GLM-4就是其中之一,他可以在不牺牲任何NLP任务性能的情况下,实现视觉语言特征的深度融合。

并且已经在10余个国际标准图文评测数据集上取得SOTA。

多模态理解方面,GLM-4可以看复杂图片并回答做多种视觉问题:

代码能力方面,也可以让它用Python画一个爱心:

烧“脑”的逻辑推理也不在话下:

而具体到性能指标,打开方式是这样的:

  • 在上海人工智能实验室发布的大模型开源开放评测体系司南(OpenCompass 2.0)中,GLM-4 综合排名第二,仅次于GPT-4 Turbo 。

  • 在清华SuperBench大模型综合能力评测框架中,GLM-4与国际一流模型水平接近。

除了通用大模型之外,智谱AI的开放平台还提供术业有专攻的大模型的能力。

例如用户可以调用第二代CodeGeeX代码大模型,作为一个AI编程助手,可以实现代码生成与补全、注释生成、代码翻译等任务:

更高阶的能力,比如在IDE里针对具体代码做问答,CodeGeeX代码大模型也是可以实现:

在图像生成领域,智谱AI的开放平台在未来还将提供了CogView模型的API。

用户不仅可以用简单的自然语言Prompt来生成高质量图片:

还可以对特定图片进行“以文改图”

除了在上述大方面的能力之外,智谱AI的开放平台在细节上针对“定制化”和“本地化”也是下足了功夫。

提供了可以完成用户意图理解、复杂指令规划以及自由调用GLM生态中多种模型能力的工具集。

不过最重要的一点是,智谱AI的开放平台在操作上也是极其的简单——就是调用一个API的事儿。

大模型,开始卷“普惠”

从上述种种能力和操作上的展示来看,智谱AI正在释放一种大模型要“卷”的新信号——普惠

首先,最为直接的就是价格调整策略。

普惠的一个前提就是调用API的价格要做到够亲民,唯有如此才能够把市场打出去;这一点在国外大模型玩家们博弈过程中便有过体现。

在法国Mistral AI推出Mistral Large之际,它便用比GPT-4更便宜的API接口价格的“姿势”入局,在大模型性价比上给了OpenAI不小的冲击。

加上微软当时还入股了Mistral AI,不仅给钱还给算力,一度被传为“微软钦点的OpenAI备胎”。

聚焦国内,正如我们刚才提到的,智谱AI在去年10月便已经调整过一次价格,而就在上个月,阿里云也官宣核心产品大规模调整,为的也是提升市场的渗透率。

是颇有一种“得市场者得天下”的感觉了,而且就目前使用情况来看,也是得到了市场不小的认可。

据智谱AI官方数据显示:

截止目前,用户数有数十万的企业和开发者,并且在持续快速增长,过去的半年每日tokens消耗增长超过一百倍。

官方开发的三个调用工具,网页检索、函数调用以及知识库,自从 1 月上线以来调用次数已经超过3亿次。

对此,“红衣大叔”周鸿祎也给出了他的评价:

其次,在卷价格的背后,还需得有实力上的底气,毕竟对于性价比这事,“性”字是在排在“价”字之前的,只有好用才会有人买账。

在这一方面,讲真,智谱AI也是有够卷的;单是从今年的发展进程来看,智谱AI在大模型上的新研究、新进展就没有停过。

先后在 LLM、多模态、长文本、对齐、评测、推理加速、Agent 等大模型的方方面面都做出了诸多成果:

  • 2月6日:发布让多模态模型具有操作链的CogCOM

  • 3月8日:发布更快、更精细的文生图模型CogView3

  • 3月30日:提出了Pre-training Loss作为语言模型“涌现能力”的指标

  • 4月3日:在 GLM-4 中融入了RLHF技术

  • 4月4日:提出自动网页导航的Agent,AutoWebGLM

  • ……

不仅如此,就在昨天ICLR 2024的特邀演讲环节中,智谱AI针对通往AGI的道路规划,也亮出了自己的“三步走”——分别是发布GLM-4.5、引入GLM-OS以及GLM-zero。

总而言之,现在大模型公司要卷的不能再只是技术实力了,市场占有率、价格等因素也逐渐成为了关键的考量因素,由此方可形成普惠的一个闭环:

大模型需要用户的使用→得到反馈后优化→性能和收益的增长可让大模型更优惠→再吸引更多人来用。

不过有一说一,大模型们开始卷谁更“快、好、省”,用户们是真的赚到了。

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

来源:量子位

相关新闻

真要这么卷?某国产大模型定价下调90%,百万 tokens 只需 1 元!百万tokens低至1元!大模型越来越卷了曾月薪100万元,万科高管自愿降薪:每月税前1万元!他说:坚决不躺平2B小钢炮碾压Mistral-7B,旗舰级端侧模型炸场开年黑马!1080Ti可训,170万tokens成本仅1元击穿全网底价,通义千问GPT-4级大模型直降97%!1块钱能买200万tokens刷屏了,1亿元的保单一次付清!被保人0岁,自5岁开始每年可领300万元?知情人士:属实!业内人士:几个亿的大单也不稀奇了6600根金条、价值1300万元各种货币,这起“黄金大劫案”告破!加拿大警方:5人被捕,4人仍被通缉抖音出手!严打“厚黑学”“伪成功学”;揭秘Kimi大模型:日均获客成本超20万元|大公司动态问界新M5正式上市:售价24.98万元起!讯飞星火V4.0发布:国产大模型真的很炸裂!今日arXiv最热NLP大模型论文:Github万星!北航发布零代码大模型微调平台LlamaFactory有大变化!事关1万亿元遗产,巴菲特罕见发声!塌方现场,他用货车拦住了几十辆车,获1万元奖励!梅州开会:全力调查,给人民群众一个负责任的交代国外35岁小哥移民7年,年入$22w!买楼花换大房!目标:十年攒100万!多伦多35岁小哥移民7年,年入$22w!买楼花换大房!目标:十年攒100万!腾讯大模型APP真实测评!七家国产大模型“battle”,元宝顶得住吗?阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens!即日起,维珍澳航年中大促!100万张特价机票,最低$49起,助力澳人冬季出游杜鲁多下月起大涨工资:年薪飙破40万!加拿大议员收入登全球第二!已亏1100亿元!恒大汽车:资金足够再撑1年,将继续研发新车型!天津工厂停产,部分人员放假,“救命钱”可能要“黄”“狗推车”销量超过婴儿车……韩国“催生”升级:给这些人每月补贴100万韩元!网友点外卖祭奠,多个商家现空包!茶百道回应“白开水”事件:开除店员,闭店解约,捐款100万元!华莱士这样说……只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理卷疯了!最强开源大模型Llama 3发布,最大参数4000亿,小扎内心:大模型比元宇宙香多了
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。