Bendi新闻
>
GPT-4级别模型惨遭泄露!引爆AI社区,“欧洲版OpenAI”下场认领

GPT-4级别模型惨遭泄露!引爆AI社区,“欧洲版OpenAI”下场认领

夕小瑶科技说 原创
作者 | 王二狗

大家好,我是二狗。

这两天,一款性能接近GPT-4的模型惨遭泄露,引发了AI社区的热议。

这背后究竟是怎么回事呢?

起因是1月28日,一位名为“Miqu Dev”的用户在 HuggingFace 上发布了一组文件,这些文件共同组成了一个看似新的开源 LLM,名为“miqu-1-70b”。

同一天,4chan 上的一位匿名用户(可能是“Miqu Dev”)发布了一个指向 miqu-1-70b 文件的链接,使得用户开始注意到它,但大家都不知道这个模型是谁开发的。

有网友表示无论Miqu是什么,它都很牛,Miqu在 EQ-Bench 上获得了83.5 分(本地评估),超过了除 GPT-4 之外的所有其他 LLM。

另外多说一句,该榜单测试的是大模型的情商,并不包括其他维度的能力。但情商是大模型和人类交互时非常重要的一个性能,目前该榜单的前十名仅有一名中国玩家——排名第十的由深度求索发布的“deepseek-llm-67b-chat”模型。

一时之间,网友们纷纷化身为福尔摩斯,一位网友表示,Miqu百分百和Mistral-Medium 是同一个模型。

还有网友给出了三个猜测:

它实际上是尚未公布的 mistral-large模型;

 它是即将推出的 mixtral Nx70b 专家模型中的 N 个专家之一;

 它是由OpenAI或Meta故意泄漏的;

Mistral CEO 认领模型,表明是被泄露

由于网友的讨论愈演愈烈,过了不到一天,Mistral 首席执行官 Arthur Mensch 终于出来认领,确认Miqu-1-70b 是抢先体验客户的一名员工泄露的早期量化水印版,在Mistral 7B发布时已经训练完成。并预告最新模型已经取得了更好的进展。

网友表示终于破案了,原来 MIQU 等于 Mistral Quantized。

网友们对此表示安慰和期待:

有网友对此点赞,并顺道讽刺了一下谷歌:

有趣的是,Mensch 首席执行官并没有明确要求删除该模型,但是量化水印版的该模型还能不能再拿去微调,还不确定。

为何大家对 Mistral有如此高的期待?

因为上个月Mistral AI开源的一个Mixtral 8x7B MoE模型引爆了AI社区。

一是因为它的性能击败了LLama2和GPT-3.5。

二是因为,Mixtral是一个专家混合模型(Mixture-of-Experts model,MoE),使用了传闻中 OpenAI 用于GPT-4的架构,但是参数相比GPT-4要小很多,堪称是缩小版“GPT-4”。

而且这个模型还开源了,Mistral AI甚至直接通过torrent链接将其甩在推特上发布。

所以大家都很期待Mistral能继续开源GPT-4 级别的模型。

在上个月,推特上就有用户疯传 Mistral 将在 24 年发布开源 GPT-4 级别模型。

但很可惜,Mistral 的CEO只表示24年要推出和GPT-4竞争的模型,没有表明要开源。

开源和闭源之争

在生成式AI的竞争舞台上,OpenAI、Google DeepMind等老牌巨头已经走向了闭源,而Mistral AI的打法是开源,这一点和Meta很相似。

虽然目前业界最强的大模型仍是GPT-4、Claude、Gemini等模型,但正如Yann LeCun所说,开源AI模型正在超越私有模型。

一旦GPT-4级别的模型开源发布,可能会给 OpenAI 的订阅付费模式带来巨大的竞争压力,尤其是当越来越多的企业寻求开源,或开源和闭源的混合。

在开源社区的追赶下, OpenAI能否凭借GPT Store以及今年即将推出的 GPT-4.5 稳稳地保持 LLM 的头把交椅呢?


参考资料

 [1]https://venturebeat.com/ai/mistral-ceo-confirms-leak-of-new-open-source-ai-model-nearing-gpt-4-performance/

微信扫码关注该文公众号作者

来源:夕小瑶科技说

相关新闻

逼近GPT-4的新模型发布!「欧洲版OpenAI 」联手微软,却被质疑违背初心神秘大模型一夜“征服”所有人,超GPT-4却无人认领?网友:OpenAI 要有大麻烦了OpenAI日本办事处成立,定制「日语版GPT-4」发布!最佳开源模型刷新多项SOTA,首次超越Mixtral Instruct!「开源版GPT-4」家族迎来大爆发曝苹果国行 AI 与百度、阿里、百川接触/华为盘古大模型 5.0 发布/OpenAI CTO 称 GPT-4「智商」相当于高中生OpenAI CTO称 GPT-4「智商」相当于高中生/华为盘古大模型5.0发布/曝苹果国行AI与百度阿里百川接触直逼GPT-4开源模型大泄漏,AI社区炸锅!Mistral CEO自曝是旧模型,OpenAI再败一局?国产「GPTs」上线!全面对标 OpenAI 的智谱发布大模型,性能逼近 GPT-4大模型“挣钱”新方法!用GPT-4优化众筹文稿,提高筹款成功率11.9%!Llama 3突然来袭!开源社区再次沸腾:GPT-4级别模型可以自由访问的时代到来全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用“AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!重磅惊喜!OpenAI突然上线GPT-4o超长输出模型!「Her」高级语音模式已开放测试!性能超越 GPT-4 Turbo!「商汤日日新」大升级,国产大模型超市开张了一年斩获三轮融资!要打造AI最佳载体,雷鸟将推AR版“GPT Store”专治大模型“刷题”!贾佳亚团队新基准让模型只挑错不做题,GPT-4得分不到50看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3交卷!GPT-4o 大战国产 AI 模型写 2024 高考作文,今年谁能交出「满分作文」“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平GPT-4被证实具有「人类心智」登Nature!AI比人类更好察觉讽刺和暗示GPT-4调教指令揭秘,OpenAI又「Open」了一回!网友在线追问GPT-5商汤甩出大模型豪华全家桶!秀拳皇暴打GPT-4,首晒“文生视频”,WPS小米现场助阵AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024梗图理解“天花板”!港中文终身教授贾佳亚团队推出多模态模型:GPT-4+DALL-E 3,王炸组合刷爆榜单
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。