马斯克发全球最大开源模型!3140亿参数的Grok真打脸OpenAI了?
要闻背景简述
前段时间,马斯克起诉OpenAI并要求开源GPT模型。之后,马斯克在推特上宣布要开源自家公司的大模型。
3月17日,马斯克旗下人工智能公司xAI宣布正式开源Grok-1模型,模型参数达3140亿,是迄今参数量最大的开源大语言模型。
那么,我们可以从Grok-1这一全球最大的开源模型中看到什么启示呢?
以下是王煜全要闻评论:
最近有关马斯克的新闻真是不断。我们之前介绍过,他成立了一个xAI公司专门做人工智能,现在这公司推出成果了,叫Grok-1大模型。
这个模型有3140亿个参数,是所有开源大模型里参数最多的,所以很多人在惊呼马斯克打脸OpenAI了。
是不是真的打脸OpenAI?我认为可能是反过来的,有可能被OpenAI打脸。
我在这顺便给大家做一堂教学,告诉大家怎么去判断科技产业的未来发展,或者说一个技术到底未来有没有巨大的机会,我相信很多人都想掌握。
还是先给结论,我认为对未来能够有预判主要看两点:一个叫看趋势,另一个叫看模式。
什么叫看趋势呢?就是说任何的技术发展都不是孤立的,往往有一大堆公司相互差距没有那么大,相互伴随着发展,所以从这堆公司的发展来看就能看出趋势来。
那最近的趋势是什么呢?大模型之争还在继续,但是可能到了一个转折点上。
注意最近Anthropic公司推出了Claude 3大模型,它的一些通用性的指标上号称比OpenAI强了一点点,但是在一些专有指标上它强了很多。
这意味着很有可能它并不是大模型胜出了,而是用一些比如说多模态,包括Multi Agents来处理一些事情。
现在很明显人工智能已经往解决实际的应用问题方面去转化了。这种时候看具体的解决问题能力,往往不是看这个模型参数有多大,而是看你有没有相关的一系列的配套的配件,把配件组合起来形成组合拳去解决实际问题。
另外,最近有一个公司叫Cognition,他们强调的就是端到端地解决实际问题的能力。比如,你用他们的AI Devin开发一个程序,或者开发一个游戏,你只需要把指令下完,这个游戏就会完整地开发给你,不需要做任何其他事,它还能帮你挑错,帮你做质量检测。
以前很多人工智能只能解决一个环节的问题,整体的把控包括很多的细节判断还是要人来做。那现在人工智能可以完成完整的工作了。
无独有偶,前一段微软就发了一篇论文,专门讲他们在测试两种不同类型的AI agents。
一种叫APP agent,应用智能体。它解决的是在手机上操作的时候选哪个手机APP。另一个叫作ACT agent,行动智能体。应用智能体选了某个APP了,到APP里面去执行操作就用另一个执行智能体。两类不同的智能体综合起来就能完成一个相对复杂的任务。
所以,有两个大趋势出现了交叉。一个趋势,就是人工智能正在从强调大模型、强调参数、强调性能,转到强调解决实际应用问题。
另一个趋势,我们说2024年开始会出现终端智能。因为终端离每个用户近,尤其是对每个用户的数据收集得比较多,对用户的行为理解会更深刻,那这种时候我在终端就能够更有智能地去帮用户解决问题,这一定是一个发展趋势。
那从终端智能角度上讲,当然更强调解决实际问题了。那这两个趋势融合,你会发现未来很有可能就强调看模式了。
看模式也是说两点。一点就是以前我们说工业革命的模式,尤其是瓦特蒸汽机出来以后,还有人在不断地改进,但是这个性能提升就没那么多了。
按经济学术语来讲,叫边际效益递减,也就是说这种时候再去提升蒸汽机本身的性能就不值当了。
就像今天大模型可能还能提升,但是你提升大模型的性能,可能它的边际效益就不够大了。
那什么时候边际效益能增加?就是要一堆配套的技术,包括像当时的曲轴连杆才能使得蒸汽机能够驱动火车轮船。所以这些配套的技术就特别重要。
那现在的配套技术就是AI Agents,尤其是前一段时间吴恩达提的叫Autonoumous Agent,叫自主化智能体,非常重要。
另一个模式是什么?以前PC硬件主要使用X86结构CPU,当初Intel的CPU可以说是性能最好的。其实到今天很多手机CPU也不能说超过了英特尔的CPU了。
但手机就有一个新的需求,在解决问题的现实场景当中,我需要的并不是足够强大的算力,而是能够随时随地提供算力,甚至说需要能够相对低能耗的算力,别俩小时就没电了。
这种时候,ARM架构的简易指令集CPU变成了主流,也就是后来高通主导的这些CPU。
所以,从过去的历史中可以看到这样一个模式,就是一开始性能是第一位的,但是真到实际应用场景的时候,我们更强调就不是性能,而是解决实际问题了。
现在,手机上需要有智能的时候,就会从云端的强调高性能的大模型,变成了终端的强调在有限算力之下提供一定智能水平的大模型,甚至可能是小模型。
当解决实际问题的时候,你会发现有可能未来的趋势是小模型加上一堆的配套技术,包括和终端上的用户数据、用户互动相结合,它最后的性能甚至会超过大模型。
因为大模型没有那么多的终端用户的数据,尤其是实时的数据,所以它到最后未必能够竞争得过更贴近用户需求的小模型。
所以,从趋势和从模式都能看出来,有可能我们正处在人工智能的一个转折点上,从过去追求性能到现在追求应用,追求解决实际问题。
所以我们得到的结论也是两条。
第一条,即使是马斯克这么聪明的人,离OpenAI也有点远了,对整个人工智能,尤其是生成式人工智能的发展趋势可能理解得就没那么透了,很有可能他是在跟上已经过去的趋势。
另一个是给了我们一个重大启示,中国是有机会的。为什么这么说呢?因为如果一味强调模型的性能领先,咱真不一定追得上。
但是,如果是强调解决问题,而且是在有限条件下解决问题,中国有很多很多的高手。想想咱们手机上各种丰富的应用,你就可以想象了。
我们说从2024年开始,手机上会有一大堆的AI原生的APP,就是它有很强的智能性,也有个性化、随身的这样的特点,那么这些很有可能也是中国人制造的。
也就是说,在人工智能时代,我们在应用落地上可能还能领先。当然也是给大家指一个方向,就是如果你要在中国创业做人工智能,我觉得大模型未必是一个好选项,但是贴近用户做应用很可能是有巨大的机会的。
最后,我们也希望把这次评论当做一次演示,希望每一个普通人都不只是看着新闻,觉得别人很厉害,别人很牛。而是外行看热闹,内行看门道,看出来这个技术到底如何分析,才知道它的趋势,才知道它的未来发展方向,从而我们也能够把握住技术趋势,成为技术趋势的受益者。
以上是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享。欢迎关注全球风口微信号,报名加入!
王煜全要闻评论,我们明天见!
1. 前哨科技特训营直播课程第四季(2023年)共50讲+,除此之外还有5节加餐+公开课。 2. 每讲承诺为1小时视频内容,实际平均时长为2小时。 3. 每周四晚八点准时直播,会员可无限次观看回放。 4. 新入会员,可以无限次回看之前所有视频课程。 5. 成为会员即可使用【AI王煜全】,最新AI大模型开发的专属科技分析助手
6. 每周组织【前哨·创新启发局】,链接科技/产业一线人士,打开技术/应用前沿视野
7. 优先获取全球科技产业一线游学、访问机会,接触科技/产业专家,获取最新、最前沿的趋势洞察,人脉链接
8. 本课程为虚拟内容服务,年费订阅服务制。一经订阅概不退款,线下活动需另行支付差旅成本,请您理解。
微信扫码关注该文公众号作者