大模型,一场骗局
从去年开始,ChatGPT爆火之后,这一波AI科技浪潮非常凶猛,几个月前发布的Sora、世界上第一个AI程序员Devin、被称为音乐界ChatGPT的suno......各种AI原生应用如雨后春笋般冒出。
也有人质疑,AI除了能写诗画画,在to C领域并没有现象级的产品出现;在to B领域也没有找到令人信服的应用场景。难道AI大模型,是一场骗局?如同曾经爆红的区块链、元宇宙一样,是资本和媒体炒作的概念?
下面K哥谈谈我对AI发展的观察与思考:
场景摩尔定律:AI Agent 大爆发
“场景摩尔定律”是“月之暗面”的创始人杨植麟,提出来的。所谓的“场景摩尔定律”是说每当模型升级的时候,它就会解锁指数级的大模型的应用。比方说很多文生图、文生视频的应用,都是基于大模型的能力长出来的。可以预见,智能体大爆发的时候到了。
智能体是什么?我简单列了一个公式:
智能体 = 大模型 X 外延设备
AI程序员Devin、Auto GPT就是智能体应用,它们是基于GPT以及其他大模型的基础上建立的。以Devin为例,给它加上IDE、命令行工具、浏览器等等外延设备,相当于是智能体的手和脚。大模型就相当于智能体的大脑,所以有大脑有手脚,它就变成一个智能体,包括最近讲的比较多的具身智能、人形机器人,其实也是类似的应用。
中国又被大模型“卡脖子”了?
有些朋友说,中国的大模型基础研究,不如美国。确实存在差距,其实这是两种不同的模式基础研究模式,一种是实验室的模式,比如说美国,他们是把这种基础的大模型,在实验室里面孵化好之后,再去做商用。
中国其实是另一种模式,叫做“应用倒逼模式”。
什么意思呢?就是开始可能我们的技术,比如说大模型,或者说以前我们的操作系统、数据库都不是世界领先的,但是我们会先发展应用,我们先用起来。我们基于这些国外的技术,比如我们搭建了淘宝、滴滴打车、12306这种超大规模的应用,当应用发展起来之后,它会倒逼底层技术的研究。
比如说我们现在有了国产的操作系统,比如鸿蒙,然后有了自己的这些数据库。这几年信创发展得特别好,很多技术的基建已经不比美国差了,就是我们中国走的所谓的“应用倒逼模式”。
大模型,注定失败?
Sora的出现再次证明了:大模型是通往AGI最有效的一个路径。
但是也有人不这么认为,甚至认为大模型注定失败。比方说著名人工智能科学家杨立昆,他提出一个叫做“世界模型”。他说Sora的技术路线是错误的,他为什么会这么说?
他认为“世界模型”才是通往 AGI的技术路线。我们先聊一聊杨立昆是谁,他是深度学习之父、图灵奖获得者、Facebook首席人工智能科学家,他其实是一个很有意思的人,本身是个科学家,但是把自己搞得像一个网红,经常在推特上发表一些惊世骇俗的观点。
他说的到底对不对呢?其实从Sora团队发表的白皮书来看,他们认为自己的大模型其实就是所谓的“世界模型”。
什么是世界模型?就是一种能够理解和预测物理世界规律的模型。比方说文生视频,像Sora这样的工具,他会知道说苹果是从上面往下掉的,他不会从下往上飘,他知道重力的存在,他知道物理世界的规则,这个就是“世界模型”。
从效果上来看,大模型就是“世界模型”,是目前通往AGI的最有效路径。
很多人说,现在的GPT以及其他大模型,会有幻觉的问题。我也跟业界的专家探讨过这个问题,其实这是可以解决的,还是scaling law,大力出奇迹的方式去解决。只要你有足够大的算力,你的参数足够大,你的数据足够多,这个问题其实是可以解决的。
不过,大模型也有被诟病的地方,就是它每次训练要耗费巨大的算力成本,据说GPT4的训练成本高达6,300万美元。
世界的增量,来自“非共识”
前面提到的杨立昆,其实本质上是“技术流派之争”,这不是现在才有,比如编程语言界,大家经常说 PHP和Java谁是世界上最好的语言?争论了几十年了,也没有一个结果,但是用PHP和Java都曾经做出过非常优秀的一些应用和网站。
像Facebook就是用PHP写的,淘宝这种电商平台,基本上都是用Java写的。所以这个是一个“技术流派之争”,大家要这么来看这个事儿。
世界是由“非共识”来驱动的,所有的主流都曾经是另类,所以我们要尊重不同的声音。比如Open AI很长一段时间,它在硅谷就是一个笑话,大家没有人会觉得这样的一家公司是有前途的。
刚才我们讲过GPT4用了2.5万个 A100 GPU训练了两个月,花费了6,300万美元。这样的事情,Google它就不会干。Google虽然发表了大模型论文,但是 OpenAI做出了 ChatGPT,为什么会这样?
其实这就是“创新者的窘境”,大家看过这本书应该知道,像“柯达胶卷”、“诺基亚手机”的故事还在发生,就是说“颠覆式创新”很难从大企业里面长出来,所以是OpenAI这样的公司做出了ChatGPT。
C端将涌现杀手级的应用
今年年初,周鸿祎演讲的时候提到过这个观点,他认为2024年C端会涌现出杀手级的应用。从去年ChatGPT之后,再没有出现杀手级的应用,很多业内的老大预言,今年应该会能够出现杀手级的应用,很多人看好的一个领域是:AI个人助理。
同时,AI也迎来了“克林格里奇困境”,什么是克林格里奇困境?所谓的“克林格里奇困境”,是指:一项新技术刚发明出来,容易改变的时候,我们无法预见它对社会可能产生什么影响,也就不知道如何改变;等到不良后果出现时,技术已经成为社会的一部分,很难或无法改变了。
以汽车为例,在汽车发明之初,没有人能够预料到汽车会带来空气污染、资源耗竭、交通拥堵等问题。等到这些问题出现后,汽车早已成为社会结构的重要组成部分。现在再来着手解决汽车带来的问题,已经很难彻底解决了。AI也是类似的,它可能加剧信息泛滥和虚假信息的传播,对社会造成负面影响,比如AI诈骗、肖像在影视作品中被滥用等等,但无论如何都不能阻挡历史的车轮滚滚向前。
新个体,崛起
会出现很多估值过亿的一人公司。这个观点是 OpenAI的CEO山姆奥特曼提出来的,他说:“很快就会出现一个由一个人凭借技术打造出来的价值10亿美元的公司。”
聊到这里,可能大家就会想到一个人对吧?就是我们国内的 AI教父----李一舟。当然了,山姆奥特曼指的肯定不是说李一舟。
“新个体”崛起的时代已经到来了。
为什么会出现“新个体”?有3个原因:
一是,我们其实已经进入到了低增长时代、微利时代。对企业来说,他对降本增效的诉求非常迫切。
二是,年轻人对“职业自由”的渴望。现在有很多“数字游民”、远程办公,包括我的新媒体公司里的一个员工,就是一个“数字游民”,有时候他在大理,有时候在三亚,我也不知道他在哪,我需要他的时候,他就会在线。现在年轻人都倾向于做这种所谓的“数字游民”,就是对职业自由的渴望。
三是,新生产力的崛起。就是我们上面聊到的这些AI工具,一个人加上AI就是一支团队。
什么是“新个体”?其实不只是说自由职业,也不是说单干。
其实所谓的“新个体”就是具备了稀缺才能,这种才能又能够满足垂直群体的需求。
比如说,前两个月我被拉进一个叫做“清北交复规划”群,这个是个什么群?因为我的小孩在念初中,所以就不知道被什么人拉进了“清北交复规划”群,这个群还挺贵的一个费用,好像是100万左右。他能够让你的小孩将来进“清北交复”这样的顶级名校,国外的也可以,他会帮你做一个长期规划。不一定是死磕学习、绝顶聪明的人才能够进清华北大,其实这些学校每年都有夏令营,有很多竞赛可以加分。
但是,只是业内人士,熟悉各个学校的招生政策的人才会知道,就是说这个群他就会帮你去做这样的规划,所以这是个非常典型“新个体”,他们团队才三个人,但是我看了一下,他们那个群里面大概有五十几个人,每个客户给了100万,就有5000万收入了。
未来像这样的新个体,会越来越多。他拥有稀缺的才能,他能满足垂直群体的需求。类似的还有,比如心理、减肥等等。
以上就是K哥近期对大模型的观察与思考,不一定对。总的来说,大模型不是骗局,大模型是人工智能领域的重大突破,是科技界最大的风口,这个风口甚至比互联网、移动互联网还要大、还要持久。
未来,不论你做什么,都要与AI有关。要确保自己始终在牌桌上,只要不下牌桌,再加上一点运气,就地起飞、改变命运的概率,比起其它行业,仍然高出很多倍。
来源 | AI新猿人 (ID:aixyr2023)
作者 | Mr.K ;编辑 | 荔枝
内容仅代表作者独立观点,不代表早读课立场
微信扫码关注该文公众号作者