第四次工业革命悄然揭开序幕
由我司AI自动生成
第四次工业革命悄然揭开序幕
一、第四次工业革命的突破口
多年前,我当年在德国的时候,就听德国人在提工业革命4.0的概念。
中国对应的发展计划是中国制造2025。
但是德国人提的工业革命4.0的概念,主要是数字工厂,智能制造这个方面的。
这个和真正的第四次工业革命还差的很远,因为技术突破的程度还远远够不上工业革命的级别。
根据前面3次工业革命的历史可以推断出来,达到工业革命这个级别,是需要可以改变所有行业的。
就像蒸汽机、电气、计算机与通信,可以应用到所有行业。
大家都在猜,如果第四次工业革命到来,那么到底哪个方向可能获得突破呢?
从能量和信息两个维度,一般来说有四个方向:
可控核聚变、室温超导、超级带宽、人工智能。
先说第一个,可控核聚变,主要是能量的生产。
万物生长靠太阳,太阳的能量来源本质就是核聚变。
可控核聚变,就是可以“人造太阳”,一升海水相当于300升汽油。
一旦实现,人类就相当于获得了无穷无尽的清洁能源,而且爆发力极强。
但是可控核聚变现在是什么情况呢?
永远还差50年。
你说这个技术有突破吧,也是有一些重大突破,但是每次突破之后,发现后面还有一个无底深坑,又需要50年。
第二个就是室温超导。
这个技术,是能量的传输,而且几乎是无损耗的传输。
不光是在输电、磁悬浮方面有巨大的价值,而且对于芯片产业带来巨大革命。
现在计算机内部,大部分的电,其实都没有用在计算上,而是变成热量散发掉了。
如果室温超导可以实现,那么芯片的密集程度可以更高,速度可以更快。
2023年3月,Ranga Dias在美国物理学年会上宣称在镥氮氢体系中实现了近常压"室温超导",文章于2023年3月8日在Nature发表。
当时国内的自媒体着实兴奋了一阵,仿佛第四次工业革命即将破土而出。
到了今年11月7号,Nature宣布撤稿。
因为Dias论文根本无法复现,而且Ranga Dias本人被发现多次人工修改数据,是个搞大乌龙的惯犯了。
第三个,是超级带宽以及远距离传输。
这个方向指的是信息的传输,带宽要大,距离要远,这里面也有不少技术难题。
这个方向上,技术走的是比较快的,比如马斯克的星链计划。
5G,现在也不知道有什么大的应用场景非要用到5G,引起一个大爆发。
连接,确实是可以产生规模效应,所以这个方向也是重要的突破口。
第四个,就是人工智能。
听起来,在四个中是最不靠谱,最没有希望的一个领域,就是人工智能。
因为前面3个,人类对于原理是大致清楚的。
比如说,核聚变,原理很早就搞清楚了,还造出了氢弹。
关键不是人类搞不出核聚变,而是“可控”才是难点。
超导什么的,早就有了,理论也跟上了,关键是室温还做不到。
超级带宽这块,香农的《信息论》早就成为经典。
而人工智能这块,人类连大脑的运作原理都没有搞清楚。
不仅仅是没搞清楚,而是知道的很少。
先别说达到通用人工智能,现在传统的机器翻译软件,连一个翻译都搞的有问题,十分的生硬。
各种资本也喜欢在IT互联网这方面炒概念,比如web3.0,元宇宙。
现在这些东西在哪里呢?
人工智能是不是炒概念,一个泡沫?还是说真正有用的技术拐点?
这是很多人的疑问。
要理解这个问题,就必须搞清楚到底发生了什么。
二、万用蒸汽机
翻译,讲究一个“信达雅”,“信”排在第一位,是说首先忠实于原文。“达”则是要流畅,地道,否则即使忠实于原文,表达也是生硬的,严重影响人们的阅读体验。
前面说到,传统机器翻译,连普通的英译中都搞的不顺畅。
这并不是说,在翻译这方面计算机技术没有进步,而是进步很大。
但是有几个问题,始终很难搞定。
有些人知道一些冷僻的历史、诗词,以为人工智能不知道。
实际上,这些对于计算机是非常简单的事情。
真正的难点并不是在这里。
其中最重要的一个难点是,计算机很难处理人类语言中的“长距离依赖”问题。
比如说这句话,“小红明天准备去看电影,她今天就买了票”。
这句话里面,“她”指的到底是谁?(术语叫:指代消解)
对于人类来说,这是再简单不过的事情:“她”一般是指的小红。
你必须理解整句话,才能将“小红”和“她”关联起来。
但是对于计算机来说,这个就非常难了,因为计算机只会“计算”,而不会像人类这样推理。
把“她”和“小红”关联起来,传统算法需要指数级复杂的计算。
这个就叫“长距离依赖”。
另外,人类不但能看到单个的词,而且可以通过上下文语境和背景知识来推断。
比如说这句话:“小红和小明一起去看电影,她很喜欢那部电影”。
请问,这里面的“她”指的是谁?是小红还是小明?
一般是指“小红”。
因为小学作文,你经常用“小明”、“小红”来做男女主人公的名字。
这就是背景知识。
词本无意,意由境生。
就是说很多时候,单个的词是没有含义的,在具体的语境中就有了含义。
按照信息论的说法,你知道的越多,需要的信息就越少。
比如说,“长距离依赖”哪里长了?这么多年都是这个长度?不要乱说,这句话里面“她”到“小红”之间包含逗号只有10个字,国产AI很不容易的。
这里啥也没说,你看到这句话,马上就能联想到那个卖口红的男人。
你这个让计算机怎么做才能做到?
这个就要让计算机拿很多文本去“学习”,学的这个结果,就是现在大名鼎鼎的“大语言模型”。
这个技术其实是一个很早的技术,并不是什么新鲜事。
只是当时算力和数据量不够,所以当年效果并不好。
现在就可以做到了,如下:
简单的说,计算机现在有计算上下文语境的能力了。
那么,是怎么做到的?
事情的起因,就是发生在谷歌Brain的翻译团队。
他们在2017年发表了一篇论文,叫做“attention is all you need”。
这篇论文解决了自然语言处理方面的两个重要的问题:
第一个,就是上面说的“长距离依赖”的问题。
第二个,算法可以并行,而且在并行计算的情况下,可以将原来的指数级别的计算复杂度降为一个常数。
这是非常了不起的,因为GPU(显卡)就是并行计算的,显卡上有很多“核”,天生适合并行计算。
当时,这篇论文并未像很多论文一样受到冷落,而是引起了相当的重视,并且应用到实践中了,效果不错。
这篇文章相当于打通了自然语言处理的任督二脉,从此这个领域就迎来了大爆发。
OpenAI成立之后,用的就是这个方法,后来大家都知道了,有了一个叫ChatGPT的东西。
其实OpenAI根本就没有发明什么新的理论或者模式,用的东西大部分都是已经有的理论和架构。
ChatGPT的胜利,实际上是工程的胜利,就是他们把很多落地的细节搞定了,比如大量数据的训练,大量算力的堆积。
OpenAI证明:数据》算力》算法。
典型的大力出奇迹,力大砖飞。
从这个角度来说,很多人,尤其是这方面的专家,根本不认为是什么技术拐点。
当ChatGPT 4名声大噪的时候,硅谷的很多人根本就不相信。
比如说,比尔盖茨根本就不相信,直到看到之后,被震惊了。
论文就是谷歌自己出的,谷歌也震惊了。
连OpenAI的CEO奥特曼,自己都没想到会这么快。
典型的就是,知道效果好,但是没想到效果会这么好。
谷歌自己发的论文,但是现在是全面落后OpenAI的。
就是不知道这项技术的潜力有这么大。
这个和蒸汽机的出现是很像的。
看过我们《工业革命系列》的朋友,一定还记得如下的事实:
当瓦特搞出蒸汽机的时候,前面早就有了纽卡门蒸汽机了,只是效率不行,也不能通用。
而瓦特用来改进蒸汽机的理论,早就有了,瓦特并没有发明什么新的理论。
确切的说,瓦特没有发明蒸汽机,而是发明了“万用蒸汽机”,效率比原来的蒸汽机提升了3-4倍,而且可以用于各行各业。
从此,就掀起轰轰烈烈的第一次工业革命,改变了整个世界,包括很多国家的版图。
这一次,大语言模型,就是具备“万用蒸汽机”的特点。
三、未来影响
众所周知,我们现在用到的IT和互联网服务,航空航天,通信通话,工业控制,家电等等,凡是涉及到信息处理的,都是用计算机语言编写的。
而计算机语言,只是自然语言中非常非常小的一个部分。
仅仅计算机语言能描述的部分,都已经带来了如此大的变化。
何况,现在已经扩展到了整个自然语言领域。
人类所有的信息,自然语言是通信和思考的基座。
不管是说话、文字,语言,还是图像,其实本质都是基于自然语言的。
攻破了自然语言处理,有几个方面,会给各行各业带来深刻的变化。
首先,模型是通用的,不光是用于自然语言处理,而且用于语音、图像、视频、机器视觉等等。
计算机从此具备了“计算”复杂知识的整体的能力。
比如一张图片,各种要素之间也是有逻辑关系的,也是存在“长距离依赖”的。
以前总是搞不定,但是现在技术上就不是问题,而是需要解决细节问题了。
各行各业都可以发掘出以前从未发现的知识(智能涌现),从而导致猛烈的寒武纪大爆发。
OpenAI的CEO奥特曼说,人工智能发现新的物理定律,就算成功了。
这个必然为期不远。
人工智能,成为了第四次工业革命的先导。
至于说人工智能可以理解“整体”的信息后,对于控制系统必然可以做到十分精准。
比如说自动驾驶,飞机导弹,计算机在理解外部方面提升了整整几个数量级。
其次,架构上是分工明确的,芯片层(GPU)、框架层(操作系统与框架)、模型层(大语言模型)、应用层(各行各业的程序)
上一次,一个生态有专门的硬件,还是计算机发明的时候,那个时候叫CPU。
而这一次,大语言模型连硬件体系都确立了,就是GPU。
本来,各行各业都对于算力觉得已经差不多够了。
但是现在大语言模型的出现,对算力提出了极高的要求。
现在一台计算机,只要不带显卡,都是非常便宜的。
但是一带上独立显卡,都贵的要死。
有需求,就有动力,后续对于整体的算力必然有一次巨大的跃升。
技术的扩散速度非常快,而且边际成本下降的很快。
在OpenAI取得成功后,国内涌现出几百个大语言模型。
以前,说生成一张这个世界上从未有过的人脸,好像是了不起的技术。
现在一个普通人完全可以做到,而且要多少就有多少。
比如,没有任何绘画基础的本人,就画了一张:
下面也是我画的一张风景图:
未来已来,对于普通人来说,当前要做的是,要尽量开始使用AI,体会AI对自己行业带来的变化。
四、结语
这次人工智能的爆发,本质是对自然语言处理的突破。
但是这个模型是通用的,并非只是可以用于自然语言的处理。
用于聊天,不过是其中很小的一个场景,而这个场景更容易被别人关注。
真正厉害的,计算机突破了“长距离依赖”的限制,对于知识有了整体的“计算能力”。
这个能力,源于大数据,算力,算法的突破,而且才刚刚起步。
结论:这就是一次重要的技术拐点,拉开了第四次工业革命的序幕。
未来已来,这才是真正的见证历史。
如果对你有启发,请点个关注或者“在看”吧。
老读者建议“星标”,没有任何互动,系统可能不会在第一时间推送给你。
微信扫码关注该文公众号作者