Bendi新闻
>
每闻春风之怒号则寸心欲碎

每闻春风之怒号则寸心欲碎

3月28日(星期四)晚上,我本来准备好了要看小米汽车的发布会。我不懂车,至今也只开过油车,对新能源车近乎一窍不通,所以有必要加强学习。不过,发布会开始不到半小时,我的一位从事大模型研发的朋友发来一条消息:“快看新闻。”同时发来的还有一条新闻链接。

Databricks, 这家位于硅谷的数据解决方案公司,发布了一个名为DRBX的开源大模型。这是在短短一个星期之内,市面上出现的第二个开源大模型(第一个是马斯克的x.AI开源的Grok)。我们知道,全世界已经有几百种、可能上千种开源大模型了,但是其中很多都是在LLaMA、GPT-J、通义千问等已有开源大模型基础上的改良;DRBX则是一个全新的自研架构大模型。它至少具备如下令人印象深刻的特点:

  • 采用了混合专家(Mixture of Experts)架构,这是继Mistral、Grok以来,又一个确定采用混合专家架构的大模型。附带说一句,由于GPT-4没有公布技术路线,我们无法确认它具不具备混合专家架构。
  • 多项评测显示,DRBX可能是目前市面上最强大的开源大模型,优于上面提到的LLaMA-2、Grok和Mistral/Mixtral。当然,具体有多强还要等待开源社区的进一步评估。
  • DBRX的训练仅仅使用了3072张H100显卡、2个月时间,训练成本仅为1000万美元。这说明,即便在算力军备竞赛白热化的今天,仍然存在以较低成本做出堪用的大模型的可能性。

从当天晚上八点直到次日凌晨一点,我一边激动地与AI行业的朋友探讨DRBX可能造成的影响,一边在英文科技媒体和Hugging Face上寻找大家对此的评价。不知不觉之中,小米汽车的发布会就结束了。我本来可以看回放,但是仔细考虑,还是决定不看了。从现在开始,所有与新能源汽车有关的知识,我都不打算学习了。

因为人的时间精力是有限的,如果这段时间我只能学习一件事物,那肯定是生成式AI。它实在过于重要,重要到让其他一切科技赛道显得很渺小。很可惜,我已经很多年没有编程经历了,也不擅长数学,太深奥的技术细节我看不懂;不过我会努力学习那些看得懂的东西。就在今天,这样一个阳光明媚的周末上午,我还在询问AI行业的朋友对DRBX的观感——他们告诉我,这个大模型确定比马斯克开源的Grok更好,尽管Grok的闭源版本应该强一大截。

当然,我相信,对于我国科技行业(尤其是A股科技行业)而言,DRBX会催生出一大批“国产自研大模型”,它们都会自称具备遥遥领先的自主知识产权,并且很快能够在多个应用场景落地。2023年,一位科技“大佬”的大模型创业公司,其产品被人发现完全“学习”LLaMA2、甚至连参数名称都没有来得及修改。我相信,2024年他们不会再犯类似的错误,也不会再离婚,因为离婚减持的方式已经被证监会叫停了。

1861年,在漫长的安庆包围战结束之后,湘军二号人物、湖北巡抚胡林翼志得意满地登上战船,视察长江防务。没想到,他看见了一艘英国火轮以极高的速度向上游行驶,很快就出了视野范围。于是他大叫一声,吐血倒地。不久之后,胡林翼就去世了,直接死因是多年不治的肺结核,但如果不是受到英国火轮的刺激,他或许能活得久一点。


清廷确实应该为失去胡林翼这样的能臣而惋惜——当时的绝大部分督抚,在看到英国火轮之后,只会装做无事发生,或者琢磨着怎么跟英国人串通捞一把。只有真心热爱脚下这片土地的人,会因为英国火轮的出现而感到深深的绝望和无助。胡林翼是洋务运动最早的发起人之一,虽然他死的太早了,但洋务运动的火炬还是传给了左宗棠、沈葆桢、刘坤一、李鸿章、张之洞等人。洋务运动最终没有取得成功,这既是历史的不幸,也是历史的幸运,取决于你站在谁的角度看待问题。

在胡林翼吐血倒下之前五年,1856年春,曾国藩向清廷上书:“每闻春风之怒号则寸心欲碎,见贼帆之上驶则绕屋彷徨。”当时湘军彻底被太平军压制着,看不到任何翻盘的希望。然而事实证明,真正值得曾国藩“寸心欲碎、绕屋彷徨”的,不是太平军,而是洋人。前者在1856年夏的天京事变当中元气大伤,后者则还要对整个东亚进行长达九十年的统治,而且统治程度越来越深。哪怕曾国藩本人也介入了洋务运动、做出了一定贡献,他还是无法改变什么,晚年一定也是“寸心欲碎”。

此后四十年,洋务运动几经起落,最后被甲午战争判了死刑,也解开了中国近代史上的一个迷思:“中学为体、西学为用”是伪命题,西学必须既为用、也为体。向西方学习最彻底的日本,不但击败了暮气沉沉的清帝国,也击败了向西方学习不够彻底的俄国。从日俄战争开始,西方列强终于意识到,全面吸收了自身科技、文化和制度体系的东方人,有可能向自身发起挑战。一百多年过去了,很多事情改变了,好像又什么都没改变。

如果是我处在1856年的曾国藩或者1861年的胡林翼、左宗棠的位置上,我听到春风之怒号,还是会寸心欲碎;但我应该不会绕屋彷徨。人的精力应该用在更有意义的事情上,例如学习,例如保持良好的身心状态以准备下一次机会,无论它发生在明天还是几十年后。绕屋彷徨无助于解决任何问题;当然,比起那些无视春风之怒号,还是坐在屋子里喝酒狎妓的人,绕屋彷徨还是要好那么一点点的。

曾经有那么一千多年的时间,从战争中归来的罗马征服者能享受凯旋式的荣誉:那是一场喧闹的庆典。在庆典上,号手、乐师和来自被征服领土的珍禽异兽都会出现,与他们一起前进的是满载着财宝和缴获武器的马车。征服者本人站在凯旋的战车里,前方是摇摇欲坠的战俘们组成的队列。有时候,征服者的孩子会穿着白袍,与他并肩站立,或者骑在拉车的马上。在征服者的身后,总是站着一个奴隶,手捧黄金冠冕,对着他的耳边发出低声的警告:“记住,一切荣誉转瞬即逝。”(注:转引自《巴顿将军》结尾部分画外音。)

本文没有获得任何大模型产业链相关公司的资助或背书。
本文作者不赞成曾国藩、胡林翼及其同僚的世界观和价值观,也不认为他们当时的努力对中国而言不可或缺。


微信扫码关注该文公众号作者

来源:互联网怪盗团

相关新闻

五一还没抢到票?看看这11个超低调目的地,从冷门海岛到秘境之春,从避世古村到无人小城、甚至免签国外,每一个都想去!碎花裙OUT!今夏流行「赫本风连衣裙」,高级纯欲,回头率200%!华女来美留学定居11年欲购房,签约前一秒梦碎!可能面临牢狱之灾比白T时髦,比衬衫凉快!夏天少不了的小香风碎花针织短袖/开衫,清爽又时髦,59元到手!谁说松弛感没法复刻?惬意原木风每1㎡都装满陶渊明的田园诗意!【居住榜样】一拳锤碎挡风玻璃!大多伦多4名壮汉暴力围堵路过车,3人被捕1人在逃经典「原木+白」的自然风之家,每1㎡都充满阳光和通透感!【居住榜样】Longchamp 早春学院风上新,每一个都好心动!每片被风吹落的花瓣,都是春天年终盘点:思想之光,照亮每一个前行的人华人Costco购物 遭报警抄家 面临牢狱之灾 只因做了每个华人都可能做的事……华人Costco购物 遭报警抄家 面临牢狱之灾 只因做了每个华人都可能做的事......破除“养老之困”迫在眉睫,每经专访原银保监会副主席梁涛:将保险业务、资产管理与养老服务相融合,充分满足老年群体的多元化需求90m²米灰+胡桃木侘寂风设计,超强收纳每1㎡都美得毫不费力佛罗里达梦碎?揭秘阳光之州的“真面目”,搬离居民直呼“虚假宣传”!随时随地凉爽一“夏”!风扇界的宝藏~每个功能都实用到心坎里!注意:多伦多这份申报表月底截止,每个房主都必须填,轻则罚款61岁的关之琳,终于为自己的“豪门梦碎”付出了代价昆明长水国际机场遭大风袭击!“航站楼屋顶碎片漫天飞舞”,官方通报每小时$20.70!仅4个月,加州快餐店员工欲再次涨薪去年出货18亿颗,全球每辆新车均配20颗,迈来芯站上“芯”风口晚讯|药明康德拟派发现金股息每10股9.8336元、国产药出海成果丰硕,2024年以来长风药业、人福医药等多个产品获得FDA批准美国梦碎!华裔女子来美11年攒钱买房却面临牢狱之灾!“你们华人现在还能买房?美国梦碎!华裔女子来美11年,好不容易存够钱,却因买房面临牢狱之灾!“你们华人现在还能买房?
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。