欢迎来到人工智能民族主义的时代
《经济学人·商论》2024-01-19
Welcome to the era of AI nationalism
二〇二三年最热门的技术在年末的几周里热闹非凡。11月28日,阿布扎比推出了一家由政府支持的新人工智能公司AI71,致力于把阿联酋领先的“大语言模型”(LLM)Falcon商业化。12月11日,成立七个月的法国AI创业公司Mistral宣布了一轮4亿美元的大手笔融资,知情人士称这将使该公司估值超过20亿美元。四天后,印度新兴创业公司Krutrim发布了印度首个多语言LLM,而不过一周前,创立五个月的Sarvam才刚融资了4100万美元构建类似的印地语语言模型。
自从美国公司OpenAI在2022年11月推出了对话能力接近人类的ChatGPT以来,几乎每个月都会冒出一连串类似的新闻。在这一背景下,最近的这四个公告看似并无特别之处。但仔细观察,就会发现它们透露出某种更深层的动态。这三家公司正在以各自不同的方式竞逐AI国家冠军之位。AI71背后的政府机构、阿布扎比的先进技术研究委员会(Advanced Technology Research Council)的费萨尔·班奈(Faisal al-Bannai)表示:“我们希望AI71能在全球范围里与OpenAI这样的公司竞争。”法国总统马克龙最近喜不自胜地夸赞:“为Mistral喝彩,它是法国人天分的体现。”Krutrim的创始人巴维什·阿加瓦尔(Bhavish Aggarwal)宣称,ChatGPT和其他以英语为先的LLM“无法捕捉我们的文化、语言和精神”。Sarvam的联合创始人维韦克·拉加万(Vivek Raghavan)表示“我们是在建立一家印度公司”,因此Sarvam从印地语开始。
AI已经是美国和中国日益激烈的科技竞争的核心。在过去一年中,两国政府都承诺了四五百亿美元的AI投资。其他国家不想落后或受制于一项由他国掌控的关键技术。2023年,世界上另外六个在AI上格外有抱负的政府——英国、法国、德国、印度、沙特阿拉伯和阿联酋——承诺将总共投入约400亿美元用于支持AI(见图表)。其中大部分资金将用于购买图形处理单元(GPU,用于训练AI模型的芯片)和制造此类芯片的工厂,还有较少部分用来支持AI公司。意欲成为AI超级大国的国家在政府参与的性质和程度上各不相同。现在一切还只是个开始,但新的AI产业联合体的轮廓正在浮现。……
📚衍生阅读 | 人工智能带来的希望与危险
自创造ChatGPT的公司OpenAI在2022年11月首次向公众开放聊天机器人以来,技术精英们几乎没有其他想聊的话了。GPT-4是ChatGPT背后的人工神经网络,在美国的法律和医学执照考试中取得了优异的成绩。伴随这种兴奋而来的是科技行业内外的深切担忧:生成式AI模型的开发速度过快了。GPT-4是一种称为大型语言模型(LLM)的生成式AI。Alphabet、亚马逊和英伟达等科技巨头都训练了自己的LLM,把它们命名为PaLM、Megatron、Titan和Chinchilla等。
那位伦敦科技公司的老板表示,即使他也在追求运用AI,他也“对AI带来的生存威胁感到难以置信的紧张”,并且“每天都在与[其他]创始人谈论它”。美国、欧洲和中国的政府都开始考虑制定新的法规。一些知名人士呼吁暂停AI的发展,以免软件以某种方式失控并损害甚至摧毁人类社会。若你想把对这项技术的担忧或兴奋调整到恰当的程度,不妨首先了解它是怎么来的、它的工作原理,以及它发展的局限性。
虽然可以写下它们如何工作的规则,但LLM的输出并不完全可预测;事实证明,这些极大的算盘可以做较小的算盘做不到的事情,甚至让制造它们的人大吃一惊。OpenAI的研究员已经在各种不同的LLM中统计到了137种所谓的“涌现”能力。涌现的能力并非魔法——它们都以某种形式体现在LLM的训练数据中,但直到LLM的规模超过某个非常大的阈值时才会变得明显。在某个规模下,LLM用德语写出性别包容的句子的水平和随机写的差不多。然而,把模型稍微再扩大一点,突然间它就显现了一种新的能力。... ...
微信扫码关注该文公众号作者