Bendi新闻
>
2021 年,马斯克杀死了波士顿动力

2021 年,马斯克杀死了波士顿动力

7月前

作者:叶子凌 文章来自:远川科技评论
2021 年的特斯拉 AI Day,特斯拉 PPT 首发了人形机器人 Tesla Bot 的概念机设计方案。按照马斯克画的大饼,Tesla Bot 可以完全代替人类「从事重复性/无聊的工作」。

也许是担心在场观众干看 PPT 无聊,马斯克请来了一位身着紧身衣的皮套人,模仿 Tesla Bot 尬舞了一段。

AI Day 结束,科技媒体 The Verge 表示,马斯克的 Tesla Bot 就是个笑话。文章还援引中央兰开夏大学机器人工程教授 Carl Berry 的评价:说它是马粪都算抬举它了(horse shit sounds generous, frankly)。

Carl Berry 还专门搬出机器人领域的网红公司波士顿动力,认为后者正在踏踏实实的做事,而特斯拉在加深公众对机器人不切实际的幻想。

今年 4 月,特斯拉的皮套人尬舞再度被拉出来鞭尸。在波士顿动力展示新款机器人的视频中,机器人以一种灵活到有些诡异的方式从地上站起来。

波士顿动力也在推特上阴阳怪气了一句:「我们保证这不是一个穿着紧身衣的人。」

事情的起因是,波士顿动力宣布11岁「高龄」的人形机器人 Atlas 正式退休——Atlas 算得上是初代机器人网红,它被波士顿动力员工一棍子撂倒,接着踉踉跄跄爬起来的视频,一度引发了「停止霸凌机器人」的后现代哲学思考。

结果 Atlas 领退休金的第一天,「焕新版」Atlas 正式出道。最大的变化是,波士顿动力抛弃了原有的液压结构,改为电机驱动。

目前,「焕新版」Atlas 的宣传片已经在 YouTube 上收获了 500 多万播放量。


相比 Atlas 熟悉的后空翻大劈叉,相较之下,去年年底的第二代 Tesla Bot 才刚学会缓慢行走和 90 度深蹲。

加上马斯克近几年大饼画的太多,也不难理解 The Verge 会提出「机器人为什么要像人」的质疑。

然而,可能恰恰是 2021 年 PPT 上的 Tesla Bot 和滑稽的皮套人尬舞,决定了波士顿动力的命运。

Google 发现了什么?

相比荒诞开场的 Tesla Bot,波士顿动力这家公司是机器人领域根正苗红的祖师爷。

波士顿动力成立于 1992 年,前身是麻省理工学院的腿部实验室,长期致力于有腿机器人的研究。

2012 年,DARPA(美国国防高级研究计划局)为了推动机器人研究,资助了一场机器人挑战赛,波士顿动力由此进入美国军方的视野。

DARPA 是五角大楼旗下的研究机构,和 NASA 一起诞生于美苏争霸的白热化时期,目的是借助国家意志确保美国在高科技领域的领先。只不过 NASA 负责地球以外,DARPA 负责地球以内。过去几十年间,DARPA 直接或间接的推动了 GPS、互联网等技术的诞生。

2012 年,正值 DARPA 在机器人、自动驾驶等领域大力投资,为了降低参赛门槛,DARPA 希望能有一款标准化的人形机器人,供参赛团队编程。

在这之前,波士顿动力已经为 DARPA 开发了多款产品,比如外型神似野猪的 LS3,能够穿梭于各种极端战场环境,快速运送物资。

波士顿动力 LS3

2013 年 7 月,在 DARPA 的资助下,波士顿动力打造出了身高 1.88 米,重达 150 千克的初代 Atlas。这个新闻很快传到了 Google 的耳朵里,波士顿动力的命运随之改变。

当时,Google 正在秘密筹备一个代号为「Replicant(复制人)」的机器人项目,由「Android 之父」安迪·鲁宾亲自带队。按照鲁宾的设想,Google  将打造一个编程平台,从而推动机器人普及,最终在机器人身上复刻安卓系统的成功。

为了这个庞大计划,Google  疯狂扫货,一口气收购了九家机器人初创公司,Atlas 问世不到半年,波士顿动力就被 Google 收入囊中。此后,Atlas 的迭代速度也坐上了火箭。

2016 年,波士顿动力毫无征兆的发布了一则新款 Atlas 的演示视频,视频中 Atlas 熟练的行走跳跃,尤其是被推倒在地后,仍能自主起身继续完成工作,整个过程栩栩如生,带给公众的震撼不亚于 2022 年底 ChatGPT 的问世。

目前,这条视频的 Youtube 播放量已经积累到了 4059 万。2017 年,Atlas 再接再厉,用一个精彩的后空翻再度把波士顿动力送上全球热搜。

Atlas 表演后空翻,2017 年

然而,就在波士顿动力风头正盛的 2017 年,投资了五年之久的 Google 却将其甩卖。按照彭博的说法,Google 管理层的核心分歧在于商业化。

波士顿动力希望埋头研究,但 Google 希望尽快打造能商业化的产品:「我们不可能用 30% 的资源去投入一个需要 10 年以上的项目[4]。」

在彭博的报道中,丰田和亚马逊都是潜在的买家,但波士顿动力最终被卖给了软银,2020 年又被卖给了韩国现代。

Google 内部,安迪·鲁宾因性丑闻被扫地出门,Replicant 项目也草草收场,划上一个满是遗憾的句号。

一家明星公司在当打之年被潦草脱手,Google 内部真实的决策过程难以知晓。但在这个过程中起到决定性作用的,很可能是 2017 年发生在 Google 内部的另一件事。

我来组成头部

2017 年 6 月,Google 的 8 位AI科学家联名发表了一篇名为《Attention Is All You Need》的论文。这是继 2012 年 AlexNet 勇夺 ImageNet 挑战赛冠军之后,人工智能发展史上的又一个里程碑事件。

Google 的科学家在论文里提出了一种「注意力机制」,并基于此开发一个名叫 Transformer(变形金刚)的深度学习模型,解决了传统 RNN 模型的一系列问题。

2020 年,Google 又提出了 Vision Transformer ( ViT )概念,赋予了 Transformer 处理图像的能力。

随着 Transformer 一口气解决了众多缺陷,它渐渐发展成了 AGI 领域的唯一解。

2012 年的 AlexNet 让 AI 有了「感知」的能力,而 Transformer 和之后的大模型让 AI 有了「生成」的能力。换句话说,2012 年的 AI 可以识别出各种各样的猫,2017 年之后的 AI 已经可以自己生成猫的图片了。

因此,Transformer 的推出直接开启了今天的大模型时代,2018 年 6 月,OpenAI推出了基于Transformer模型的GPT-1,GPT里的「T」,就是 Transformer 的首字母。此后,OpenAI 沿着这条路线持续迭代,并基于 GPT 模型开发了 ChatGPT。

在大模型百花齐放的同时,Transformer 也为人形机器人的进步打开了一扇窗户。

传统机器人大多基于特定的规划执行特定的操作,比如运输、分拣,不具备感知和决策能力。人形机器人不仅能与物理世界交互,还有感知和理解能力。

举一个不太恰当但好理解的例子:送餐机器人执行「把外卖送到 1203 号房」这个任务时,并不理解什么是「外卖」和「1203 号房」,只是根据软件系统既定的指令和路线规划完成任务。

但人形机器人可以借由智能化,理解物理世界各种物体、语言和文字的含义,并自主规划和决策。也就是说,机器人可以不依赖预先的编程,就能完成诸如「关掉最上层抽屉」等较为模糊的指令。

波士顿动力的问题在于,无论Atlas的机械与动力结构多么优秀,都无法解决「穷举法」的问题。

Atlas 的软件原理是通过摄像头与传感器输入外界环境数据,再根据提前创建的行为库,执行对应的动作。在其官方的文档里,波士顿动力坦诚了这么做的弊端:

「如果盒子向一侧移动了 0.5 米,那么 Atlas 会找到并完成跳跃;如果盒子移动得太远,那么系统将停止。」

由于 Atlas 的所有动作都依赖提前设计的模版,那么真实环境的一点点变化,都可能让机器人无所适从。这也是为什么传统机器人只被用于环境、路线和职能极度固定的工厂、酒店送餐等场景。

而 Transformer 带来的思路是,只要让机器学习足够多的数据,就能拥有类人的智能,可以脱离预设的规划进行自主决策。

去年 7 月《纽约时报》探班 Google 实验室, 完整记录了基于 RT-2 模型的机器人智能闪现的瞬间:

桌子上放着一堆塑料玩具,工程师让单臂机器人「捡起灭绝的动物」,机器人拿起了恐龙。 

这意味着机器人不仅能识别三种动物,也能理解「灭绝的动物」的含义,还可以完成具体的操作。

Google RT-2

Transformer 的出现彻底改变了机器人的技术路径,在感知-决策-执行的完整链条中,核心能力不再是驱动机器人后空翻大劈叉的机械结构,而是组成机器人大脑的软件算法。

人工智能的进步在各行各业上演着软件对硬件的夺权,机器人只是其中之一。 

另一个正在由软件定义的行业是自动驾驶,这也是为什么马斯克会说:当你能解决自动驾驶,你就能解决现实世界中的人工智能。

特斯拉的三张牌

特斯拉在 AI 世界的出场,常常呈现某种荒诞不经的色彩。

2022 年特斯拉备受期待的 Tesla Bot 第一次「真人」亮相,居然要依靠三名壮汉搀扶。两个月后 ChatGPT 横空出世,Tesla Bot 成了一块无人问津的背景板。

然而,特斯拉在机器人领域的积累,可能比任何一家公司都要深厚。

自动驾驶本质上是机器人的一个「前置产业」,两者的核心都是基于人工智能,实现感知-决策-执行的完整链条。

这就意味着无论是软件层面的算法,还是硬件层面的视觉传感器、FSD 芯片等零部件,理论上都可以用于人形机器人。

特斯拉也的确是这么做的:Tesla Bot 共配置有 3 颗摄像头,左右眼各一个,外加一颗鱼眼广角。芯片是和特斯拉电动车一模一样的 FSD 自动驾驶芯片。软件上,Tesla Bot 也承袭了自动驾驶的技术方案。

2023 年特斯拉股东大会,马斯克也确认了这一点:特斯拉已经打通了自动驾驶芯片 FSD 和机器人的底层模块,实现了一定程度的算法复用。

任何人工智能的发展都需要算法、算力、数据三驾马车来拉动,算法决定了计算机用什么方式识别事物;但算法又需要足够大的算力来驱动;同时,算法的提升又需要大规模高质量的数据;三者相辅相成,缺一不可。

算法和算力层面,特斯拉已经借助电动车业务,完成了从云端(D1)到终端(FSD),核心软硬件的自研。

数据层面,2022 年的 AI Day上,特斯拉宣称已经存储的有价值训练数据集有 23.2 万帧,验证数据集 0.38 万帧。上百万车主正在源源不断的为算法训练贡献着数据。

马斯克本人在 AI 领域的涉足也常被忽略,他是 OpenAI 的创始人之一,也是 DeepMind 的早期投资人。他参与的人工智能公司还有脑机芯片 Neuralink、聊天机器人Grok。特斯拉每天接受并处理的视频画面超过 1600 亿帧,这很可能是商业公司能拥有的最大的真实世界数据集。

波士顿动力很可能意识到了这个问题,但「焕新版」Atlas 最大的改变,是从液压改为全电动,最大的好处可能是降低成本。

在一次采访中,创始人 Marc Raibert 曾表示 Atlas 在一定程度上激励了马斯克制造 Tesla Bot 的想法。但在人工智能残酷的竞争中,波士顿动力已经落后太多。

波士顿动力的问题在于,他们用了 20 年的时间试图教会机器人如何「运动」,但实际上,机器人应该先学会「思考」。

或许在不久的将来,判断机器人的智能化程度,可能不是看它会不会后空翻大劈叉,而是能不能从九张图片中选出包含红绿灯或摩托车的图片,或者滑动滑块使图片位于正确的角度。





微信扫码关注该文公众号作者

来源:APPSO

相关新闻

2021年,马斯克杀死了波士顿动力波士顿动力创始人:我绝不会低估马斯克|中企荐读波士顿动力8年3次易主,现在怎么样了?波士顿动力8年3次易主,炫酷但不赚钱|亮马桥小纪严选波士顿动力机器人复活,180度诡异动作吓坏马斯克你好,电动Atlas!波士顿动力机器人复活,180度诡异动作吓坏马斯克波士顿动力发布新款人形机器人,动作酷似《午夜凶铃》吓坏马斯克 | Hunt Good 周报波士顿动力8年3次易主,论技术还是“你大爷”徒手搬螺丝,波士顿动力Atlas再进化:兄弟们,准备进厂了波士顿动力技术揭秘:后空翻、俯卧撑与翻车,6年经验、教训总结终于抓到了!凯辛娜公园强奸少女嫌犯落网 !他是厄瓜多尔人,2021年抵达纽约!波士顿动力、特斯拉,你们的劲敌终究还是来了波士顿动力Atlas,再见!退役视频引数十万观众泪目,液压退出历史舞台|亮马桥小纪严选宇宙人(1438期)海南莫斯科动力大学在文昌举行奠基仪式;天鹅座货运飞船首次使用猎鹰9号发射;马斯克近4000亿天价薪酬被判无效OpenAI发布GPT-4o模型卡:概述AI安全和风险缓解措施;波士顿动力人形机器人又整新活,一口气做8个俯卧撑丨AIGC日报波士顿动力人形机器人大秀俯卧撑,一口气8个!转型后首次曝光成果美国7月失业率创2021年10月以来新高|首席资讯日报成功案例 | 2021年EB5短暂50万窗口期递件客户的I-526获批当长江电力估值超越茅台:周期股大抱团,像极了2021年2021年失踪的纽约女孩在康涅狄格州被找到高盛“改口”:尽管长期乐观,短期对铜谨慎,小心2021年二季度重演美股“散户的王”回归!连续两日暴涨,一切犹如2021年重演劳动节仅仅两天,美国边境巡逻队遭遇数百名中国“走线”大军,人数比2021年激增630倍!为什么这轮牛市无法复制 2021 年的山寨季?
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。