Bendi新闻
>
CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

CMU&ETH实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

9月前

机器之心报道

机器之心编辑部

足式机器人领域又一次迎来创新!CMU 与 ETH Zurich 团队联合研发了一个名为 「敏捷但安全」(ABS,Agile But Safe)的新框架,为四足机器人在复杂环境中实现高速运动提供了解决方案。ABS 不仅在避免碰撞方面展现出高效能力,还在极速上达到了前所未有的 3.1 米秒!

在高速机器人运动领域,实现同时兼顾速度和安全一直是一大挑战。但现在,卡内基梅隆大学(CMU)和苏黎世联邦理工学院(ETH)的研究团队带来了突破性进展。他们开发的新型四足机器人算法,不仅能在复杂环境中高速行进,还能巧妙避开障碍,真正做到了「敏捷而安全」。



论文地址: https://arxiv.org/pdf/2401.17583.pdf


在 ABS 的加持下,机器狗在各种场景下都展现出了惊艳的高速避障能力:


障碍重重的狭窄走廊:



凌乱的室内场景:



无论是草地还是户外,静态或动态障碍,机器狗都从容应对:



遇见婴儿车,机器狗灵巧躲闪开:



警告牌、箱子、椅子也都不在话下:


对于突然出现的垫子和人脚,也能轻松绕过:



机器狗甚至还可以玩老鹰捉小鸡:



ABS 突破性技术:

RL+ Learning model-free Reach-Avoid value


ABS 采用了一种双策略(Dual Policy)设置,包括一个「敏捷策略」(Agile Policy)和一个「恢复策略」(Recovery Policy)。敏捷策略让机器人在障碍环境中快速移动,而一旦 Reach-Avoid Value Estimation 检测到潜在危险(比如突然出现的婴儿车),恢复策略就会介入,确保机器人安全。



创新点 1:怎么训练一个敏捷策略 Agile Policy?

敏捷策略的创新之处在于,与以往简单地追踪速度指令不同,它采用目标达成(position trakcing)的形式来最大化机器人的敏捷性。这一策略训练机器人发展出感知运动技能,以在没有碰撞的情况下达到指定目标。通过追求基座高速度的奖励条件,机器人自然学会在避免碰撞的同时实现最大敏捷性。这种方法克服了传统速度追踪(velocity tracking)策略在复杂环境中可能的保守限制,有效提高了机器人在障碍环境中的速度和安全性。Agile Policy 在实机测试中极速达到了 3.1m/s


创新点 2:学习 Policy-conditioned reach-avoid value

「达防」(Reach-Avoid, RA)值学习的创新之处在于,它采用了无模型的方式学习,与传统的基于模型的可达性分析方法不同,更适合无模型的强化学习策略。此方法不是学习全局 RA 值,而是使其依赖于特定策略,这样可以更好地预测敏捷策略的失败。通过简化的观测集,RA 值网络可以有效地概括并预测安全风险。RA 值被用于指导恢复策略,帮助机器人优化运动以避免碰撞,从而实现在保证安全的同时提高敏捷性的目标。

下图展示了针对特定障碍物集合学习到的 RA(达防)值。随着机器人速度的变化,RA 值的分布景观也相应变化。RA 值的符号合理地指示了敏捷策略的安全性。换句话说,这张图通过不同的 RA 值展示了机器人在不同速度下,面对特定障碍物时的安全风险程度。RA 值的高低变化反映了机器人在不同状态下执行敏捷策略时可能遇到的安全风险。



创新点 3:用 Reach-Avoid Value 和恢复策略来拯救机器人

恢复策略的创新之处在于,它能使四足机器人快速追踪线速度和角速度指令,作为一种备用保护策略。与敏捷策略不同,恢复策略的观测空间专注于追踪线速度和角速度命令,不需要外部感知信息。恢复策略的任务奖励专注于线性速度追踪、角速度追踪、保持存活和保持姿势,以便平滑切换回敏捷策略。这种策略的训练同样在仿真环境中进行,但有特定的域随机化和课程设置,以更好地适应可能触发恢复策略的状态。这种方法为四足机器人提供了在高速运动中快速应对潜在失败的能力。


下图展示了当恢复策略在两个特定情况(I 和 II)下被触发时,RA(达防)值景观的可视化展示。这些可视化展示是在 vx(沿 x 轴的速度)与 ωz(绕 z 轴的角速度)平面以及 vx 与 vy(沿 y 轴的速度)平面上进行的。图中显示了搜索前的初始旋转状态(即机器人基座当前的旋转状态)和通过搜索得到的命令。简单来说,这些图表展示了在特定条件下,通过恢复策略搜索得到的最佳运动指令,以及这些指令如何影响 RA 值,从而反映机器人在不同运动状态下的安全性。




鲁棒性测试

作者在「12kg 负载 / 篮球撞击 / 脚踢 / 雪地」的四个场景下测试了 ABS 框架的鲁棒性,机器狗都从容应对:


研究团队

这项研究是由 CMU 和 ETH 的研究团队共同完成。团队成员包括 Tairan He, Chong Zhang, Wenli Xiao, Guanqi He, Changliu Liu 和 Guanya Shi。他们的合作不仅在机器人技术领域取得了重大突破,更开启了四足机器人新的应用可能。这项技术的成功展示了四足机器人在高速移动和安全避障领域的巨大潜力。未来,这种高速且安全的四足机器人有望在搜救、探险甚至是家庭服务等多个领域发挥重要作用。

【关注机器之心视频号,第一时间看到有趣的AI内容】



© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

来源:机器之心

相关新闻

顶刊TPAMI 2024!多模态图像修复与融合新突破!DeepM2CDL:多种任务实现SOTA性能遭破门洗劫!西雅图房主安全感尽失:是外卖员踩点后与窃贼合作...拖欠税款超1300万元,知名品牌母公司被税务局“点名”!创始人曾立目标:一生要交满100亿元的税当你不小心习惯性回复...尴尬值拉满!NZ网友:像极了我出门在外的样子!27岁哈佛女学霸放弃百万年薪,一人一狗环游世界!网友:她满脸泥土,却美到发光伦敦市中心火光满天?!暴乱反转:英国超千人街头游行!突发!耐克股价大跌19%,市值蒸发超2000亿元!CEO:近期面临挑战;媒体:消费者对非必要支出更挑剔了OpenAI 官宣旗舰模型 GPT-4o,完全免费、无障碍与人交谈!奥特曼:这是我们最好的模型“停不下来”!老母亲一天花500多元,凌晨3点还在充值,女儿:太不合理!短剧爆火有人日薪过万,业内:成本飞涨,最大头是……2023直播电商年度盘点:低价、白牌与新战场!高性能碳纳米管纤维的未来:湿法纺丝技术的突破与机遇!︱NSR综述身高不仅影响颜值还影响你的寿命!研究表明:身高与死亡率的联系呈U型,男性身高174cm,女性身高158cm时全因死亡率最低睡眠竟然对人体免疫系统那么重要!最新研究发现:夜间休息与新靶点免疫的TIL细胞功不可没!美国GDP大利空!道指大跌超680点,科技巨头市值蒸发12000亿,拜登紧急回应“安抚”G3-G6超专业美术夏令营:艺术职业大体验!挖掘兴趣&天赋,超好玩,收获大!悲哀|活活拖死!加拿大26岁女留学生被告知生命只剩几周!母亲泪流满面:以为送到最安全国家活活拖死!加拿大26岁女留学生被告知生命只剩几周!母亲泪流满面:以为送到最安全国家RoboUniview :视觉语言大模型控制机器人新SOTA!突破机器人相机限制!腰斩再腰斩!疫苗龙头闪崩,股价自高点跌超76%!市值蒸发2800亿!股民:承受不住了,又踩雷...中国人超会吃:美味与营养兼得,汤汤水水更养人!冲冲冲!满减$100+送超1000刀礼!现在囤La Mer太值了!CVPR 2024 满分论文!LiSA:引入语义感知的激光雷达点云视觉定位网络汪小菲抛售与大S婚房,6600万豪宅内部无死角曝光!网友:很壕,满屋子都是她的痕迹.....睡眠与表型年龄呈“U形”关系,要睡在拐点处!最新研究:每天7小时睡眠是最佳“保养品”,过多/少的睡眠时间都会加速衰老
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。