Bendi新闻
>
具身智能体三维感知新链条,TeleAI &上海AI Lab提出多视角融合具身模型「SAM-E」
具身智能体三维感知新链条,TeleAI &上海AI Lab提出多视角融合具身模型「SAM-E」
7月前
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]
论文名称:SAM-E: Leveraging Visual Foundation Model with Sequence Imitation for Embodied Manipulation 论文链接: https://sam-embodied.github.io/static/SAM-E.pdf 项目地址: https://sam-embodied.github.io/
利用SAM的提示驱动结构,构建了一个强大的基座模型,在任务语言指令下拥有出色的泛化性能。通过LoRA微调技术,将模型适配到具身任务中,进一步提升了其性能。 采用时序动作建模技术,捕捉动作序列中的时序信息,更好地理解任务的动态变化,并及时调整机器人的策略和执行方式,使机器人保持较高的执行效率。
在具身场景中任务「提示」以自然语言的形式呈现,作为任务描述指令,视觉编码器发挥其可提示的感知能力,提取与任务相关的特征。策略网络则充当解码器的角色,基于融合的视觉嵌入和语言指令输出动作。
在训练阶段,SAM-E 使用 LoRA 进行高效微调,大大减少了训练参数,使视觉基础模型能够快速适应于具身任务。
在多任务场景下,SAM-E模型显著提高了任务成功率。 在面对少量样本迁移至新任务的情况下,SAM-E凭借强大的泛化性能和高效的执行效率,有效提升新任务的表现。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
来源:机器之心
相关新闻
AI应用、具身智能、大模型......「AI Partner氪话未来直播间」究竟聊了啥?具身智能赋能机器人,「AI+人形机器人」论坛在浦东新区成功举行半年冒出近百家新公司,「具身智能」也有春天|36氪新风向3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑一文深度解析「具身智能」百人图谱,科技巨头的AI人才之战ADL152「具身智能」开启报名ICRA 2024:「具身智能」热度飙升,「学习」成机器人行业共识博士申请 | 清华大学交叉信息院MARS Lab招收具身智能/多模态方向博士生全球首发!50家「真•具身智能」公司,机器人的ChatGPT时刻来临?|硅兔活动「懂物理」是具身智能核心!北大高逼真物理仿真,加持磁性微米级机器人登Nature子刊哈工深聂礼强:多模态大模型是具身智能发展的关键动力丨具身智能十人谈Agent触摸汉堡辨冷热,首次拥有类人感官!UCLA等发布3D多模态交互具身智能大模型银河通用王鹤:让具身智能机器人“言出法随”,需攻克两大局限性丨GenAICon 2024戴盟机器人王煜:「具身技能」才能发挥人形机器人的作用 | 具身智能十人谈上海内推 | 上海人工智能实验室招聘多模态与具身智能方向算法实习生英伟达 Jim Fan:具身智能的难点不是硬件,而是「Foundation Agent」ICML 2024 | 清华提出DecisionNCE,用多模态表征预训练加速具身智能大模型公司被曝卖身!多家美国AI创企裁员20%,明星独角兽急寻“救命钱”WAIC2024三大趋势盘点:智能体、具身智能、算力风暴|亮马桥小纪严选从WAIC2024看人工智能三大趋势:智能体、具身智能、算力风暴大模型与具身智能的火花,ICML 2024 MFM-EAI Workshop征稿和挑战赛启动大模型助力具身智能、电池研发与蛋白质研究,讯飞、深势科技、字节专家齐聚分享|AIConEmbodiedGPT一作穆尧:具身智能大模型与通用机器人系统 | GenAICon 2024PRO | Agent 爆火之后,具身智能才是 AI 下一站?