Bendi新闻
>
DeepMind首发游戏AI智能体SIMA!只用自然语言就能玩转「山羊模拟器」

DeepMind首发游戏AI智能体SIMA!只用自然语言就能玩转「山羊模拟器」

7月前



  新智元报道  

编辑:Mindy
【新智元导读】AI在学会工作之后,终于也能和人一样玩游戏了!DeepMind的SIMA是一个可以感知和理解各种环境的AI代理,能够在多种视频游戏设置中执行任务,未来甚至可能可以与任何虚拟环境进行互动。

谷歌DeepMind在AI和游戏方面有着悠久的历史。
从过去与Atari游戏的密切合作开始,然后发展到AlphaStar系统可以在《星际争霸II》中达到人类大师级水平,到如今,DeepMind从单个游戏转向了通用的、可指导的游戏AI代理。
SIMA,是一个可扩展的、能听从指导的多世界AI代理,这是一个用于3D虚拟环境的通用AI代理。

技术报告:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/sima-generalist-ai-agent-for-3d-virtual-environments/Scaling%20Instructable%20Agents%20Across%20Many%20Simulated%20Worlds.pdf

想象一下,它完全不需要游戏源代码,也不需要什么特殊的API接口。它只需要两个简单的输入:屏幕上的图像和用户口头提供的简单自然语言指令。然后,SIMA就会像魔术师一样,通过键盘和鼠标控制游戏角色执行这些指令。
这种简单直接的界面,就像是我们人类自己所用的方式,这是一个AI代理首次展示出它能够理解广泛的游戏世界的能力,同时可以按照自然语言的指令在其中执行任务,就像人类一样。

SIMA从视频游戏中学习


SIMA由预先训练好的视觉模型和一个主模型组成,主模型包括一个存储器,可输出键盘和鼠标操作。
它在九款不同的视频游戏上对SIMA进行了训练和测试,例如Hello Games的《无人深空》和Tuxedo Labs的《拆解》。
每款游戏都为SIMA打开了一个新的交互世界,从简单的导航和菜单使用,到挖掘资源、驾驶飞船或制作头盔等一系列技能。
DeepMind团队还使用了四个研究环境,其中包括Unity构建的名为“建造实验室”的新环境。在这个环境中,SIMA需要用建筑块建造雕塑,从而测试其对物体操纵和对物理世界的直观理解能力。
通过从不同游戏世界中学习,SIMA捕捉了语言与游戏行为之间的关系。
例如,它会观察人类玩家的操作,并记录下导致这些游戏行为的指令。这样的训练使得SIMA能够逐渐理解游戏世界中的语言和行为之间的联系。

SIMA的诞生意味着什么


SIMA的诞生并不是为了取得高游戏得分。
对于AI系统来说,即使是学会玩一个视频游戏也是一项技术壮举,但学会在各种游戏设置中遵循指令,可能会为适应任何环境提供更多帮助。
SIMA已经评估了600种基本技能,涵盖了导航、物体交互和菜单使用。它已经可以执行在10秒中内完成的简单任务。
DeepMind希望未来代理能够处理那些需要高级战略规划和多个子任务才能完成的任务,例如“寻找资源并建造营地”。
这对于AI来说是一个重要的目标,因为虽然大型语言模型已经催生了可以捕捉关于世界知识并生成计划的强大系统,但它们目前还缺乏代表人类采取行动的能力。
Jim Fan也对SIMA表达了期许的态度,他补充道,他对于SIMA喜欢的地方包括:

- 这是第一个通过鼠标或键盘进行操作的代理,不需要用语言进行调整

- 适应多种环境,涵盖游戏和3D模拟器

- 拥有强大的数据管道,招募人类玩家以记录行为,以及用语言进行注释

但他也同时指出了一些不足之处,包括环境数量有限;行动时长非常短,只有约10秒;数据管道不够有扩展性等。

跨游戏的泛化和未来

在DeepMind的评估中,SIMA在一组九款3D游戏中表现明显优于仅在每个单独游戏上进行训练的所有专门代理。
更重要的是,SIMA在未见过的游戏上的表现与专门为其进行训练的其他代理相比,平均表现几乎相同。
这种在全新环境中运作的能力突显了SIMA在训练之外的泛化能力。
这是一个令人鼓舞的初步成果,但需要进一步的研究才能让SIMA在已知和未知的游戏中达到与人类相媲美的水平。
结果还表明,SIMA的表现依赖于语言。
在一项控制实验中,当代理没有接受任何语言培训或指令时,它的行为虽然符合逻辑,但缺乏目标性。例如,代理可能会执行一些常见的操作,如收集资源,而不是按照预先指定的路径行动。
SIMA的结果展现的是新的泛化的、由语言驱动的AI代理的潜力。
AI代理的完成态,是达到更加通用、能够帮助虚拟世界和现实世界的人们,理解并安全地执行各种任务。
SIMA只是刚刚开始,我们可以期待在更多的训练环境中继续建立SIMA,并整合更有能力的模型,让它变得更具泛化性和多功能性,而不仅仅局限于游戏。
参考资料:
https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/




微信扫码关注该文公众号作者

来源:新智元

相关新闻

Open AI 八年前的设想被谷歌突破啦!DeepMind官宣SIMA,动动嘴就能完成复杂游戏任务重磅!澳洲计划推行“先租后买”购房新模式!租金就能当首付!五年内可随时转手!限时99元/2支!!世界500强首款「AI智能」电动牙刷,高效清洁口腔…东方甄选同款!榜单首发!高通8295「开启」高阶AI智舱时代,谁是域控领跑者“别肝论文了!用好AI,20分钟就能完成!”与同行聊天记录曝光后,网友都看傻了!$17万就能起死回生!澳洲出现首例“冷冻人”!冰封-200°C下休眠,等待复活!方便华裔老人就医!华裔高中生开发AI人工智能「洪医生打招呼」热线年轻人的第1台“AI手机”,一加 Ace 3V首发评测!不只「卷」算力!舱驾融合+AI赋能,智能座舱4.0时代来了全球首发!50家「真•具身智能」公司,机器人的ChatGPT时刻来临?|硅兔活动大模型学会写万字长文,AI企业「波形智能」完成千万元Pre-A轮融资|36氪首发AI数据服务公司「整数智能」完成数千万元A轮融资,业务拓展至全球范围|36氪首发不到21元就能使用英伟达H100一小时!硅谷公司SF Compute发力“共享AI算力”“住房担保计划”5万新名额开放!最低仅需2%首付就能买房,还能省下$2万保险,专家建议澳人“速冲”全美首个?加州新规:新车必须加装“限速器”,超速10迈就响警报!首付$1万就能买房!澳洲购房政策重大调整,维州率先实施!澳人“压力山大”,处境艰难,总理回应:“我感同身受”基于AI打造潮玩服饰,「TOP FAVOR」完成第四轮融资|36氪首发奇葩!继设立“合法吸毒室”后,旧金山又给“瘾君子”发钱,每周$100,只要不吸毒就能领钱纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画全绿了!可以冲!高铁2h,就能到达的浓缩小内蒙!坐拥“国内最美草原公路”,美到爆炸却少有人知可以这样玩!“普高转Alevel,只用6个月,我就被UCL录取了!”AI在用 | AI模拟器《换你来当爹》上线,「马斯克」10岁就被我练废“能看到脸的都能换”,有人换暗恋女生的脸……他AI换脸制作淫秽视频,获刑7年多!技术人员建议:隐私不要随意发腰突不用手术切除了,一束激光就能“修复”!
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。