机器人竟然自己在玩“我的世界”游戏

AI 研究人员已经构建了一个 Minecraft 机器人,可以在游戏的开放世界中探索和扩展其能力——但与其他机器人不同的是,这个机器人基本上是通过反复试验和大量 GPT-4 查询来编写自己的代码。

这个名为 Voyager 的实验系统是“具身代理”的一个例子,它是一种可以在模拟或真实环境中自由、有目的地移动和行动的人工智能。个人助理类 AI 和聊天机器人不必实际做某事,更不用说在复杂的世界中导航来完成这些事情了。但这正是家用机器人在未来可能要做的事情,因此有很多关于它们如何做到这一点的研究。

Minecraft 是测试此类事物的好地方,因为它非常非常近似地代表了现实世界,具有简单明了的规则和物理原理,但它也足够复杂和开放,有很多可以完成或尝试的地方。专用模拟器也很棒,但它们有其自身的局限性。

MineDojo是一个围绕 Minecraft 构建的模拟框架,因为您不能随便在其中插入一个随机 AI 并期望它了解所有这些积木和猪在做什么。它的创建者(与 Voyager 团队有很多重叠)将有关游戏的 YouTube 视频、成绩单、维基文章和来自 r/minecraft 的大量 Reddit 帖子以及其他数据放在一起,以便用户可以创建或微调 AI以他们为榜样。它还可以让这些模型或多或少地得到客观的评估,通过观察它们在诸如围绕美洲驼建造围栏或寻找并开采钻石等方面的表现如何。

Voyager擅长这些任务,比唯一接近的其他模型 Auto-GPT 表现得更好。但他们有类似的方法:使用 GPT-4 编写自己的代码。

通常情况下,您只需使用所有好的 Minecraft 数据训练一个模型,并希望它能弄清楚如何在太阳下山时与骷髅战斗。然而,Voyager 开始时相对幼稚,当它在游戏中遇到问题时,它会与 GPT-4 进行一些内部对话,讨论它应该做什么以及如何做。

例如,夜幕降临,那些骷髅就出来了。智能体对此有一个大致的了解,但它会问自己,当附近有怪物时,这个游戏的好玩家会怎么做?好吧,GPT-4 说,如果你想安全地探索这个世界,你会想要制造并装备一把剑,然后用它敲打骷髅,同时避免被击中。对做什么的一般认识转化为具体目标:收集石头和木头,在工艺台上打造一把剑,装备它,然后与骷髅战斗。

做完这些,就进入了通用技能库,这样以后任务“深入山洞找铁矿石”时,就不用再从头学打架了。它仍然使用 GPT,但它使用更便宜、更快的 GPT-3.5,GPT-3.5 告诉它与给定情况最相关的技能——因此它不会尝试挖掘骨架和矿石。

它类似于像 Auto-GPT 这样的代理,当面对它还不知道的界面时,它必须自学以导航它以实现其目标。但是 Minecraft 的环境比它用来求解的要深得多,所以像 Voyager 这样的专业代理做得更好。与其他机器人相比,它可以找到更多东西、学习更多技能并探索更大的领域。

有趣但也许并不令人惊讶,在生成有用代码方面,GPT-4 与 GPT-3.5(即 GPT)擦肩而过。一项用后者替换前者的测试让代理人很早就碰壁了,甚至可能真的碰壁了,而且未能改进。与这两个模型交谈可能并不明显,一个更聪明,但事实是你不必特别聪明就可以进行看似聪明的对话(问我我怎么知道的)。编码要困难得多,GPT-4 是一个很大的更新。

这项研究的目的不是让 Minecraft 玩家过时,而是找到相对简单的 AI 模型可以根据他们的“经验”改进自己的方法,因为没有更好的词了。如果我们要让机器人在家里、医院和办公室帮助我们,它们就需要学习并将这些经验应用到未来的行动中。

展开阅读全文

页面更新:2024-04-21

标签:机器人   世界   骷髅   模型   聪明   技能   事情   目标   装备   代码   游戏

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top