微软Xbox把《我的世界》变AI的世界,游戏Agent协作框架来了

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

微软研究院及Xbox团队、斯坦福、UCLA、清华、北大都参与的一项研究。

提出多智能体框架MindAgent,利用大模型给游戏NPC规划和协作的能力。

用在现成游戏中,我的世界里NPC“活”了,变成我的AI世界

也开发了新游戏作为测试基准,玩法类似分手厨房,但你玩得不好AI也不会和你分手。

我的AI世界,甚至支持VR

简单来说,MindAgent框架给了游戏NPC规划复杂任务的能力,以及相互协作、与人类玩家协作。

在我的世界中,首先测试了多智能体协作能力,任务是完成不同类型肉食的烹饪。

可以看到左图中Alex和Steve分别狩猎不同动物,右图是两个NPC狩猎完成后一起在炉子旁煮肉。

人机协作中,人类玩家可以通过语音聊天向NPC实时表达自己的意图和期望的目标。

甚至支持VR模式,将玩家与NPC的交互体验提升到一个新的水平。

在我的世界测试中,新任务生成间隔(T值)越大、规划难度越小,GPT-4在简单到中等(T3-T5)任务中表现不错,高难任务中表现有明显下降。

CoS指标衡量多智能体协作的效率,GPT-4在不同难度任务下平均完成了58%的任务。

分手厨房,没朋友也能玩了

研究还设计了测试基准CuisineWorld。

规则类似著名联机游戏《胡闹厨房》,2-4位玩家需要在限制时间内分工配合完成各种菜品的制作并送达顾客手中。

(因为玩家之间配合不好容易“友尽”,在玩家群体中被戏称为分手厨房。)

与我的世界一样,CuisineWorld同样支持智能体间协作,人机协作,以及VR交互。

由于专为智能体协作打造,在CuisineWorld上可以方便完成更多测试。

这回GPT-4、ChatGPT(gpt-3.5-turbo0613)、Claude-2和Llama2 70b都参与进来。

结果GPT-4只控制两个智能体就能完成68%的任务,Claude-2能完成31%,Llama2和ChatGPT则根本不会玩。

另外3个GPT-4就已经能完成80%的任务,再加到4个效果已经不明显,Claude-2增加智能体数量还有进步空间。

MindAgent框架,让大模型学会规划

那么大模型到底怎么学会玩游戏的呢?

也就是靠研究中提出的MindAgent框架了,主要由提示、当前状态和记忆三个组件组成。

提示组件中包含菜谱、一般说明、推理知识和单样本演示。

当前状态组件提供对环境的观察快照,包括智能体的位置、持有的物品、环境中可使用的工具等信息,还包括违反规则时会被触发的反馈。

记忆组件记录了每个时间步骤的环境状态和智能体状态。

利用这些组件,大模型会先输出对任务规划的文本描述,接下来还有两个关键步骤:

动作提取,用正则表达式提取输出文本中的动作,这一步是必不可少的,因为输出文本黄总可能包含大模型思维过程,甚至是察觉到失误而道歉的信息。

动作验证,评估每个动作的可行性,如果发现无法执行则返回错误消息。

最终,团队在实验中得到如下发现:

另外,论文附录上还给出了系统提示词示例,如果想让AI学会玩你喜欢的游戏,可以参考一下。

论文地址:
https://www.microsoft.com/en-us/research/publication/mindagent-emergent-gaming-interaction/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

展开阅读全文

页面更新:2024-03-20

标签:框架   体协   世界   微软   游戏   人机   组件   模型   动作   玩家   智能

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top