人工智能产生自我意识,劳拉的“古墓丽影”苏醒电子游戏革命来了

人工智能产生自我意识,“古墓丽影”劳拉醒了!视频游戏革命已经到来



新智元报告

编辑:埃涅阿斯桃子

【新智元的指导】

国外一位高手利用ChatGPT向AI代理灌输自我意识。孕育“生命”的劳拉苏醒开始独自冲破壁垒《古墓丽影》。

如果角色兴奋的话,电子游戏会是什么样子?

过去,这是很多人的幻想,但现在,随着人工智能代理的发展,这种幻想正在成为现实。

最近,YouTuberDarwinTrump制作了一段关于经典游戏《古墓丽影》的原创视频。

其中,女主角劳拉其实是一个可以亲自控制角色的人工智能特工!



可以说,借助机器视觉、定位、物体识别、动画、文字和语音等各种人工智能工具,Foxmaster为角色的表演注入了数字生命。

那么,也许这就是视频游戏的未来?

《古墓丽影》女主角记得

构建具有游戏能力的虚拟人工智能的概念很普遍。但Formaster只是想让这个角色看起来像一个真人。

所以他选择了《古墓丽影》游戏,其中劳拉是明显的角色。

而Formaste希望这种性格能够影响到比赛的最终结果。



这个AI特工劳拉·克劳福德到底是怎么认识游戏里的?

Formaster在探索了下一步之后终于成功了。

他们学习游戏规则

第一步是要求他们学习游戏规则。《古墓丽影》是一个讲解游戏整个控制流程的教程。

作者要求劳拉以特定的方式进行练习,像人类玩家一样完成教程的每个阶段。

当劳拉离开泳池时,教程结束,因此可以在那时重新启动程序以进行改进。

一开始,治愈劳拉是非常困难的。

有时他看起来很困惑,在地图上随意走动,有时他会卡在菜单栏中并一直看着指南针。



为了解决这个问题,作者调整了虚拟机的主时钟,使游戏进程加快了40倍。这种方法奏效了,AI代理最终在相对较好的时间内完成了教程。

然而,有一个问题:劳拉经常卡在一个地方,而且每条赛道都由静态元素组成,因此只有一条优化路径。这让他知道不应该走哪条路,而不是想出完全不同的方法来解决问题。但作者希望劳拉学会寻找自己的冒险经历。



鉴于劳拉唯一的知识是每个级别屏幕上显示的内容,作者观察了从未玩过该游戏的人类玩家的行为。有些人读完整个教程,有些人先探索周围的环境,选择的差异是由不同人的“性格”决定的。


这就是劳拉需要学习的态度。

他知道这个角色

为了让人工智能与劳拉建立联系,人工智能需要了解其中涉及很多像素。人类玩家一进入游戏就突然意识到了这种意识。

对此,作者录制了拉拉从不同角度向不同方向移动的24小时视频,因此AI代理可以识别任何角色。

就像自动驾驶汽车一样,它可以以每秒30帧的速度记录24小时的视频,生成2,592,000个参考图像来识别路标。

首先,作者跟踪关键像素,然后跟踪主干关键像素以选择相应的区域。



为了确保劳拉在每张图像中都可见,作者要求程序识别不包含亮点的图像。

作者使用人工智能视觉捕捉来识别劳拉,当他占据整个屏幕或当二维物体出现在他的路径中时,结果足够准确,可以识别屏幕上的角色。

环境互动

一旦你确定了劳拉,你就需要让人工智能与环境互动。

游戏环境由相同的块组成,作者将其导入到立方体中,然后从每一面获取环境,然后运行识别过程,使AI代理像人类玩家一样识别环境。解释成像过程。


以红色突出显示的区域是未知纹理。然而,AI仍然不知道自己要去哪里,需要知道距离周围环境有多远。



有趣的是,这些未知区域往往位于距离劳拉很远的地方,或者被其他二维物体覆盖的地方。

如果我们观察人类玩家的行为并看到该图像,我们立即就会明白用箭头标记的区域是入口。

我们可能不知道隔壁房间的大小,但我们知道它就在那里。



然而,这可能是一种视错觉。随着我们的进展,入口区域的纹理与空间的其余部分不同,这是典型的3D空间。

因此,人工智能代理必须学会移动和比较。通过计算,可以使用多个图像来确定哪个纹理具有最小的尺寸变化。这里可以使用主要多边形的面积,其变化主要基于与彼此距离成正比的概率。


想象

现在人工智能知道他们在哪里,他们需要决定去哪里。

您可以通过识别纹理将它们带到特定位置,但关卡导航需要更简单的东西。

最快的方法是简化对比度并识别给定区域中突然的光线变化。然而,人类玩家不必去那里。如果有多个空位,AI应该表现出足够的兴趣,但不会导致死亡。



例如,如果洞太深,不抓住周围的边缘就不可能跳跃。如果其中含有水,可能会很危险。

人类玩家知道什么时候跳,但劳拉的动作都是来自教程,所以你必须准确猜测他和目标之间有多少格,是否蓄势,以及是否要停下来才放手。。


简而言之,他们需要像人类玩家一样做出准确的判断。

如果他们提前知道洞的大小,他们会跑得更快,这并没有达到我们的预期。



为了收集更多有关环境的信息,作者鼓励人工智能在有疑问时旋转相机并收集更多信息。

但事实是,人工智能仍然可能被困在房间里。

为了鼓励他们离开房间,作者添加了一些收集规则。

例如,每当您遇到以前从未见过的纹理时,该区域将成为突出显示的区域,您需要以增加屏幕上纹理大小的方式移动它。



这样他们就只能通过关卡了。由于每个级别都有独特的纹理,因此只能通过前进到下一个级别来解锁。

简而言之,劳拉不断分析他在屏幕上看到的内容-不同的表面纹理,移动他的身体,并识别新的兴趣点(即目录中尚未存在的纹理)。

一路上,他们不断检查,寻找缺失的纹理。

运动型的

尽管有上述改进,人工智能仍然非常机器人化,其行为模式也很明显。

此外,作者再次观察了人类玩家。

它决定人类玩家在游戏中的行为方式吗?这是我们的记忆,我们记得行动是如何组合在一起的。

因此,这个过程也需要基于人工智能,因为劳拉需要了解自己的运动能力。



为此,作者保存了人工智能训练执行的每一秒动作,然后添加规则以允许它同时执行这些保存的动作。

这样一来,AI的动作就变得更加流畅。此外,由于每个动作的冷却时间是已知的,AI在激活时不会执行不必 要的动作。



在下图中,火势燃烧得如此之快,以至于需要很大的跳跃才能恢复正常。

幸运的是,通道在视觉上得到了简化,并且块的边缘很容易识别。

人工智能知道,当骰子的第一部分被激活时,劳拉会做出正确的跳跃,就像人类玩家知道的那样。

ChatGPT赋予个性

然后劳拉的个性必须被植入到人工智能代理中。个性是由经验和记忆定义的,这些因素的结合定义了劳拉的性格。根据游戏的设定,他是一位著名的考古学家,他不惧怕冒险,他乐意承担免费的山地任务,一切都是为了爱情。



而且,拉拉非常富有,刚刚搬进了一座内饰优雅、有家庭练习室的豪宅。他教得很好,会游泳,会爬岩石,而且有很强的耐力。

当他在冒险中遇到危险时,他能保持冷静,非常勇敢,并毫不犹豫地帮助他的朋友。

对抗狼群的围攻,你可以用步枪准确射击,用刀杀死危险的狼。一方面,他拒绝强行开门。

以上都是劳拉从游戏设定中了解到的性格。

之后,为了以原创的方式评论他的所见,作者将劳拉的性格特征收集到数据库中。



为了让评论了解正在发生的事情,程序需要将游戏中的图像与现实生活中可以理解的事物联系起来。

对于经常缺乏纹理细节的图像,可以使用Google的反向图像搜索来匹配。



所以当AI代理检测到足够大的纹理时,它就开始搜索。

为了识别这些单词,Formaster将整个页面复制到ChatGPT中。然后,ChatGPT会被要求根据出现的次数对识别出的单词进行分类,然后再将其添加到列表中。

最后,ChatGPT被要求根据这些单词创建句子,同时考虑到劳拉的个性。



一路走来,我希望ChatGPT能够对劳拉在现实生活中所看到的做出评论。

例如,如果纹理被识别为海狮,ChatGPT可以用劳拉的性格特征来注释海狮。



一般来说,劳拉特工的个性是通过ChatGPT使用“勇敢”、“友好”或“聪明”等各种属性来设置的。



劳拉在游戏中注意到和评论的每个对象都会经过这个个性过滤器,劳拉会根据他既定的个性做出反应。和上面的海豹一样,劳拉提到了海狮的化石,或者出色的游泳能力,但没有评论马戏团。

网友:人工智能代理将电子游戏变成艺术品

有网友表示,这是最好、最自然的人物养成方式之一。当角色还活着时,你可以将电子游戏视为艺术品。

“他们说话和分析环境的方式非常有趣。当你有一个可以评论其环境的人工智能机器人时,无论多么美妙,它感觉就像一个真正的人类。”

——令人着迷,他的好奇心和求知欲几乎正是我想象中劳拉的内心独白。

尽管如此,我还是很惊讶他的对话与他的行动相符。写对话的AI和控制角色的AI似乎是同一个人。

不久前,斯坦福AI智体小镇开源后,网友们非常兴奋,认为AGI已经到来,各种RPG、模拟游戏都会使用这项技术。

现在,Foxmaster将ChatGPT、计算机视觉和物体识别结合起来,让视频游戏变得更加有趣。

也许未来的电子游戏中的角色会有更深的个性、灵活性、对环境更快的反应,以及许多其他我们甚至无法想象的变化。

参考:

展开阅读全文

页面更新:2024-05-10

标签:劳拉   人工智能   纹理   电子游戏   古墓   图像   角色   人类   玩家   环境   作者   游戏

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top