谷歌放大招!SIMA2看屏敲键玩游戏,玩家终于告别“坑队友”?

财经摆渡人

精研出品

破浪前行,共探财富新局


大家好欢迎收看【古今财鉴】

谷歌DeepMind刚推出的SIMA2,可能是游戏党等了多年的“神仙队友”。

它不搞游戏底层指令操控那套,纯靠看屏幕画面、用虚拟键盘鼠标操作,完完全全像人一样打游戏。

之前玩DOTA2、王者荣耀时,谁没被坑队友气到想卸载?SIMA2的出现,说不定真能解决这个老大难问题。

SIMA这名字看着复杂,全称是可扩展指令多世界智能体。

简单说,它就是个能在各种虚拟世界里,听懂指令还能自己琢磨事儿的智能体。

谷歌在AI领域的布局一直挺全面,从当年下围棋的AlphaGo,到破解蛋白质结构的AlphaFold,再到如今的Gemini大模型、Genie3世界模型,每一步都没落下。

个人觉得,SIMA2更像是这些技术积累的“集大成者”,不是凭空冒出来的产物。

一、从“听指令”到“会思考”,SIMA2的推理能力有多顶?

之前的SIMA1已经能执行600多种语言指令,比如拍梯子、打开地图这类基础操作。

但SIMA2直接升级了,把Gemini大模型当核心引擎,不光能听指令,还会自己推理。

之前的游戏AI顶多算“工具人”,SIMA2才有点“伙伴”那味儿。

在MineDojo这款它从没接触过的游戏里,SIMA2靠着推理就能完成任务。

DeepMind用人类演示视频、语言标签和Gemini生成的标签混合训练它,这思路和特斯拉FSD的端到端技术有点像。

本来想吐槽AI玩游戏肯定不如人,结果看了测试视频,发现自己想多了它不仅能响应提问,还能琢磨自己的行为和所处环境。

研究人员说和它互动像跟伙伴合作,这事儿其实挺颠覆的,相当于在游戏场景里过了一把“图灵测试”。

二、不止游戏,这波操作藏着通用AI的大野心

谷歌选游戏当训练场,可不是单纯为了讨好玩家。

虚拟3D环境复杂多变,还不用担现实风险,刚好适合练智能体的“通用能力”。

SIMA2的泛化能力是真出众,短期指令比如左转、爬梯子早就不在话下,现在还能打通完整游戏关卡。

更厉害的是,它能跨游戏用技能,A游戏里学会的挖掘,到B游戏里就能用来采集。

除了语言指令,它还能懂多模态提示。

你在画面画个路线草图,或者发个“+树木”的表情符号,它都能get到意思,屁颠颠去砍树。

配合Genie3生成的全新3D世界,它也能快速适应,毕竟这些世界虽然看着陌生,但物理规律是一致的。

最让人惊喜的是它的自我提升能力。

一开始跟着人类示范学,后来就能自主游戏继续进化,不用额外的人类数据。

初代没完成的任务,迭代几轮后就能搞定,全程没人干预。

这种自进化能力,才是通用AI该有的样子。

但它也不是完美的。

搞不清的是,明明技术已经这么强,为啥处理超长超复杂任务还会吃力?后来发现,这其实是整个行业的难题。

它的上下文记忆不长,精细操作和复杂3D场景理解也还有提升空间。

如此看来,SIMA2现在还只是研究阶段,离真正的通用具身智能还有距离。

不过换个角度想,谷歌这步棋走得挺妙。

通过大量虚拟世界数据,加上Gemini的推理能力,把分散的专用AI能力整合到一起。

这些在游戏里习得的导航、用工具、协作技能,将来都能用到机器人身上,让它们在现实里成为真正的智能助手。

对游戏党来说,SIMA2可能意味着以后组队能选AI队友,不用再怕遇到摆烂的。

对AI行业来说,它是朝着通用智能迈出的重要一步。

毫无疑问,SIMA2的出现,让我们看到了AI和人类协同的更多可能。

或许用不了多久,不光是游戏,生活里也会出现越来越多“像人一样”的AI伙伴。

展开阅读全文

更新时间:2025-11-25

标签:游戏   队友   玩家   指令   能力   智能   世界   操作   模型   伙伴   人类

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top