
Google的AI战略被迫调整
上周,Google悄无声息地调整了一支核心团队。
据Wired报道,Google负责Project Mariner的团队成员,近几个月被陆续调往其他优先级更高的项目[1]。这个项目大家可能还有印象——去年I/O大会上,CEO皮查伊亲自站台推介,说它能让AI帮用户操作浏览器。
听起来很酷,对吧?!
但现在,这个项目的人被调走了。
与此同时,整个硅谷正在发生一场更剧烈的转向——从"浏览器Agent"全面倒向以OpenClaw为代表的"计算机控制Agent"。
NVIDIA CEO黄仁勋前几天直接放话:"现在每家公司都必须制定OpenClaw战略",还把它比作"AI计算机的新操作系统"[1]。
这到底是怎么回事?
曾几何时,浏览器Agent被认为是AI的下一件大事。
2024年到2025年,OpenAI、Perplexity、Google纷纷推出自己的浏览器Agent。宣传语都差不多:只要说一句话,AI就能帮你点网页、填表格、订外卖、约餐厅。像个人类助手一样操作浏览器,被认为是大模型走向普通人的关键一步。
结果呢?
根据Wired的数据,Perplexity的Comet浏览器Agent,到2025年12月仅有280万周活跃用户。
OpenAI的ChatGPT Agent更惨——据The Information报道,近期周活跃用户已经不到100万。
作为对比,ChatGPT本身每周有上亿人在用。
"浏览器Agent的使用量,简直可以忽略不计,"一位行业分析师说得挺直接。
让浏览器Agent走下神坛的,是另一类技术的崛起——以OpenClaw和Claude Code为代表的"计算机控制Agent"。
这些工具不玩截图识别那一套。它们直接通过命令行和计算机对话——写代码、改文件、调用API、执行操作。
为什么这种方式更香?
斯坦福大学AI教育平台Workera CEO基安·卡坦福鲁什(Kian Katanforoosh)说得特别形象:"Claude Code和OpenClaw证明了一件事——用终端工作,实际上比看图办事效率高得多。因为终端是文本的,大语言模型也是文本的。达到同样结果,可能只需要十分之一的步骤。"[1]
说白了:浏览器Agent每次操作都要"截图-分析-执行",环节多、速度慢、容易出错。命令行Agent直接和系统底层对话,省去了"看图"这个环节,效率提升几十倍甚至上百倍。
当然,也不是所有任务都能用命令行解决。前Google DeepMind研究员、现在做计算机控制Agent创业公司的李昂(Ang Li)就指出:"总有一些任务必须在图形界面完成。比如医保网站、传统企业软件——它们没有API,命令行Agent根本调用不了。"
所以浏览器Agent不会完全消失,只是从"主角"变成"配角"——专门解决那20%必须用图形界面完成的任务。
面对这一趋势,Google选择了果断调整。
Project Mariner团队的人被调走以后,Google发言人出来表态了:"Project Mariner开发的计算机使用能力,将被整合到公司未来的Agent战略中。"实际上,这些能力已经部分融入到近期发布的Gemini Agent产品里。
这释放了一个明确信号:Google承认,纯浏览器Agent路线走不通了。
但这不意味着Google放弃了"让AI控制计算机"这个方向。只是换了个玩法——不再作为独立产品存在,而是融入更大的Agent生态。
不只是Google。
Wired的报道显示,整个AI行业都在经历从浏览器Agent到编码Agent的战略大转移:
与此同时,而中国正在热火朝天的推动各类Openclaw应用,腾讯、阿里、百度、字节等大厂全面入局。
3.19 | 腾讯 | WorkBuddy+QClaw |
3.17 | 阿里云 | JVSClaw |
3.16 | 百度 | RedClaw(红手指) |
3.13 | 阿里云 | HiClaw 开源版 |
3.12 | 百度 | DuClaw(网页端) |
3.11 | 百度 | RedClaw 移动端方案 |
3.10 | 智谱 AI | AutoClaw(澳龙) |
3.9 | 字节跳动 | ArkClaw |
3.6 | 小米 | MiMo Claw |
3.5 | 腾讯 | QClaw |
3.1 | 腾讯云 | OpenClaw 托管方案 |
AI公司也发现:让Agent具备"使用其他应用、修改文件、创建定制软件"的能力,比单纯做浏览器自动化更有价值。
举个例子:你想做家庭预算管理。与其让浏览器Agent帮你一个个点网站,不如直接把银行流水上传给编码Agent,让它帮你做一个专属的财务Dashboard。
这场技术狂欢背后,有被忽视的安全风险。
当Agent获得"控制计算机"的能力时,它实际上获得了极大的权限。OpenClaw可以读取文件、执行命令、调用API——这意味着:
权限失控:Agent获得的权限等同于启动它的开发者权限。如果被恶意利用,后果不堪设想。
供应链攻击:Agent需要调用大量第三方工具和服务,每个环节都可能是突破口。
自动化犯罪:过去需要人工操作的钓鱼、诈骗、渗透,现在可以被Agent批量执行。
Google在调整团队的同时,如何重新设计这些Agent的安全边界,将是一个至关重要的问题。
技术史上从来不缺"预期落差"的剧本。
当年的元宇宙、区块链、Web3,哪个不是万众期待?哪个不是逐渐降温?
但这次OpenClaw浪潮有点不一样:它不是"概念炒作",而是"真刀真枪"。开发者已经在用Claude Code写代码、用OpenClaw自动化工作流程。黄仁勋的表态背后,是整个产业资本的真金白银。
我的判断是:浏览器Agent不会消失——就像图形界面没有完全取代命令行。但角色变了:从"主角"变成"配角",从"面向大众"变成"专业工具"。
对于普通人来说,短期内你可能仍然需要自己操作电脑。但如果你关心AI发展,应该注意到——这场静悄悄的革命,正在改变我们与计算机交互的根本方式。
巨大的变革正在来临“配置好Skills的Openclaw,可靠稳定解决某一个具体问题,可能是新时代的软件交付方式”!
关注我,带你了解Openclaw的最新演进、最有价值的应用和安全防护的方法!
参考来源:
[1] Wired - "Google Shakes Up Its Browser Agent Team Amid OpenClaw Craze" (2026年3月19日)
更新时间:2026-03-23
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034844号