Gemini 3.2的传闻还没捂热,代号「Cappuccino」的Gemini 3.5 Pro检查点就已经开始产出了。从3.2直接跳级到3.5,谷歌要在I/O大会上讲出的故事,显然比外界预期的更大。
更有意思的是,这次曝光不止是模型版本更新,连24小时全时运行的智能体Gemini Spark也一起被扒了出来。这款能帮你管邮件、跑任务,甚至可能不问你就下单的AI管家,已经把竞争直接拉到了AI落地的新赛道。模型参数的军备竞赛已经不是重点,谁能把AI真正嵌进日常生活,才是下一轮输赢的关键。这场提前打响的卡位战,会带来哪些不一样的变化?

AI生成的简易游戏界面 :Antigravity创作的《大鱼任务》游戏界面
外界都在讨论Gemini 3.5的性能能不能追上GPT-5.5,可很少有人注意到这次曝光里最有价值的一组数据:Gemini 3.2 Flash在编码和推理上达到GPT-5.5的92%,成本却便宜15到20倍。
这个数字放在当前的AI价格战里,分量远比性能追平更重。2026年的AI行业,已经从比拼模型参数上限,转向比拼同等性能下的成本下限。
上个月多家机构的实测结果已经验证了这个趋势:大部分日常任务,比如整理文档、写周报、做常规编码,中端模型的表现和顶级大模型几乎看不出区别,但价格可能只有几十分之一。Gemini 3.5的轻量版本,刚好踩中了这个市场需求。
谷歌的蒸馏加稀疏化技术已经开始收获实实在在的成果。LM Arena的匿名跑分显示,Gemini 3.5 Flash在SVG生成、交互式3D编码和动画处理上已经超过了旧款的3.1 Pro——把前沿模型的能力压缩进轻量版本,同时没有出现质量断崖,这本身就是技术突破。

AI生成的游戏界面 :Claude Code创作的《Neko Dream》游戏界面
网友只用一个简单提示,Gemini 3.5就直接输出了4个风格各异、细节拉满的机器人SVG,这放在旧版本上几乎是不可能的事。以前社区吐槽Gemini生成SVG「懒」,给一个prompt只出一个敷衍结果,现在这个问题显然已经得到了实质性解决。
技术竞争到最后,往往都是成本的竞争。当参数竞赛摸到物理瓶颈,谁能把更高的性能压到更低的成本,谁就能拿到更大的市场。
这次一起曝光的Gemini Spark,才是谷歌真正的杀招。这款定位「24小时全天候待命」的全时智能体,已经不再是一个附加功能,而是直接升级成了用户的数字生活管家。
它能帮你清理Gmail垃圾邮件、整理会议笔记、生成个性化新闻摘要,还能执行多步骤工作流,同时从多个谷歌应用提取信息。更关键的是,用户可以自定义技能,把重复工作设置成模板,只要输入变量就能自动完成。
这种灵活性,刚好戳中了当前智能体市场的痛点。市面上大多数AI Agent,还停留在「单次对话单次处理」的阶段,而Spark从设计上就是为了24小时在后台运行,持续服务用户的日常需求。

AI生成的游戏界面 :ChatGPT Codex创作的《布丁爪爪》游戏界面
当然,曝光信息里提到的「可能不经确认就完成购买或分享信息」,也引发了不少关于隐私的讨论。但从另一个角度看,这恰恰说明了谷歌的野心——它要做的不是一个召之即来挥之即去的工具,而是真正能接管你部分数字生活的助手。
全时Agent的核心壁垒从来不是技术能力,而是数据积累。用户用得越多,Spark就能拿到越多个人数据,训练出来的模型也就越懂用户,这是一个很难被复制的正向循环。
谷歌手里握着10亿级别的分发入口,从搜索到邮箱再到手机系统,本来就掌握着海量用户数据。Spark一旦正式铺开,这些数据就能直接反哺Gemini的下一代训练,这个优势是OpenAI和Anthropic短期内很难追上的。
从内部代号「Remy」到现在的Gemini Spark,谷歌的Agent路线走得非常清晰:从一个附加功能,一步升格为覆盖日常的全时管家,直接对标Anthropic的Conway和OpenAI的全时Agent平台,正面抢占赛道。
外界总在说,谷歌Gemini的编程能力现在落后于Claude和OpenAI,DeepMind内部正面临着切实的追赶压力。从数据上看确实如此:Claude Code已经坐稳了开发者群体的默认选项,OpenAI的Codex也在快速扩张,而谷歌的Antigravity编程平台,4个月只拿到了6%的开发者采用率。
但很多人没注意到,谷歌其实并没有在别人的赛道里拼命追赶,它走的是另一条路径。谷歌没有纠结于跟对手抢现有开发者,而是把宝压在了多模态编程和轻量模型的普及上。
这次曝光的Gemini 3.5,已经能通过一个prompt直接生成完整的交互式Web应用。爆料里展示的鹈鹕骑自行车矢量插画,自带7维定制面板,车架颜色、光照、蹬车速度全部可以实时切换——这已经不是简单的生成代码,而是直接生成了可交互的应用。

社交平台推文截图 :Lentils分享Gemini生成的4款机器人SVG
DualShock 4手柄的交互式蓝图拆解更是直接展示了多模态编程的可能性:用户上传一张硬件图片,AI就能直接生成可交互的拆解蓝图,这对于硬件开发和教学来说,价值远不止写几行代码。
此外,新款Gemini原生支持MCP第三方工具接入,Thinking模式也重构为全局开关,分成适合常规问题的Standard和适合复杂问题的Extended两档,开发者可以根据需求自由选择,本质上也是在降低编程的门槛。
现在AI编程已经出圈,不会写代码的产品经理和设计师也开始用AI生成原型代码。谷歌的思路很清晰:当对手在抢现有开发者市场的时候,谷歌把目标放在了那些本来不会写代码的新用户身上,用更低成本的多模态能力,打开新的市场空间。
现在AI行业的格局已经非常清晰:OpenAI靠迭代速度碾压,三周一个新版本,死死咬住前沿性能;Anthropic靠模型质量封神,Mythos已经重新定义了行业前沿,在开发者群体建立了口碑;谷歌没有跟着两家在参数竞赛里卷,而是靠分发入口和全时Agent走了包抄路线,要把AI直接塞进10亿人的日常数字生活。
三家的路线选择其实刚好对应了AI行业当前的三个增长极:OpenAI吃技术迭代的红利,Anthropic吃高端市场的红利,谷歌吃普及落地的红利。
有意思的是,现在三家都在踩油门,没有人选择减速。OpenAI给Codex追加了ultrafast模式,速度提升2-3倍,还放出补贴战,30天内切换的企业可以免费用两个月,3小时内就有2000名开发者响应;Anthropic同步放出Opus 4.7 Fast模式,直接给Claude Code提升50%的额度;谷歌则提前曝光Gemini 3.5和全时Agent,抢在I/O大会之前提前卡位。
这场竞争的底层逻辑,早就不是比谁的模型参数更大了。现在谁掌握了更多用户的真实使用数据,谁就能拿到AI自我训练的飞轮入口——AI写的代码反哺AI训练,AI帮用户处理日常任务拿到更多数据,这些数据又会让AI变得更聪明。
通往通用人工智能的飞轮,不是某一家推动的,是三巨头一起踩下了油门,现在它已经开始自己转起来了。
对于普通用户和开发者来说,这场三巨头的军备竞赛,其实是2026年最划算的一件事。补贴在加码,额度在提升,模型在变强,价格反而在不断下降。用户能用更低的成本拿到更强的能力,这本身就是技术竞争带来的红利。
唯一需要思考的问题是:当AI从「对话工具」变成「全时管家」,你的工作和生活,准备好了迎接这种改变吗?
#Gemini##AI妙生图##ClaudeCode##OpenAI#
更新时间:2026-05-21
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号