说实话,看到谷歌这次把Gemini 3.0 Pro推出来的时候,圈内几乎没人想到会这么猛。1501的Elo分数直接杀上LMArena榜首,数学能力在MathArena测试里干到23.4%,其他模型还在个位数挣扎,它已经甩开一大截了。你想想,这可不是普通题目,是被称为“地狱难度”的竞赛题,能拿这个成绩,说明它真有点“开窍”的意思了。

有意思的是,阿尔特曼在推特上轻描淡写来了一句“Gemini 3看起来还不错”,语气像在夸邻居家孩子考试进步了。但谁都明白,这话背后有分量——OpenAI的掌舵人公开点名,本身就是一种认可。马斯克紧跟着点赞,皮查伊呢?回了个表情包,轻飘飘的,反而显得更有底气了。这种巨头之间的微妙互动,比发布会还耐人寻味。

视觉能力这块更离谱,截图理解准确率居然冲到72.7%,是目前顶尖水平的两倍。以前AI看图像是“雾里看花”,现在等于戴上了一副高清眼镜。以后让它帮你处理邮件、操作软件,不再是天方夜谭。比如你说“帮我整理收件箱”,它真能自己判断优先级,起草回复,一步步走完流程——Gemini Agent的实验功能已经能干这事了。

它背后跑的是谷歌自家的TPU芯片,不是什么通用CPU,专为大模型设计,内存带宽大,跑起来不卡。训练效率高不说,连批量数据都能吃得下。硬件+算法双管齐下,这才有了现在的爆发。

编程方面也没掉队。Live Code Bench上Elo分突破2400,工具调用和终端操作测试直接拿第一。SWE-Bench没拿SOTA,但稳稳待在第一梯队,不算惊艳,但足够扎实。谷歌还顺手甩出一个Agentic平台——Google Antigravity,明显是要把开发者圈进来,生态先搭起来。

现在Gemini 3预览版已经能用了。普通用户走App就能上手;Pro和Ultra会员在搜索的AI模式里体验;开发者有API、CLI、Antigravity一堆工具可用;企业客户则通过Vertex AI和Gemini Enterprise接入。节奏铺得很稳,不急不躁,但每一步都踩在点上。

谁都没料到,一次产品更新,愣是搅动了整个AI圈的神经。
更新时间:2025-11-25
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号