阿里云公布最新数据:MaaS业务Token收入过去五个月增长15倍,月度收入已经摸到数亿元门槛。几乎同一天,谷歌I/O大会把全产品线都押在了Agent上。
全球云厂商第一次在同一个方向上踩下了满油门,Agent正在改写整个行业的底层规则。这不是某一家厂商的产品升级,而是云计算从“服务人类”转向“服务智能”的拐点,我们真的站在了新世界的门口?

模型性能对比折线图 / Qwen3.7 Max等模型几何平均加速比对比
你可能听过很多遍“AI重构云”,但这次不一样——阿里云做了一件成立17年从来没做过的事:单独给Agent业务开了独立官网“千问云”,而且明确说,这个官网是做给Agent看的,不是给人类用的。
在过去的云计算逻辑里,所有流程都是围绕人类设计的:开发者打开官网、注册账号、选产品、配参数,从申请到部署完一个项目,人类工程师至少要花两周时间。现在整个流程完全反过来了。
Agent找资源的逻辑是:先找到能解决问题的模型,再匹配需要的工具,最后才调用底层云资源,整个过程不需要人类动手。Minimax等客户已经实现了一天之内完成资源开通,效率直接提升了14倍。
这是云计算诞生以来,第一次把“智能体”当成了核心用户,而不是人类的辅助工具。原来我们说AI是生产力工具,现在AI自己成了生产资料的使用者,这是完全不同的逻辑。
阿里云整个技术栈从上到下都做了重构:最新发布的Qwen 3.7 Max旗舰模型,专门强化了长周期任务能力,可以独立完成35小时、超1000次工具调用的复杂工程任务,不需要人类中途介入。

发布会现场 / 舞台上的演讲者与千问云官网上线字样
底层芯片层面,平头哥也拿出了新一代真武M890训推一体AI芯片,144GB显存、800GB/s片间互联带宽,性能是上一代的三倍,专门适配Agent的大规模并发场景。目前平头哥PPU芯片出货已经超过54万片,全面支撑各类AI应用的推理需求。
最关键的变化发生在逻辑层面:原来云厂商卖资源给人类,现在云厂商把算力卖给Agent,Agent再给人类交付结果——整个商业模式的内核彻底换了。
Agent爆发直接带火了Token生意:一次Agent任务调用的Token量,是普通对话场景的十倍甚至百倍。Anthropic靠着Claude Code的爆发,二季度营收预计直接翻倍到109亿美元,这让所有厂商都看到了Token背后的巨大增量。

千问云官网页面 / 展示Wan2.7-T2V模型的千问云界面
阿里云同样吃到了这波红利:今年前五个月,拿到了LLM模型市场增量的80%,包含百炼MaaS平台在内的AI模型与应用服务年化经常性收入,预计年底会突破300亿元。但和很多人想的不一样,阿里云并没有在“堆Token量”上发力。
现在阿里云对销售的考核指标变了:不再比谁卖出去的Token多,而是比谁卖出去的Token“最值钱”。核心指标从调用量变成了接入客户核心业务系统的数量。
这个变化背后藏着一个很容易被忽略的真相:不同场景的Token,价值天差地别。普通对话场景的Token价格已经打到了地板价,消耗稳定但单价低、粘性弱;而代码开发场景的Token,一旦进入企业核心业务流程,消耗量会指数级上升,而且单价更高、复购更稳定。
代码场景本身就是一个自我增强的增长飞轮:模型写出代码,代码变成应用,应用部署到云上,应用运行又需要调用模型,模型再生成更多代码。
这和视频生成场景完全不同,视频模型的Token消耗大多是一次性的,生成完成任务就结束了,不会形成持续的飞轮效应。字节抓住了视频模型市场80%的Token消耗,阿里云则死死咬住了大语言模型编码场景的增量,这其实是两条完全不同的赛道,不存在直接的对错输赢。

Anthropic营收柱状图 / Anthropic 2026年两季度营收成本拆分
更有意思的是,阿里云的目标是让每一块芯片跑出更多高质量Token,芯片、模型和云三者形成紧密咬合的齿轮,螺旋式提升效率。这不是单点技术的竞争,而是全栈系统能力的较量。
过去很长时间,云计算行业有一个绕不开的痛点:企业IT预算里,软件开发和人力外包这块蛋糕,云厂商几乎吃不到。现在Agent Coding把这个缺口彻底打开了——这些预算现在百分之百能被AI Token覆盖。
目前互联网企业的Token支出已经占到IT支出的15%到20%,而传统企业还在5%以下,增长空间肉眼可见。阿里云给自己定的目标很明确:今年要让Token收入在每个客户的收入占比不低于20%。
这个变化已经在垂直行业显现出来:汽车行业原来最大的IT投入在ERP,现在已经转向AI相关投入;金融领域里,头部投研、量化、私募的业务场景,已经离不开大模型深度结合,客户从原来的抵触变成主动找上门合作。
更有意思的一个细节是,Agent带来的增长不只是模型Token的收入,还会带动整个云资源的增长。从阿里云的实际数据看,Agent爆发后,一块GPU的推理消耗,会同时带动两块GPU加CPU的云资源消耗——因为Agent生成的应用需要部署、运行和弹性扩容。
Agent天然就是云业务的增长飞轮:模型消耗Token,Token带动云资源,应用又反向生成更多Token需求,整个闭环里没有断点。
为了适配这个新变化,阿里云甚至调整了销售体系:给大客户单独配置纯MaaS销售,和原来卖IaaS的销售打配合,哪怕一个客户出现多个销售重叠,也要抓住机会不放手。这背后其实是整个组织能力跟着业务逻辑在重构。
现在所有人都在说Agent是未来,但很少有人想清楚,Agent到底会把云计算带向何方?我们看到的是,全球头部厂商已经达成了共识:谁能先做好全栈适配,谁就能拿到下一轮的入场券。
阿里云这次提前把增量拿到了80%,核心不是靠低价抢市场,而是选对了赛道——抓住了开发者群体和存量客户的天然优势,把火力集中在了高质量Token上,而不是去和别人抢低价值的流量。
这场Token战争走到最后,比拼的从来不是谁的调用量更大,而是谁能帮客户拿到真实的业务结果。阿里云现在追求的“高质量Token”,本质就是让客户为结果付费,而不是为调用次数付费,这其实戳中了MaaS行业长期发展的核心。
我们正在经历一个很奇妙的转折点:云计算从服务人类工程师,变成了服务智能体,而智能体再反过来帮人类做开发。当Agent可以自动开通资源、自动写代码、自动部署应用的时候,整个软件开发的效率会被拉到一个前所未有的高度,而云厂商的天花板,也会跟着被撑得更大。
未来不会所有云厂商都能分到这波增量,只有那些从芯片到模型再到云完成全栈适配的玩家,才能咬得住这块新蛋糕。现在阿里云已经迈出了第一步,接下来整个行业都会跟着调整方向,我们很快就能看到这场重构的结果。
#AI妙生图##与ChatGPT的有趣对话##ClaudeCode##Gemini##芯片##云计算##智能硬件##智能驾驶##操作系统##物联网##人工智能##互联网##大数据##智能体##千问##ai消除##智能手机##AI生成#
更新时间:2026-05-25
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034844号