突发,刚封完一批号,Claude转头甩出全场最香模型

最近这阵子,Claude 用户群里的画风挺魔幻的。

一边是此起彼伏的"账号又没了"。

各种关于风控规则的猜测在社群里流传:IP 跳动、设备指纹、登录环境不一致,都可能成为触发点。


具体机制官方从没说清楚过,大家基本靠踩坑经验互相安慰。

然后就在昨天,Anthropic 一声不吭放了个大招。

Claude Sonnet 5 正式上线,而且价格直接砍到让人意外。


一边收紧口子,一边放出更便宜的新模型,这波操作确实容易让人产生联想。

那么这次的 Sonnet 5,到底是不是一次真材实料的升级?

一、“中杯” 也能有大杯的实力了

在 Claude 的产品序列里,Sonnet 一直是那个"够用、够快、够便宜"的中间选项。

Haiku 太小,Opus 太贵,Sonnet 卡在中间负责走量。

但过去一年多,Anthropic 几乎把所有能力跃升都堆给了 Opus。

Sonnet 系列被落下一大截,很多重度用户不得不咬牙升级到 Opus,才能跑通复杂的 agent 任务。

Sonnet 5 想解决的,正是这个问题。

官方给它的定调很直接:这是目前 agent 能力最强的 Sonnet 模型。

能够自主做计划、调用浏览器和终端等工具,并且把复杂任务坚持执行到底,而不是像以前那样跑一半就卡壳。

用 Anthropic 自己的话说,几个月前还得靠更大更贵的模型才能干的活,现在 Sonnet 就能扛。

小P的理解是:这次不是小修小补,是想把 Opus 的看家本领,下放到更多人用得起的价位上。

二、跑分是真好看

光说不练没意思,直接上数据。

以下是官方公布及多家媒体报道整理出的核心跑分对比:

测试项

Sonnet 4.6

Sonnet 5

Opus 4.8

Agentic Coding(软件工程基准)

58.1%

63.2%

69.2%

Terminal-Bench 2.1(终端操作)

67.0%

80.4%

82.7%

Humanity’s Last Exam(带工具)

57.4%

57.9%

OSWorld-Verified(电脑操控)

81.2%

83.4%

几个信息量很大的点,小P挑出来说说:

换句话说,Sonnet 5 已经把自己跑到了 Opus 90% 以上的水平区间。

用中杯的钱,买到了接近大杯的脑子。

Zapier 的工程师在 Anthropic 官方博客里提到过一个案例。

交给 Sonnet 5 一个"改 Salesforce 账户等级 + 给企业客户发上线通知"的两段式任务,它能一口气端到端做完。

这种以前经常卡壳的活,现在不用人工介入了。


三、价格很香,但小字部分要看仔细

这次真正的杀招在价格。


即日起到 2026 年 8 月 31 日,Sonnet 5 走的是限时优惠价:

输入每百万 token 2 美元,输出每百万 token 10 美元。

促销期结束后,恢复到标准价 3 美元 / 15 美元。

作为对比,Opus 4.8 是 5 美元 / 25 美元。

标准价也只要 Opus 的六成,促销期更是只要四成,确实划算。

但这里有个容易被忽略的坑,小P必须提醒一下:

Sonnet 5 换了一套全新的 tokenizer。

同样一段文字被拆分出来的 token 数量,可能是原来的 1 到 1.35 倍,具体取决于内容类型。

也就是说,单价便宜不等于账单一定便宜,真实成本还要看你的任务里 token 到底怎么消耗的。

Anthropic 把促销价定得比较低,某种程度上也是在对冲这部分"隐形涨价"。

所以别只盯着标价爽,跑一遍自己的真实任务再下结论比较靠谱。

四、安全性这块儿,进步看得见

System Card 里的数据挺有意思。

相比 Sonnet 4.6,Sonnet 5 在拒绝恶意请求、抵抗提示注入攻击上明显更强。

幻觉和一味迎合用户的倾向,也降低了不少。

不过要泼盆冷水:

在自动化行为审计中,它的"不良行为率"虽然比上一代好,但依然高于 Opus 4.8,也高于还处于内测阶段的 Mythos Preview。

说白了,更听话了,但没到旗舰模型那个段位。

网络安全能力上,Anthropic 明确说没有专门针对高风险网络安全任务训练 Sonnet 5。

在 Firefox 漏洞利用这类高危测试里,它基本交了白卷,能干点常规的、无害的网络安全活儿,仅此而已。

为了兜底,官方默认给它开了实时的网络安全防护机制。

但防护强度比对外几乎不开放的 Fable 5 要低,毕竟风险等级本来就不在一个量级。

五、去哪儿用、能干嘛

Sonnet 5 从今天起是所有 Free 和 Pro 用户的默认模型。

Max、Team、Enterprise 也都能用。

同时进驻 Claude Code、Claude Platform,以及 AWS Bedrock。

开发者调用模型 ID 是 claude-sonnet-5。

同一天,Anthropic 还顺手放出了面向科研场景的 Claude Science 工作台。

预置了基因组学、蛋白质组学等 60 多个科学技能和数据库连接器,算是这次发布的一个彩蛋。

感兴趣的可以自己去扒一扒,这里就不展开了。

至于很多人关心的 Fable 5——目前普通用户还是摸不到。

据了解是卡在出口管制相关的政策上,Anthropic 表示在推进恢复,具体什么时候回来,暂时没有准信。

六、小P的真心话

单看产品力,Sonnet 5 是一次很扎实的升级。

几乎每一项硬指标都在往 Opus 那条线上贴,价格却只要大杯的一半左右。

对于要跑多 agent、要控制成本的开发者来说,这个性价比是真实存在的,不是营销话术。

但账号这件事,小P还是想多说一句。

Claude 目前依然没有正式面向中国大陆用户开放,这是绕不开的现实。

模型越做越强、价格越来越亲民,跟账号说没就没之间的落差,确实会让人一言难尽。

工具是好工具,但用之前建议先掂量一下自己能承受的风险。

重要的对话和工作流,记得随手备份,别把鸡蛋都放在一个说封就封的篮子里。

技术在往前跑,规则也在收得更紧。

这大概就是现阶段用 Claude 最真实的体感——爱得深沉,也得留个心眼。

好了,今天就聊到这儿。

你们要是也用上了 Sonnet 5,评论区聊聊体感怎么样呗。

展开阅读全文

更新时间:2026-07-02

标签:科技   批号   全场   模型   大杯   美元   终端   官方   价格   用户   网络安全   百分点   能力

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号

Top