干货：Claude Sonnet 4.5震撼发布，宣称“最强编码模型”

前言

北京时间9月30号凌晨，Anthropic 正式发布了 Claude Sonnet 4.5，官方宣称这是迄今为止 “最强大的编码模型” 与 “最符合前沿技术的模型”。与之前的 Claude 模型相比，在多个领域都有了很大的改进，接下来我们一起看看它的关键升级都有哪些吧。

关键升级

在 Claude Code 中加入检查点功能，可以保存进度、回滚状态，这是开发过程中的重要安全与便利功能
刷新了终端界面并发布了原生 VS Code 扩展，VS Code 的扩展使得开发者可以在 IDE 内部直接与 Claude 协作，而不必频繁切换环境
新增了上下文编辑功能和记忆工具，让对话历史、上下文管理更加灵活，延长了代理独立工作的时间
将代码执行和文件创建（电子表格、幻灯片和文档）直接带入了对话中
提供了Claude for Chrome扩展程序
为开发者提供了Claude Agent SDK

让我们深入了解一下它的新特性、它与其他前沿模型的比较，以及为什么它可能是目前市场上适合开发人员、企业和高级用户的最佳模型。

Claude Sonnet 4.5 在SWE-bench Verified测试中展现了卓越的性能，该测试旨在评估 AI 模型在现实世界中的软件工程能力，它的准确率达到了77.2%，在使用并行测试时计算时则提升至 82.0% 。这些结果使 Claude 领先于包括 OpenAI 的 GPT-5 和谷歌的 Gemini 2.5 Pro 在内的竞争对手。

Anthropic表示，Claude 4.5能够持续长达30小时的不间断编码，相比今年早些时候Claude Opus 4实现的7小时基准测试，实现了显著提升。在内部测试中，该模型能够自主构建和部署完整的软件堆栈，包括后端服务、域配置，甚至安全审计。

Claude Sonnet 4.5还显示出在推理和数学等广泛评估方面的改进能力。

金融、法律、医学和 STEM 领域的专家发现，与包括 Opus 4.1 在内的旧模型相比，Sonnet 4.5 表现出了更出色的领域特定知识和推理能力。

在安全性能方面，Claude Sonnet 4.5取得了显著进步，它减少了诸如谄媚、欺骗、权力追求以及鼓励妄想思维倾向等令人担忧的行为。对于该模型的代理和计算机使用功能，在防御即时注入攻击方面也取得了显著进展。

Anthropic同时推出了Claude Agent SDK，这是构建Claude Code所使用的基础设施，现在可供所有开发者使用，这意味着开发者可以构建与自己使用的相同能力的智能体。

写在最后

Claude Sonnet 4.5的发布标志着AI安全领域的一个重要里程碑。通过在安全性、对齐能力和透明度方面的显著改进，该模型为未来AI技术的发展设立了新的标准。

在人工智能快速发展的今天，这种全面而深入的安全评估不仅为行业提供了宝贵经验，也为未来AI技术的发展指明了方向。

展开阅读全文

更新时间：2026-01-22

标签：科技干货最强模型开发者能力领域功能上下文时计测试检查点性能

1 2 3 4 5

干货：Claude Sonnet 4.5震撼发布，宣称“最强编码模型”

前言

关键升级

写在最后

俄罗斯要复活“三发”客机？PD-35发动机难产，专家建议用数量凑

为“红”不要命！网红自驾飞机坠亡，只剩腿，专家：会飞的铁棺材

从细节看高德与百度地图的差异

又是马斯克从3美元到6美分：Grok 4 Fast用智能密度赢麻了

科技护航道路交通安全：“鹰眼守护”正式发布！

机器当科学家？AI两天解数年难题，还筛出抗肝纤维化新药

韩媒：没想到，连韩国最强的三星集团，也招架不住中国芯片的反击

高德地图订酒店 “预订成功” 变 “查无此单” 协商6小时后订单被取消

AI要抢编剧饭碗？输入提示词就能生成长视频，成本直降98%！

国内这一激光厂商完成天使+轮融资

波音 777X 被曝推迟至 2027 年交付，预计将带来最高40亿美元损失

美国芯片设备出口限制升级！应用材料(AMAT.US)预计2026财年营收再减6亿美元

亚马逊推出全新自有品牌

晨光生物获得实用新型专利授权：“一种能够对甜味剂进行快速均匀混合的调配设备”

沉浸式参与科创逗太空SPACE雄安空天科训基地启动

科技护航道路交通安全：“鹰眼守护”正式发布！

韩媒：没想到，连韩国最强的三星集团，也招架不住中国芯片的

浙江元音科技创始人“家叔马丁”AI作品获中巴特别贡献

肾强一倍，人活百岁？男性最伤肾的5大行为，做的越多肾功能

7800mAh+2K屏！真我GT8挑战最强标准版，网友：来个长焦就完

宝明科技获得实用新型专利授权：“一种带挖孔结构的Mini

通杀8大豪门！足坛最强队诞生，横扫英超西甲3强，只有1队幸

红米K90跑分曝光！但性能不是全部，这两点才是更大的惊喜

第五代骁龙 8 至尊版：新一代“性能杰作”！

荣耀Magic 8 Pro基准测试曝光：Geekbench实测确认期顶级