克劳德十四行诗 4.6 现已推出。 Sonnet 课程是首次免费用户的默认课程

Anthropic的AI助手“克劳德”最新型号克劳德十四行诗 4.6但在2026年2月17日正式发布。编码、计算机操作、长式推理和智能体规划等通用技能得到了加强,并作为测试版100 万个令牌上下文窗口它还配备了

定价与 Sonnet 4.5 相同,API 为每百万输入代币 3 美元,每百万输出代币 15 美元。对于免费和专业计划用户,claude.ai现在可作为 Claude Cowork 的默认模型。它还可以通过 API、所有主要云平台和 Claude Code 获取。

编码性能:评价超过Opus模型

Sonnet 4.6 最大的增强之一是编码性能。在 Claude Code(Anthropic 的专业编码工具)的内部测试中,大约 70% 的用户更喜欢 Sonnet 4.6,而不是 Sonnet 4.5。

更值得注意的是 Anthropic 的顶级模型。与 Opus 4.5(2025 年 11 月发布)的比较然而,59% 的用户选择了 Sonnet 4.6。用户给出的反馈包括“减少过度设计”、“更准确地遵循指令”、“减少成功和幻觉的错误声明”以及“更可靠地完成多步骤任务”。他们因在更改代码之前正确阅读上下文并在不重复代码的情况下集成通用逻辑而受到赞扬。

前端代码和财务分析方面也有改进,多个用户指出,与之前的模型相比,视觉输出和布局/动画设计的质量有所提高。

提高计算机操作的准确性

2024 年 10 月,Anthropic 推出了业界第一个通用计算机操作模型功能。 Sonnet 本人承认,它最初是“实验性的、操作复杂且充满错误”,但 Sonnet 4.6 显示出显着的改进。

AI电脑操作标准基准操作系统世界我们将使用 Chrome、LibreOffice 和 VS Code 等真实软件评估数百个任务。 Sonnet 4.6 的早期用户在实际任务中表现出了接近人类水平的准确性,例如处理复杂的电子表格和跨多个浏览器选项卡填写多步骤 Web 表单。

请注意,计算机操作也存在风险。作为针对网站上隐藏恶意指令的“即时注入攻击”的对策,Sonnet 4.6 相比 Sonnet 4.5 显着提高了抗注入性,达到了与 Opus 4.6 相同的水平。

100 万个 token 长上下文窗口

测试版中提供的 100 万个代币上下文窗口能够在单个请求中包含整个代码库、冗长的合约和数十篇论文。据说 Sonnet 4.6 可以有效地在如此广泛的背景下进行推理,从而提高长期规划的准确性。

评估模拟业务运营基准在 Vending-Bench Arena 实验中,Sonnet 4.6 通过使用独特的策略,在模拟的前 10 个月内比竞争对手投入更多资金,并在最后阶段迅速转向盈利,从而显着超越竞争对手,从而超越了竞争对手。

API及周边工具更新

随着 Sonnet 4.6 的发布,Claude 开发平台推出了多项新功能和正式版本。

  • 适应性思维/扩展思维:可在 Claude 开发者平台上使用
  • 上下文压缩(测试版):当对话接近上下文限制时自动总结旧上下文,延长有效上下文长度
  • 增强的网络搜索/获取功能:运行自动过滤和处理搜索结果的代码,以仅保留上下文中的相关内容。提高响应质量和令牌效率
  • 代码执行、内存、编程工具调用、工具搜索和工具使用示例正式可用(GA)过渡到

Excel 中的 Claude(插件)添加了对 MCP 连接器的支持,使您可以直接从 Excel 中与 S&P Global、LSEG、PitchBook、Moody's 和 FactSet 等外部服务集成。适用于 Pro、Max、Team 和 Enterprise 计划。

此外,需要深度推理的任务Anthropic 表示,Opus 4.6 仍然是代码库重构、多代理工作流程协调以及需要高精度的处理的最佳选择。

还进行了安全评价

Anthropic 对所有新型号进行了安全评估,报告称 Sonnet 4.6 与现有的 Claude 型号一样安全,甚至更好。评估得出的结论是,该动物具有“热情、诚实、善于交际且常常幽默的性格,具有非常强烈的安全行为,并且没有高风险不一致的迹象。”详情官方系统卡发表于.

开发者的API模型标识符是claude-sonnet-4-6克劳德·阿皮伊您可以从这里开始使用它。