Claude「最香」模型发布，速度翻倍价格大砍，编程能力直逼 GPT-5

就在刚刚，Anthropic 发布了 Claude Haiku 4.5。

先简单科普一下，Claude 家族有三个不同参数量级的模型：Claude Opus（大杯）、Sonnet（中杯）和 Haiku（小杯）。

这次更新最大的看点是，小杯 Claude Haiku 4.5 在模型性能保持高水准的同时，速度更快、价格更便宜了。

五个月前，Claude Sonnet 4 还是最先进的模型之一。现在新出的 Haiku 4.5 在编码性能上几乎和它打平手，但价格只要三分之一，速度还翻了两倍多。

▲Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks

具体来说，在用于衡量 AI 编码能力的测试集 SWE-bench Verified 上，Haiku 4.5 取得了 73% 的成绩，什么概念？直接跟 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 站在同一水平线上。

在某些任务比如操控电脑方面，Haiku 4.5 甚至反杀了老大哥 Sonnet 4。

对于需要 AI 处理实时、低延迟任务的场景——比如聊天助手、客服代理或结对编程助手，Haiku 4.5 兼具高智能和出色速度，能带来更好的体验。

使用 Claude Code 的开发者也会发现，Haiku 4.5 让整个编程过程——从多智能体协作到快速原型开发——都变得更灵敏高效。

当然，两周前发的 Sonnet 4.5 依然是 Anthropic 的旗舰模型，归属全球编程模型第一档次。但 Haiku 4.5 提供了另一个选项：性能接近顶配，价格却亲民得多。

而且模型玩法更野了，Sonnet 4.5 可以把复杂问题拆成 N 个小任务，然后指挥一堆 Haiku 4.5 并行开工，这配合相当默契。

Anthropic 对 Haiku 4.5 进行了详细的安全性和对齐性测试。

结果显示，该模型的不良行为发生率较低，且比前代 Haiku 3.5 的对齐性显著提高。在自动化对齐评估中，Haiku 4.5 的总体偏离行为比 Sonnet 4.5 和 Opus 4.1 都更少。

也就是说，它目前是 Anthropic 家最安全的模型。

▲Comparison table of frontier models across popular benchmarks

至于价格嘛…Haiku 4.5 的定价为：每百万输入 token 1 美元，每百万输出 token 5 美元。

对比来看，GPT-5 mini 约为每百万输入 0.25 美元、输出 2.5 美元，Google 的 Gemini 2.5 Flash 价格差不多。也就是说，Haiku 4.5 的价格大约是 GPT-5 mini 或 Flash 的 4 倍。

不过跟 Sonnet 4.5 比，它便宜了约三倍，性能却几乎没差，这对开发者来说算是降本增效了。

但有一说一，数学不是它的强项。

知名博主 Dan Shipper 试用后发现，Haiku 在算术上有点… 迷糊。

比如在测试 Uber 账单的例子里，Haiku 虽然完美找出了所有相关邮件，但算总额时直接翻车。更尴尬的是，指出错误后它承认了——然后转头又犯了同样的错

Dan Shipper 给出的中肯评价是：

如果你是开发者或创业者，正在用 Sonnet 4.5 构建复杂的智能代理应用，现在可以考虑切换到 Haiku。你能节省大量成本，而性能损失几乎可以忽略。

如果你目前使用的是 Gemini 2.5 Flash 或 GPT-5 mini，建议试试 Haiku。虽然价格更高一些，但在需要调用工具和保持自主性的场景中，它的表现更好。