精选· 重要性 5/5

Anthropic 发布 Claude Fable 5：最强模型首次公开，附带安全护栏

TechCrunch — AI·1 天前·Rebecca Bellan·约 4 分钟阅读

中文导读

Anthropic 于周二推出其最强大模型 Claude Fable 5，这是此前仅限合作伙伴的 Mythos 模型的公开版本，在性能领先的同时引入严格安全限制和数据保留政策，标志着前沿 AI 走向公众的关键一步。

Anthropic 首次将其最强大的 AI 模型向公众开放，但设置了安全护栏。周二，该公司推出了 Claude Fable 5，这是其 Mythos 模型的第一个公开版本。

Anthropic 表示，Fable 5 在软件工程、知识工作和视觉方面表现出色，但带有严格的安全限制。在网络安全、生物学、化学和蒸馏等高风险领域，该模型会阻止响应并回退到 Claude Opus 4.8。

Mythos 于四月份作为预览版推出，最初因网络安全问题仅限少数合作伙伴使用。上周，Anthropic 将访问权限扩大到 15 个国家的数百个组织，再次重点关注管理关键基础设施的组织。

现在，任何人都可以通过 Anthropic 的 Claude API 和基于消费的企业计划获得该技术的一个版本。订阅访问将分阶段推出：截至 6 月 22 日，Fable 5 免费包含在 Pro、Max、Team 和基于座位的 Enterprise 计划中。

6 月 23 日，Anthropic 将从这些计划中撤下 Fable 5，要求使用积分，并计划尽快将其恢复为标准订阅功能。Anthropic 还向已获准访问高级模型的组织部署了名为 Mythos 5 的新版本。

Fable 的推出正值 Anthropic 准备与 OpenAI 和埃隆·马斯克的 SpaceX 一起进入公开市场之际。

此前，这家 AI 公司曾呼吁全球主要 AI 实验室为前沿 AI 开发建立协调一致的刹车踏板。Anthropic 警告称，系统发展如此之快，以至于它们可能很快实现递归自我改进（RSI），在没有人类干预的情况下自主改进。

担心 Mythos 级模型可能落入坏人手中，Anthropic 表示在发布 Fable 5 之前，已通过越狱尝试对其分类器进行了压力测试。“内部，我们运行了一个外部漏洞赏金计划，在超过 1000 小时的测试中没有出现通用越狱。

然后，我们与外部红队组织合作，他们也未能找到通用越狱。”尽管如此，仍可能存在新型攻击。因此，随着 Fable 5 和 Mythos 5 的发布，Anthropic 表示将要求所有流量保留 30 天，即使企业之前有零保留协议。

Anthropic 表示不会将这些数据用于训练，仅用于“防御复杂和新颖的攻击，包括新的越狱”以及“识别和减少误报”。该政策可能开创行业先例，即访问日益强大的模型伴随着作为安全措施的强制数据保留政策。

对于继续使用该模型的用户，并非每个问题都会得到 Fable 5 的回答。Anthropic 表示，Fable 必须回退到 Opus 4.8 的情况很少见。

早期数据显示，至少 95% 的 Fable 会话完全由模型自身响应运行。在第三方测试中，分析公司 Hex 在一份声明中表示，Fable 是第一个在其复杂、长期运行分析任务的核心分析基准上达到 90% 的模型。

Hex 说：“在最难的问题上，它表现出强大的判断力和对细微差别的关注。”Vibe 编码平台 Base44 在一份声明中指出，Fable 更擅长“一次性完成完整应用”，并且具有出色的工具调用能力。

AI 驱动的工作空间和代理平台 Genspark 表示，Fable 在评估中击败了所有其他模型，在 UI 设计和游戏编码等任务上表现明显更好。

Fable 5 和 Mythos 5 的定价均为每百万输入 token 10 美元，每百万输出 token 50 美元，是 Opus 4.8 价格的两倍。仅这一价格就可能阻碍广泛使用。许多企业在看到账单或提前用完年度 AI 预算后，对 AI 成本越来越挑剔。

像 Opus 4.8 这样的高级模型可能加剧这些问题，其高级推理能力可将单个请求拆分为多个任务。Anthropic 表示，预计 Fable 5 的需求将非常高且难以预测。事实上，有些人，如购物奖励平台乐天，可能认为其价值值得这个价格。

乐天在一份声明中说：“在最高努力下，Fable 会反思并验证自己的工作。”

“对我们来说，这就是高度自主操作成为可能的原因——额外的思考本身就会得到回报。”

原文出处

本文为机器翻译辅以 AI 润色，仅供参考。原始事实以原文为准。

相关阅读