Anthropic 发布 Claude Fable 5:最强模型首次公开,附带安全护栏
Anthropic 于周二推出其最强大模型 Claude Fable 5,这是此前仅限合作伙伴的 Mythos 模型的公开版本,在性能领先的同时引入严格安全限制和数据保留政策,标志着前沿 AI 走向公众的关键一步。
Anthropic 首次将其最强大的 AI 模型向公众开放,但设置了安全护栏。周二,该公司推出了 Claude Fable 5,这是其 Mythos 模型的第一个公开版本。
Anthropic 表示,Fable 5 在软件工程、知识工作和视觉方面表现出色,但带有严格的安全限制。在网络安全、生物学、化学和蒸馏等高风险领域,该模型会阻止响应并回退到 Claude Opus 4.8。
Mythos 于四月份作为预览版推出,最初因网络安全问题仅限少数合作伙伴使用。上周,Anthropic 将访问权限扩大到 15 个国家的数百个组织,再次重点关注管理关键基础设施的组织。
现在,任何人都可以通过 Anthropic 的 Claude API 和基于消费的企业计划获得该技术的一个版本。订阅访问将分阶段推出:截至 6 月 22 日,Fable 5 免费包含在 Pro、Max、Team 和基于座位的 Enterprise 计划中。
6 月 23 日,Anthropic 将从这些计划中撤下 Fable 5,要求使用积分,并计划尽快将其恢复为标准订阅功能。Anthropic 还向已获准访问高级模型的组织部署了名为 Mythos 5 的新版本。
Fable 的推出正值 Anthropic 准备与 OpenAI 和埃隆·马斯克的 SpaceX 一起进入公开市场之际。
此前,这家 AI 公司曾呼吁全球主要 AI 实验室为前沿 AI 开发建立协调一致的刹车踏板。Anthropic 警告称,系统发展如此之快,以至于它们可能很快实现递归自我改进(RSI),在没有人类干预的情况下自主改进。
担心 Mythos 级模型可能落入坏人手中,Anthropic 表示在发布 Fable 5 之前,已通过越狱尝试对其分类器进行了压力测试。“内部,我们运行了一个外部漏洞赏金计划,在超过 1000 小时的测试中没有出现通用越狱。
然后,我们与外部红队组织合作,他们也未能找到通用越狱。”尽管如此,仍可能存在新型攻击。因此,随着 Fable 5 和 Mythos 5 的发布,Anthropic 表示将要求所有流量保留 30 天,即使企业之前有零保留协议。
Anthropic 表示不会将这些数据用于训练,仅用于“防御复杂和新颖的攻击,包括新的越狱”以及“识别和减少误报”。该政策可能开创行业先例,即访问日益强大的模型伴随着作为安全措施的强制数据保留政策。
对于继续使用该模型的用户,并非每个问题都会得到 Fable 5 的回答。Anthropic 表示,Fable 必须回退到 Opus 4.8 的情况很少见。
早期数据显示,至少 95% 的 Fable 会话完全由模型自身响应运行。在第三方测试中,分析公司 Hex 在一份声明中表示,Fable 是第一个在其复杂、长期运行分析任务的核心分析基准上达到 90% 的模型。
Hex 说:“在最难的问题上,它表现出强大的判断力和对细微差别的关注。”Vibe 编码平台 Base44 在一份声明中指出,Fable 更擅长“一次性完成完整应用”,并且具有出色的工具调用能力。
AI 驱动的工作空间和代理平台 Genspark 表示,Fable 在评估中击败了所有其他模型,在 UI 设计和游戏编码等任务上表现明显更好。
Fable 5 和 Mythos 5 的定价均为每百万输入 token 10 美元,每百万输出 token 50 美元,是 Opus 4.8 价格的两倍。仅这一价格就可能阻碍广泛使用。许多企业在看到账单或提前用完年度 AI 预算后,对 AI 成本越来越挑剔。
像 Opus 4.8 这样的高级模型可能加剧这些问题,其高级推理能力可将单个请求拆分为多个任务。Anthropic 表示,预计 Fable 5 的需求将非常高且难以预测。事实上,有些人,如购物奖励平台乐天,可能认为其价值值得这个价格。
乐天在一份声明中说:“在最高努力下,Fable 会反思并验证自己的工作。”
“对我们来说,这就是高度自主操作成为可能的原因——额外的思考本身就会得到回报。”
本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。