Anthropic刚警告AI太危险,转头就发布了更强的Claude Fable 5

Anthropic刚警告AI太危险,转头就发布了更强的Claude Fable 5
Anthropic发布的Claude Fable 5模型(图源:TechCrunch)

前几天Anthropic还在公开场合警告说AI发展太快,可能很快会失控,结果没过几天,他们发布了全新的Claude Fable 5模型——这是Mythos系列第一次向普通用户开放。这种操作放在任何人身上都会觉得矛盾,但这就是当下AI行业的真实写照:一边喊着危险,一边拼命往前冲。

安全风险是真担心,还是公关话术?

Fable 5确实强。Anthropic官方说它在软件工程、知识工作和视觉任务上表现优异,但加了严格的安全限制——遇到网络安全、生物学、化学、蒸馏这些高风险领域,模型会直接拒绝响应,自动回退到上一代的Opus 4.8。这种做法听起来很负责,但问题是:如果用户真的想用来干坏事,换个问法是不是就能绕过?

Anthropic说他们对Fable 5做了超过1000小时的越狱攻击测试,内部和外部红队都没找到通用越狱方法。这个说法可信度有多少,外界没法验证,只能选择相信。但更值得关注的是另一条政策:所有使用Fable 5的用户,无论之前是否签署了零数据保留协议,现在都必须接受30天的数据保留。Anthropic说这些数据只用于防御新型攻击和减少误判,不会拿去训练模型。

这种”用安全换数据”的逻辑,很可能会成为行业先例。以后的强大模型,可能都得接受类似的条件才能用。

价格贵得让很多企业犹豫

Fable 5的定价是每百万输入token 10美元,每百万输出token 50美元,是Opus 4.8的两倍。这个价格意味着什么?如果你每天用AI处理大量任务,月底的账单会非常难看。Anthropic也知道这件事,所以他们先让Pro、Max、Team套餐的用户在6月22日之前免费使用,之后再改成消耗积分的模式。

企业的反应分化很明显。购物奖励平台Rakuten觉得值,他们说Fable 5会”反思并验证自己的工作成果”,高度自主的运营能力匹配这个价格。但更多企业已经在抱怨AI成本太高,有些甚至提前花完了年度AI预算。Fable 5只会让这件事更严重。

第三方测试结果确实不错

抛开价格和安全的争议,Fable 5的能力确实强。分析公司Hex说它是第一个在复杂长周期分析任务基准测试中拿到90%得分的模型。氛围编码平台Base44说它更擅长”一次性生成完整应用”,工具调用能力很出色。AI工作空间平台Genspark说它在UI设计、游戏编码这些任务上明显比其他模型好。

这些测试结果说明,Fable 5不是靠营销吹出来的,确实有能力上的提升。但能力提升和安全风险之间的平衡,Anthropic还没有给出让人完全信服的答案。


[图片] 原文来源:Anthropic’s Claude Fable 5 is a version of Mythos the public can access today

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注