Anthropic 不小心泄露了自己的核武器

镜花水月 · 发表于 2026-3-30 09:05

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

昨天刷推看到 Fortune 一条消息，反复看了三遍。
Anthropic 的 CMS 配置出了问题，一篇还没发布的博客草稿直接暴露在公网上了。Fortune 记者先发现的，The Information 随后跟进验证。
泄露的内容是一个叫 Claude Mythos 的新模型。我当时第一反应是，又有人搞砸了。看完内容之后就不这么想了。
如果只是 Opus 4.6 的小版本更新，不至于闹这么大。问题是，这玩意不在现有的产品线里。Anthropic 现在的模型分三档：Haiku、Sonnet、Opus。Mythos 是 Opus 上面新开的一整层，内部代号 Capybara，水豚。
Anthropic 的发言人对 Fortune 确认了模型的存在，说这是一次 step change，阶梯式跨越，是他们迄今为止最强大的模型。

让人停下来的不是跑分

泄露草稿里提到 Mythos 在编程、学术推理、网络安全等测试中大幅超过 Opus 4.6。
这部分没什么意外，新模型比旧模型强，正常。
让我反复看的是下面这段。
草稿里专门有一段话讲 Mythos 的网络安全能力。大意是：这个模型目前远超任何其他 AI 模型，它预示着一波即将到来的 AI 驱动漏洞利用浪潮，速度将远超防守方。
注意，这不是外界的评价，是 Anthropic 自己写的。一家 AI 公司在自己的发布文档里，白纸黑字说我们做出了一个破坏力超预期的东西。
所以他们做了一个几乎没先例的决定：先给网络安全防御机构用。 让防守的人先拿到能力，再考虑面向公众开放。同时强调运行成本极高，需要大幅优化效率才会广泛发布。
推特上有个博主@AYi_AInote的总结我觉得到位：一家 AI 公司在自己的官方发布稿里直白地告诉全世界，我造出了一个能力强到我自己都害怕的模型。这件事本身，比任何参数和跑分数字都更能说明这次跃升的分量。

泄露事件本身

Anthropic 把原因归结为外部 CMS 工具的人为配置错误，否认和 Claude 或 AI 编码工具有关。
但同一批泄露的文档里还有一个彩蛋：Anthropic 计划在英国乡村一座 18 世纪庄园酒店举办闭门 CEO 峰会，给大型企业客户推销 AI。议程、嘉宾名单，全露了。
一次配置失误，最强模型和最机密的商务安排一起暴露。挺讽刺的，AI 公司要求用户信任自己的安全能力，结果自己的 CMS 先翻了车。
已经在灰度了

泄露发生后不到一天，推特上有人发现 Claude 网页端已经出现了 Mythos 5.0 Beta，标注 Larger and more intelligent。Claude Code 里也列出了 Mythos 5 experimental，标注 Next-gen model。

Anthropic 明显加快了节奏，大概觉得既然已经曝光了不如直接推。
早期用户的反馈比较一致：编程和推理确实有感知提升。但具体强多少，还需要更多人跑评测。我自己还没拿到灰度，等拿到了会第一时间测。
这事意味着什么

说几个我自己的判断，不一定对。
这半年一直有 scaling 撞墙的讨论，Mythos 说明至少 Anthropic 还没撞到。Google 也在谈给 Anthropic 的数据中心提供资金，Financial Times 有报道。
方向很明确，继续往上堆。然后是安全。以前聊 AI 安全总觉得是学术界自嗨，离实际很远。但现在 Anthropic 自己说这模型的网安能力强到要先让防守方拿到，这就不是理论问题了。前沿实验室开始拿安全当真事了，至少 Anthropic 是这样。
还有一个变化比较微妙。以前 AI 公司比的是谁先发布、谁跑分高。现在 Anthropic 主动延迟发布、限制访问。模型强到一定程度之后，敢不敢发比能不能做更重要。
写在最后

AI 的军备竞赛到了一个新阶段：做出更强模型不再是唯一目标，做出来之后怎么处理，成了同样重要的问题。
我是洞见，下次见。

—じ☆ve人生— · 发表于 2026-3-30 09:53

以后顶级大模型，安全管控优先级，必须和技术研发放在同一高度，缺一根本不敢落地

ress · 发表于 2026-3-30 10:36

这模型网络安全能力爆表就像给黑客世界扔了颗深水炸弹，让防御方先用的策略堪比给火药桶配消防队，行业生态肯定要大洗牌了

hcyw2008 · 发表于 2026-3-30 16:02

感谢分享

chris99 · 发表于 2026-3-30 16:23

感谢分享！

账号		自动登录	找回密码
密码			注册

[科技新闻] Anthropic 不小心泄露了自己的核武器

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。