找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 38|回复: 4

[科技新闻] Anthropic 不小心泄露了自己的核武器

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-3-30 09:05 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp

昨天刷推看到 Fortune 一条消息,反复看了三遍。
Anthropic 的 CMS 配置出了问题,一篇还没发布的博客草稿直接暴露在公网上了。Fortune 记者先发现的,The Information 随后跟进验证。
泄露的内容是一个叫 Claude Mythos 的新模型。我当时第一反应是,又有人搞砸了。看完内容之后就不这么想了。
如果只是 Opus 4.6 的小版本更新,不至于闹这么大。问题是,这玩意不在现有的产品线里。Anthropic 现在的模型分三档:Haiku、Sonnet、Opus。Mythos 是 Opus 上面新开的一整层,内部代号 Capybara,水豚。
Anthropic 的发言人对 Fortune 确认了模型的存在,说这是一次 step change,阶梯式跨越,是他们迄今为止最强大的模型。
2.webp


让人停下来的不是跑分

泄露草稿里提到 Mythos 在编程、学术推理、网络安全等测试中大幅超过 Opus 4.6。
这部分没什么意外,新模型比旧模型强,正常。
让我反复看的是下面这段。
草稿里专门有一段话讲 Mythos 的网络安全能力。大意是:这个模型目前远超任何其他 AI 模型,它预示着一波即将到来的 AI 驱动漏洞利用浪潮,速度将远超防守方。
注意,这不是外界的评价,是 Anthropic 自己写的。一家 AI 公司在自己的发布文档里,白纸黑字说我们做出了一个破坏力超预期的东西。
所以他们做了一个几乎没先例的决定:先给网络安全防御机构用。 让防守的人先拿到能力,再考虑面向公众开放。同时强调运行成本极高,需要大幅优化效率才会广泛发布。
推特上有个博主@AYi_AInote的总结我觉得到位:一家 AI 公司在自己的官方发布稿里直白地告诉全世界,我造出了一个能力强到我自己都害怕的模型。这件事本身,比任何参数和跑分数字都更能说明这次跃升的分量。
3.webp

泄露事件本身

Anthropic 把原因归结为外部 CMS 工具的人为配置错误,否认和 Claude 或 AI 编码工具有关。
但同一批泄露的文档里还有一个彩蛋:Anthropic 计划在英国乡村一座 18 世纪庄园酒店举办闭门 CEO 峰会,给大型企业客户推销 AI。议程、嘉宾名单,全露了。
一次配置失误,最强模型和最机密的商务安排一起暴露。挺讽刺的,AI 公司要求用户信任自己的安全能力,结果自己的 CMS 先翻了车。
已经在灰度了

泄露发生后不到一天,推特上有人发现 Claude 网页端已经出现了 Mythos 5.0 Beta,标注 Larger and more intelligent。Claude Code 里也列出了 Mythos 5 experimental,标注 Next-gen model。
4.webp

Anthropic 明显加快了节奏,大概觉得既然已经曝光了不如直接推。
早期用户的反馈比较一致:编程和推理确实有感知提升。但具体强多少,还需要更多人跑评测。我自己还没拿到灰度,等拿到了会第一时间测。
这事意味着什么

说几个我自己的判断,不一定对。
这半年一直有 scaling 撞墙的讨论,Mythos 说明至少 Anthropic 还没撞到。Google 也在谈给 Anthropic 的数据中心提供资金,Financial Times 有报道。
方向很明确,继续往上堆。然后是安全。以前聊 AI 安全总觉得是学术界自嗨,离实际很远。但现在 Anthropic 自己说这模型的网安能力强到要先让防守方拿到,这就不是理论问题了。前沿实验室开始拿安全当真事了,至少 Anthropic 是这样。
还有一个变化比较微妙。以前 AI 公司比的是谁先发布、谁跑分高。现在 Anthropic 主动延迟发布、限制访问。模型强到一定程度之后,敢不敢发比能不能做更重要。
写在最后

AI 的军备竞赛到了一个新阶段:做出更强模型不再是唯一目标,做出来之后怎么处理,成了同样重要的问题。
我是洞见,下次见。
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-3-30 09:53 | 显示全部楼层
以后顶级大模型,安全管控优先级,必须和技术研发放在同一高度,缺一根本不敢落地
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-3-30 10:36 | 显示全部楼层
这模型网络安全能力爆表就像给黑客世界扔了颗深水炸弹,让防御方先用的策略堪比给火药桶配消防队,行业生态肯定要大洗牌了
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:729
发表于 2026-3-30 16:02 | 显示全部楼层
感谢分享
回复 支持 反对

使用道具 举报

  • 打卡等级:自成一派
  • 打卡总天数:127
发表于 2026-3-30 16:23 | 显示全部楼层
感谢分享!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-3-30 17:13 , Processed in 0.183827 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表