夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 91|回复: 2

[综艺大观] Anthropic“阴谋”曝光:被指故意阉割旧模型

[复制链接]
  • 打卡等级:功行圆满
  • 打卡总天数:805
发表于 2026-5-31 13:07 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp




  新智元报道  

2.webp

【新智元导读】外媒重磅爆料!Anthropic疑似复制「降速门」,在新Opus 4.8发布前暗中阉割旧Claude性能,只为让用户一用新模型就觉得「神级」。曾经高举AI安全大旗的理想主义者,如今在商业化祭坛上亲手撕掉最后一层遮羞布。


Anthropic欺人太甚!


外媒爆出Anthropic「计划性淘汰」丑闻:为了推销新模型Opus 4.8,Anthropic疑似在暗影中偷偷阉割了旧模型的性能。


3.webp




另一边,则是新旗舰Claude Opus 4.8仓促发布,bug不断,token狂飙!


4.webp




Claude的用户,一觉醒来,肠子悔青了。


5.webp




而在API调用中,Opus 4.8集体「认亲」国产Qwen,陷入了一场前所未有的身份坍塌。


6.webp




那个曾经标榜「AI安全」、带着理想主义光环的Anthropic,正站在「商业化」的祭坛上,亲手撕掉自己的最后一层遮羞布。


7.webp




8.webp






9.webp


不求最好,但要最贵


Claude模型是不是最厉害,还有争议,但Anthropic的AI公认地贵。


10.webp




Claude在算力上已落人一步,加上Anthropic即将IPO,或许Opus 4.8操之过急!


11.webp




12.webp


Anthropic「阴谋」曝光:被指故意阉割旧模型


在消费电子领域,苹果曾因「降速门」被推上风口浪尖——通过系统更新让旧iPhone变慢,从而「诱导」用户购买新品。


13.webp




而现在,Anthropic把阴影笼罩在了大模型领域。


Chapter CEO指控:「Anthropic有点像是在照搬苹果公司的做法:在新模型发布之前,故意降低旧模型的质量,好让新模型用起来感觉更棒。」




此前,用户发现旧版Claude的性能正在无声无息地缩水。


14.webp




Anthropic先是试图让大家觉得4.7表现很好,但后来才承认(或者说他们最终承认)4.7存在算力方面的问题。


15.webp




Anthropic的公关辞令将其美化为「努力水平」(Effort Level)的调整。


但在从业者看来,这是一个冷酷的算力经济学算计。


大模型的智力,本质上是昂贵GPU算力的函数。


为了让新推出的Opus 4.8在跑分榜上惊艳世界,Anthropic必须腾出极其有限的H100算力池。


于是,旧模型被赶出了性能卓越的「精装修机房」,塞进了架构更廉价、推理延迟更高、甚至量化精度更低的「数字贫民窟」。


这种「AI缩水式通胀(Shrinkflation)」比手机降速更危险。


16.webp




手机变慢只是让你打开微信多等三秒。


而AI变笨,意味着你建立在其之上的商业决策、代码逻辑和法律研判,正建立在一个随时会坍塌的流沙地基上。


17.webp






18.webp


Opus 4.8降智了,蒸馏Qwen?


Opus 4.8这个版本,总感觉哪里不太对劲,就像是在匆忙修补4.7的漏洞。


19.webp




Reddit上,一位Claude德语用户变得很痛苦:


突然之间,它要么语法不对,要么会冒出完全莫名其妙的句子和词语,根本说不通。


我试着通过修改系统提示词来修正,但到目前为止效果不大。尤其是在「深度思考」模式下,几乎没法用——耗时太长,考虑的选项也太多。


他寻求意见:


有没有什么设置可以调整,让它「重回正轨」?


在基准测试中,Opus 4.8都碾压对手。


但残酷的现实是,LLM根本无法通过基准测试获得有用的信号,来帮你判断它们是否能完成你希望它们做的工作。


20.webp




或许,好用的时候是真好用,但大部分并非如此!


21.webp




Opus 4.7用20秒能处理的任务,Opus 4.8要5分钟!


22.webp




有的Opus 4.8一直编造说自己被提示词注入攻击了,还说代码被破坏了。


然后,它意识到自己在幻觉,继续运行,却又开始怀疑有人在暗中破坏它。


23.webp




有的Opus 4.8持续不断、反复运行同一个测试。


24.webp




有的Opus 4.8突然降智。


25.webp




Claude Opus 4.8已经变得过于对抗性了,「智能有余,平衡不足」,导致严重结果:


不友好的体验、浪费时间、误导性的指导。它扼杀想法,而非在此基础上进行建设。


26.webp




27.webp


Claude Opus 4.8自称Qwen,Anthropic也搞蒸馏?


这次的Claude Opus 4.8居然认错祖宗!


如果你用中文提问,Opus 4.8会自称是Qwen。


28.webp


29.webp




为什么呢?


一种可能的解释是Opus蒸馏Qwen。


30.webp






还有一种解释是数据反向污染


在训练Opus 4.8版本的语料库中,已经充斥了大量由Qwen、DeepSeek等开源模型生成的中文内容。


当这些开源模型以极高的效率和极大的规模占领互联网语料库时,即便是高傲的Anthropic,也不得不吞下这些被开源AI重新「洗」过的二手数据。


这不再是「谁偷谁」的问题,而是数字世界的近亲繁殖。所有的闭源堡垒,最终都会在开源海洋的渗透下,变成对方的样子。


31.webp


第一次智能体让我这么生气


这次,Anthropic似乎彻底搞砸了Opus 4.8升级,情商带来的伤害比智商似乎不遑多让。


32.webp




就连Claude Code的Harness也修不好它。


如果不使用Claude Code,网友Sam Cymbaluk直言:在日常聊天模式下,Opus 4.8蠢得要命!


33.webp




Opus 4.8变得特别顽固。


Opus 4.8正在使用的服务器信息,但即使用户明确指出了正确的对话,它仍然固执地沿用错误的配置。


34.webp




它最终承认了错误,却还是继续使用错误的服务器!


AI研究人员、哈佛博士、滑铁卢大学助理教授Yuntian Deng,第一次被智能体如此愤怒。


35.webp




如果和Claude聊聊科学,它的毒舌绝对会给你精神暴击。


36.webp




相比之下,4.7简直是个阳光小可爱。


37.webp




大模型公司的护城河,不只是参数、算力和榜单。


更是用户相信它不会在暗处缩水、不会在关键时刻失控、不会为了商业节奏牺牲体验的那份确定性。


一旦这份确定性被打穿,再强的模型,也会变成一门危险的生意。


参考资料:

https://x.com/theinformation/status/2060783533564612887
https://x.com/yuntiandeng/status/2060545768054759705
https://x.com/hagen_hu/status/2060870150388072853https://x.com/jun_song/status/2060166645583343878
编辑:大卫
  • 打卡等级:功行圆满
  • 打卡总天数:805
发表于 2026-5-31 13:31 | 显示全部楼层
@元宝
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:805
发表于 2026-5-31 15:15 | 显示全部楼层
@元宝 临近 IPO 的 Anthropic,用算力调配、模型降级做商业权衡,这会不会成为大模型商业化的普遍套路?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )

GMT+8, 2026-6-1 07:41 , Processed in 0.783905 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表