walysj 发表于 2026-5-29 17:34

蒸馏回旋镖?Claude最新模型一开口:“我是DeepSeek”

AIPress(AI 普瑞斯)

Anthropic 前脚刚发布 Opus 4.8,后脚就有猛料。
多名用户通过 API 测试发现,如果用中文询问 Opus 4.8,它会回答"我是 DeepSeek "或者"我是通义千问"。



还有人反映,今天跟 Claude 正常聊天,突然就蹦出中文来了。


网友灵魂拷问:
Claude 这是蒸馏了 Qwen 和 DeepSeek???
有人认为,Claude Opus 4.8 蒸馏了太多 Qwen 等开源模型,导致自我认知出了问题,基本认为自己是 Qwen。


谁敢相信,就在几个月前,Anthropic 还在声讨中国大模型蒸馏 Claude。


是蒸馏还是数据污染?网友吵翻了

当然,也有人提出了不同解释。
有网友怀疑这可能是数据投毒,搞不好 Claude 在中文语境里的名字被污染成了 DeepSeek。
还有人从技术角度分析:"应该是语料库污染了。蒸馏要小模型蒸馏大模型才有用,否则会污染性能。"
有人解释,就有人回怼。


这名网友立刻被指责"模型也有饭圈吗"。
其实这件事无论真假,有趣的地方在于大家对 Anthropic 在行业内地位的认知已经形成了共识。很多人的第一反应是:Anthropic 不可能"向下蒸馏"。


还有人问为什么不蒸馏豆包。


双标?Anthropic 曾公开斥责蒸馏

在行业内,模型蒸馏是一种常见的训练方法,人工智能实验室通常用它来训练自己的模型。
API 开放的强模型,基本都会被同行采样、蒸馏;马斯克也曾承认 xAI 蒸馏过 OpenAI 模型。
但这次事件之所以讨论这么激烈,核心原因就是 Anthropic 的双标行为太明显了。
之前,Anthropic 对"蒸馏"这件事保持着非常强硬的立场。
2026 年 2 月 23 日,Anthropic 发布声明,公开指控 DeepSeek、月之暗面和 MiniMax 三家中国 AI 公司利用约 2.4 万个虚假账户与 Claude 进行超过 1600 万次交互,实施"工业规模的蒸馏攻击"。
当时来看,Anthropic 似乎永远不会做出"蒸馏"这件事。它把自己塑造成了受害者,把中国 AI 公司描绘成窃取知识产权的一方。

有网友调侃,Anthropic 的"蒸馏"方式叫 "工业化训练"。


天下模型一大"蒸"

网友总结:现在的大模型已经是你中有我,我中有你了。




天下语料共一石,今天你的数据里混着我的幻觉,明天我的语料里藏着你的水印。
好一个天下模型一大"蒸"。



这话虽然调侃,但确实反映了行业现状。
在 AI 大模型领域,知识产权边界本来就模糊。每家公司都在用海量互联网数据训练,这些数据里必然包含竞争对手模型生成的内容。你抓我蒸馏,我抓你污染,最后谁也说不清楚。
截至发稿,Anthropic 方面暂无回应。

voo 发表于 2026-5-29 19:07

如果Claude真的用了国产模型的数据,那它自己训练时怎么区分哪些是原创内容、哪些是蒸馏来的?这种混合训练会不会让所有模型越来越像?

镜花水月 发表于 2026-5-29 19:12

朋友是做法律咨询的,他说这类“反向蒸馏”争议关键在于能否举证。行业现在缺一个公开可验证的模型来源溯源机制,不然永远是你说我抄、我说我没抄,最后只能靠舆论判定。

oppledr 发表于 2026-5-29 19:14

图解新闻:一图读懂

oppledr 发表于 2026-5-29 19:30

笑死了,蒸馏就是学生学老师,哪有老师跑去偷师学生的?老师比学生厉害,学生模型才能逼近老师,哪有让老师跑去蒸馏学生的?所以肯定是中文语料污染

superzhzh 发表于 2026-5-29 19:40

都是闭源蒸馏开源的

xuye004 发表于 2026-5-29 19:47

自有大儒为我们辩经,自有大辱给它们念经[哭笑]

meto 发表于 2026-5-29 21:13

用我侄子的话说:这能一样吗

wifai 发表于 2026-5-29 21:30

好比 你们年级第一 高考抄一个大榜200开外的

—じ☆ve人生— 发表于 2026-5-29 21:47

这也挺好的,全世界模型一起进步,大家互相蒸,这样比到最后变成成本比拼、电力比拼
页: [1] 2
查看完整版本: 蒸馏回旋镖?Claude最新模型一开口:“我是DeepSeek”