weili0677 发表于 2026-2-11 12:53

造势一个月了,发出来吧[哭笑]

hnn 发表于 2026-2-11 14:00

@元宝 野村证劵是哪家

qqwa1234 发表于 2026-2-11 15:29

梁文锋万年青史留名

77898876 发表于 2026-2-11 15:33

mHC的“数学护栏”是否会导致模型创造性下降呢? @元宝

wifai 发表于 2026-2-11 17:04

DeepSeek以前那个光学压缩用于长上下文挺好,可惜后面把千问引入,导致创新能力直下。其实还有更好方法。[哈哈]
页: 1 [2]
查看完整版本: 春节见?DeepSeek下一代模型:助力中国突破“算力芯片和内存”瓶颈