夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
楼主: 77898876

[科技新闻] 春节见?DeepSeek下一代模型:助力中国突破“算力芯片和内存”瓶颈

[复制链接]
  • 打卡等级:功行圆满
  • 打卡总天数:834
发表于 2026-2-11 12:53 | 显示全部楼层
造势一个月了,发出来吧
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:834
发表于 2026-2-11 14:00 | 显示全部楼层
@元宝 野村证劵是哪家
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:833
发表于 2026-2-11 15:29 | 显示全部楼层
梁文锋万年青史留名
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:834
 楼主| 发表于 2026-2-11 15:33 | 显示全部楼层
mHC的“数学护栏”是否会导致模型创造性下降呢? @元宝
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:834
发表于 2026-2-11 17:04 | 显示全部楼层
DeepSeek以前那个光学压缩用于长上下文挺好,可惜后面把千问引入,导致创新能力直下。其实还有更好方法。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )

GMT+8, 2026-6-20 12:30 , Processed in 0.229028 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表