夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 15|回复: 3

[数码资讯] 腾讯混元提出 Stem 稀疏注意力算法,首字延迟降低 3.6 倍

[复制链接]
  • 打卡等级:功行圆满
  • 打卡总天数:830
发表于 2026-6-6 09:29 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
腾讯混元今日宣布提出 Stem 稀疏注意力算法,已被机器学习顶会 ICML-26 收录。



官方表示,Stem 稀疏注意力算法从“因果信息流”重新审视块级稀疏,用 Token 位置衰减(TPD)和输出感知度量(OAM)两大创新,仅用 25% 算力就逼近稠密注意力的精度。配套的 HPC 算子库则将这份理论加速比真正转化为端到端的实测性能。



▲ Stem 在 Hy3 preview(W8A8-FP8)上更贴近生产环境的真实落地数据
根据 Stem 算法 × HPC 算子的全栈加速方案,算法层面,Stem 通过 Token 位置衰减(TPD)和输出感知度量(OAM)实现 25% 预算下的近无损精度;算子层面,HPC 开源的 Stem+BSA 算子将稀疏收益转化为真实硬件加速,128K 上下文下首字延迟降低 3.6 倍。
  • 打卡等级:已臻大成
  • 打卡总天数:525
发表于 2026-6-6 10:00 | 显示全部楼层
楼谢谢主分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:817
发表于 2026-6-6 10:31 | 显示全部楼层
感谢分享。
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:832
发表于 2026-6-6 10:56 | 显示全部楼层
感谢分享!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )

GMT+8, 2026-6-6 11:03 , Processed in 0.366063 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表