夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 595|回复: 10

[科技新闻] DeepSeek-V3.2-Exp模型正式发布,寒武纪火速完成适配

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-29 22:29 来自手机 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp


9月29日晚间,国产人工智能(AI)技术厂商深度求索(DeepSeek)宣布正式发布DeepSeek-V3.2-Exp模型,正如其名称所示的那样,这是一个基于V3.2实验性(Experimental)的版本。
作为迈向新一代架构的中间步骤,Deepseek V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。
据介绍,DeepSeek Sparse Attention(DSA)稀疏注意力机制首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

2.webp


为了严谨地评估引入稀疏注意力带来的影响,我们特意把 DeepSeek-V3.2-Exp 的训练设置与 V3.1-Terminus 进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。

3.webp


目前,Deepseek官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时 API 大幅度降价。
值得注意的是,在DeepSeek-V3.2-Exp模型发布的同一天,国产AI芯片大厂寒武纪就宣布,已同步实现对DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。
目前,开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。
寒武纪表示,公司一直重视芯片和算法的联合创新,致力于以软硬件协同的方式,优化大模型部署性能,降低部署成本。
此前,寒武纪对DeepSeek系列模型进行了深入的软硬件协同性能优化,达成了业界领先的算力利用率水平。
针对本次的DeepSeek-V3.2-Exp新模型架构,寒武纪通过Triton算子开发实现了快速适配,利用BangC融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。
寒武纪表示,依托DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。
编辑:芯智讯-浪客剑
  • 打卡等级:自成一派
  • 打卡总天数:199
发表于 2025-9-29 23:57 | 显示全部楼层
发布
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:383
发表于 2025-9-30 06:13 | 显示全部楼层
good !
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:647
发表于 2025-9-30 06:21 来自手机 | 显示全部楼层
也不知道DeepSeek和国外模型比到底怎么样

点评

相当有一拼了 你头像是谁  详情 回复 发表于 2025-9-30 07:29
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:688
发表于 2025-9-30 07:29 | 显示全部楼层
MyDoUwAnTsMilK 发表于 2025-9-30 06:21
也不知道DeepSeek和国外模型比到底怎么样

相当有一拼了
你头像是谁

点评

好多年前某个论坛里找到的一个照片,记不清了,感谢认可  详情 回复 发表于 2025-10-6 06:49
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:405
发表于 2025-9-30 08:08 | 显示全部楼层
精品文章,优秀!
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:528
发表于 2025-9-30 08:23 | 显示全部楼层
期待更强的DeepSeek
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:481
发表于 2025-9-30 10:01 | 显示全部楼层
谢谢楼主分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:自成一派
  • 打卡总天数:213
发表于 2025-10-1 00:53 | 显示全部楼层
感谢分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:自成一派
  • 打卡总天数:331
发表于 2025-10-1 10:51 | 显示全部楼层
牛X,支持...
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-4-19 11:21 , Processed in 0.725021 second(s), 11 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表