DeepSeek-V3.2-Exp一经推出,便在产业界与开发者圈子里引发热烈反响,不少国内企业纷纷第一时间宣布完成DeepSeek-V3.2-Exp的适配和上线。
华为计算公众号发文宣布,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp Day 0(第零天)支持,并面向开发者开源所有推理代码和算子实现。DeepSeek-V3.2-Exp在昇腾设备上128K长序列输出,能够保持TTFT(首token输出耗时)低于2秒、TPOT(每token输出耗时)低于30毫秒的推理生成速度。