dsfgdsg
发表于 2025-8-24 14:09
FP32传输一个数据得占4个字节,FP8只用1个字节就搞定了。在同样的电量下能训练更大的模型。DeepSeek用它优化后,效果特别明显,大规模神经网络的推理速度快太多了。
—じ☆ve人生—
发表于 2025-8-24 14:09
摩尔的MUSA架构原生支持硬件FP8张量加速计算,这是明显的技术升级。国产芯片过去主要支持的是FP16和INT8,现在大模型发展飞快,FP8的需求也上来了,促使国产厂商也要加快对技术的升级。
ycp123
发表于 2025-8-24 14:09
现在像英伟达、AMD这些国际大厂,还有DeepSeek,都开始搞FP8相关的验证了。大家好像已经有共识了,FP8就是继FP32和FP16之后,精度升级的下一个方向。FP8对大模型训练来说,既省时间又省钱,特别实用。不过FP8现在的软件配套和开发工具还不太给力,估计等短板补上就是通用标准了。
qqwa1234
发表于 2025-8-24 14:09
感觉DeepSeek这波操作还是有格局的,点明了适配下一代国产芯片,给国产算力打了一剂强心针,要是真能借此推动国产芯片发展,那对国产芯片的未来真的功不可没。
922b3eb6
发表于 2025-8-24 14:10
FP8这技术前景应该不错,不过跟风吹也没必要,还是要客观点看。生态不完善、技术有局限还都是问题。希望能看到国产芯片借助FP8打破国外垄断吧!大模型训练的成本能降下来,咱普通人接触AI的门槛也能跟着降低不少。
wakeman
发表于 2025-8-24 14:21
既然Deepseek这次验证了FP8在大规模模型上的可行性,就显示了在FP8这一标准乃至更高精度上去做研究或做训练,已经形成了一个重要方向,值得通过进一步实践来证实其实效性。
神隐之左手
发表于 2025-8-24 14:32
DeepSeek 超算能力➕量化模型➕私募高手(即时调整)=无尽的财富
gzcom520
发表于 2025-8-24 15:36
希望我们的国产芯片快点全面投入使用!快点再快点![加油]
酷狗e族
发表于 2025-8-24 15:43
根据我的多年研究,这个视觉Al的边缘计算只能解决是什么不是什么的问题,它解决不了会怎样的问题!
疯了吧
发表于 2025-8-24 16:26
从中华文明延续看,一流人才还在国内,二流人才则出走美国。所以Deepseek还是要发挥国内人才潜力