dsfgdsg 发表于 2025-8-24 14:09

FP32传输一个数据得占4个字节,FP8只用1个字节就搞定了。在同样的电量下能训练更大的模型。DeepSeek用它优化后,效果特别明显,大规模神经网络的推理速度快太多了。

—じ☆ve人生— 发表于 2025-8-24 14:09

摩尔的MUSA架构原生支持硬件FP8张量加速计算,这是明显的技术升级。国产芯片过去主要支持的是FP16和INT8,现在大模型发展飞快,FP8的需求也上来了,促使国产厂商也要加快对技术的升级。

ycp123 发表于 2025-8-24 14:09

现在像英伟达、AMD这些国际大厂,还有DeepSeek,都开始搞FP8相关的验证了。大家好像已经有共识了,FP8就是继FP32和FP16之后,精度升级的下一个方向。FP8对大模型训练来说,既省时间又省钱,特别实用。不过FP8现在的软件配套和开发工具还不太给力,估计等短板补上就是通用标准了。

qqwa1234 发表于 2025-8-24 14:09

感觉DeepSeek这波操作还是有格局的,点明了适配下一代国产芯片,给国产算力打了一剂强心针,要是真能借此推动国产芯片发展,那对国产芯片的未来真的功不可没。

922b3eb6 发表于 2025-8-24 14:10

FP8这技术前景应该不错,不过跟风吹也没必要,还是要客观点看。生态不完善、技术有局限还都是问题。希望能看到国产芯片借助FP8打破国外垄断吧!大模型训练的成本能降下来,咱普通人接触AI的门槛也能跟着降低不少。

wakeman 发表于 2025-8-24 14:21

既然Deepseek这次验证了FP8在大规模模型上的可行性,就显示了在FP8这一标准乃至更高精度上去做研究或做训练,已经形成了一个重要方向,值得通过进一步实践来证实其实效性。

神隐之左手 发表于 2025-8-24 14:32

DeepSeek 超算能力➕量化模型➕私募高手(即时调整)=无尽的财富

gzcom520 发表于 2025-8-24 15:36

希望我们的国产芯片快点全面投入使用!快点再快点![加油]

酷狗e族 发表于 2025-8-24 15:43

根据我的多年研究,这个视觉Al的边缘计算只能解决是什么不是什么的问题,它解决不了会怎样的问题!

疯了吧 发表于 2025-8-24 16:26

从中华文明延续看,一流人才还在国内,二流人才则出走美国。所以Deepseek还是要发挥国内人才潜力
页: 1 [2] 3
查看完整版本: DeepSeek暗示国产芯片有望大规模使用,FP8能否引领行业新标准?