精睿.网络安全_杀毒软件推荐|ESET|NOD32|激活|vc52|安软联盟|梦想论坛

dsfgdsg 发表于 2025-8-24 14:09

FP32传输一个数据得占4个字节，FP8只用1个字节就搞定了。在同样的电量下能训练更大的模型。DeepSeek用它优化后，效果特别明显，大规模神经网络的推理速度快太多了。

—じ☆ve人生— 发表于 2025-8-24 14:09

摩尔的MUSA架构原生支持硬件FP8张量加速计算，这是明显的技术升级。国产芯片过去主要支持的是FP16和INT8，现在大模型发展飞快，FP8的需求也上来了，促使国产厂商也要加快对技术的升级。

ycp123 发表于 2025-8-24 14:09

现在像英伟达、AMD这些国际大厂，还有DeepSeek，都开始搞FP8相关的验证了。大家好像已经有共识了，FP8就是继FP32和FP16之后，精度升级的下一个方向。FP8对大模型训练来说，既省时间又省钱，特别实用。不过FP8现在的软件配套和开发工具还不太给力，估计等短板补上就是通用标准了。

qqwa1234 发表于 2025-8-24 14:09

感觉DeepSeek这波操作还是有格局的，点明了适配下一代国产芯片，给国产算力打了一剂强心针，要是真能借此推动国产芯片发展，那对国产芯片的未来真的功不可没。

922b3eb6 发表于 2025-8-24 14:10

FP8这技术前景应该不错，不过跟风吹也没必要，还是要客观点看。生态不完善、技术有局限还都是问题。希望能看到国产芯片借助FP8打破国外垄断吧！大模型训练的成本能降下来，咱普通人接触AI的门槛也能跟着降低不少。

wakeman 发表于 2025-8-24 14:21

既然Deepseek这次验证了FP8在大规模模型上的可行性，就显示了在FP8这一标准乃至更高精度上去做研究或做训练，已经形成了一个重要方向，值得通过进一步实践来证实其实效性。

神隐之左手 发表于 2025-8-24 14:32

DeepSeek 超算能力➕量化模型➕私募高手（即时调整）=无尽的财富

gzcom520 发表于 2025-8-24 15:36

希望我们的国产芯片快点全面投入使用！快点再快点！[加油]

酷狗e族 发表于 2025-8-24 15:43

根据我的多年研究，这个视觉Al的边缘计算只能解决是什么不是什么的问题，它解决不了会怎样的问题！

疯了吧 发表于 2025-8-24 16:26

从中华文明延续看，一流人才还在国内，二流人才则出走美国。所以Deepseek还是要发挥国内人才潜力

页: 1 [2] 3

精睿.网络安全's Archiver