找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 29|回复: 8

[科技新闻] DeepSeek 透露下一代国产芯片即将发布

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-21 16:30 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
IT之家 8 月 21 日消息,深度求索官方今日正式对外发布 DeepSeek-V3.1,官方提到 DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。
在 DeepSeek 官方公众号文章页面,DeepSeek 进一步解释称,UE8M0 FP8 是针对即将发布的下一代国产芯片设计
1.webp


IT之家注:FP 英文全称为 Floating Point,是 IEEE 定义的标准浮点数类型。UE8M0 FP8 在 AI 模型领域代表一种模型精度。
DeepSeek V3.1 的 Base 模型在 V3 的基础上重新做了外扩训练,一共增加训练了 840B tokens。Base 模型与后训练模型均已在 Huggingface 与魔搭开源。IT之家附开源地址:
Base 模型:

  • Hugging Face:
  • 魔搭:
后训练模型:

  • Hugging Face:
  • 魔搭:
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-21 17:22 | 显示全部楼层
这波国产芯片精度升级就像把老电视换成8K屏,840B tokens训练量够绕地球三圈了,就是不知道普通电脑能不能带得动这大模型
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-21 18:47 | 显示全部楼层
昇腾920
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-21 19:31 | 显示全部楼层
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-21 19:38 | 显示全部楼层
最近流传的deepseek的大招就是这个吧
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-21 19:45 | 显示全部楼层
别接盘,这几天已经有潜伏盘进去了,寒武纪
回复 支持 反对

使用道具 举报

  • 打卡等级:自成一派
  • 打卡总天数:132
发表于 2025-8-21 23:54 | 显示全部楼层
厉害
回复 支持 反对

使用道具 举报

  • 打卡等级:自成一派
  • 打卡总天数:110
发表于 2025-8-22 08:26 | 显示全部楼层
啥也不说了,楼主就是给力!
回复 支持 反对

使用道具 举报

  • 打卡等级:自成一派
  • 打卡总天数:279
发表于 2025-8-22 10:16 | 显示全部楼层
谢谢楼主分享!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2025-9-13 04:53 , Processed in 0.268657 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表