找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 84|回复: 2

[科技新闻] DeepSeek新模型开源发布,参数量达6710亿

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-5-1 11:31 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
【环球网科技综合报道】5月1日消息,DeepSeek于4月30日在AI开源社区Hugging Face上正式发布了一款名为DeepSeek-Prover-V2-671B的新模型。
据悉,DeepSeek-Prover-V2-671B模型参数规模高达6710亿,或为去年发布的Prover-V1.5数学模型的升级版本。该模型采用了更为高效的safetensors文件格式,并支持多种计算精度,使得模型在训练和部署过程中更加迅速且资源消耗更低。在模型架构上,DeepSeek-Prover-V2-671B继承了DeepSeek-V3的先进设计,采用了混合专家(MoE)模式,拥有61层Transformer层和7168维的隐藏层,极大提升了模型的复杂处理能力。
1.webp


尤为值得一提的是,DeepSeek-Prover-V2-671B支持超长上下文处理,最大位置嵌入达到163840,这一特性使其能够轻松应对复杂的数学证明任务。此外,模型还采用了FP8量化技术,有效减小了模型体积,同时提高了推理效率,为AI在数学领域的应用开辟了新的可能。(纯钧)
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-5-1 13:46 | 显示全部楼层
这个模型能解决哪些具体问题?
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-5-2 00:51 | 显示全部楼层
强烈建议整合一下!网约车平台!货车平台!外卖骑手!抽成5%以下!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2025-5-24 09:59 , Processed in 0.159148 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表