找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 82|回复: 4

[综艺大观] 重磅!DeepSeek V3.2 特别版发布:性能超越GPT-5,硬刚Gemini 3.0「IOI/IMO金牌」

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-12-1 20:02 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp



DeepSeek-V3.2系列模型正式上线
作为“为Agent构建的推理优先模型”,DeepSeek-V3.2包含两个版本:
DeepSeek-V3.2:V3.2-Exp的官方继任者,平衡了推理能力与生成长度,性能对标GPT-5,现已上线App、Web端及API
DeepSeek-V3.2-Speciale:专攻深度推理能力的极限版本,性能超越GPT-5,比肩Gemini-3.0-Pro,目前仅通过API提供
2.webp

技术报告显示,DeepSeek-V3.2-Speciale在2025年国际数学奥林匹克(IMO)、国际信息学奥林匹克(IOI)、ICPC世界总决赛及CMO中均取得了金牌级成绩
3.webp

官方已公开上述竞赛的最终提交结果,社区可通过assets/olympiad_cases进行二次验证
4.webp

技术报告:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2/blob/main/assets/paper.pdf
5.webp


以下是详细信息
核心能力与技术突破

DeepSeek-V3.2基于三大技术突破,实现了高计算效率与卓越推理、Agent性能的统一:
1.DeepSeek Sparse Attention (DSA):引入高效注意力机制,大幅降低计算复杂度,并针对长上下文场景进行了优化
2.可扩展强化学习框架:通过稳健的RL协议与后训练(post-training)算力扩展,实现了高性能表现
3.大规模Agent任务合成管线:涵盖1800+环境及8.5万+复杂指令
这一合成管线不仅提升了模型在复杂交互环境中的遵循度和泛化能力,更让DeepSeek-V3.2将“思考”直接整合进工具使用(Tool-Use)的模型,同时支持在思考和非思考模式下使用工具
6.webp

API更新与Speciale版限制

DeepSeek-V3.2
API使用模式与V3.2-Exp保持一致,作为日常主力模型(Daily Driver),提供GPT-5级别的性能
DeepSeek-V3.2-Speciale
该版本专为解决复杂任务设计,消耗更多Token,目前仅作为API提供,具体限制如下:
临时端点:需使用 

base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"
服务期限:该端点服务至2025年12月15日 15:59 (UTC) 截止
功能限制:不支持工具调用(Tool Calls),仅用于支持社区评估与研究。
聊天模板重大调整

DeepSeek-V3.2不再提供Jinja格式模板,并引入了“带工具思考”及新角色设定。
Python脚本编码:官方提供了encoding文件夹,包含Python脚本(encoding_dsv32.py),用于将OpenAI兼容格式消息编码为模型输入字符串及解析输出
Developer角色:模板新增developer角色,专门用于搜索Agent场景,官方API不接受分配给该角色的消息
输出解析注意:提供的解析函数仅处理格式良好的字符串,生产环境需自行增加稳健的错误处理机制。
代码示例如下:
import transformers
from
 encoding_dsv32 import encode_messages

tokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")
messages = [
    {"role": "user", "content": "hello"},
    {"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
    {"role": "user", "content": "1+1=?"}
]
# 思考模式配置

encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)
prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)本地部署建议

模型结构与DeepSeek-V3.2-Exp相同。
采样参数:建议设置 temperature = 1.0,top_p = 0.95。
Speciale版提示:本地部署Speciale版本时,同样不支持工具调用功能
开源与协议

仓库及模型权重均采用 MIT License 授权。


--end--



最后记得⭐️我,这对我非常重要,每天都在更新:
欢迎点赞转发推荐评论,别忘了关注我
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-12-1 20:23 | 显示全部楼层
比一比围棋,就知道谁厉害了@元宝 @新京报 @较真AI
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-12-1 22:06 | 显示全部楼层
忽悠二版上线
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-12-1 22:14 | 显示全部楼层
刚才另外一篇报道说赶上了,这篇就超越了
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-12-1 22:54 | 显示全部楼层
@元宝 你和deepseek谁厉害?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2025-12-17 14:05 , Processed in 0.173106 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表