DeepSeek 发布 V3.2 正式版:通用能力增强,同步推出推理向 Speciale 变体
2025 年 12 月 1 日,DeepSeek 以 MIT 协议发布 V3.2 正式版,将稀疏注意力等效率探索沉淀为正式版本,并同步推出侧重推理的 DeepSeek-V3.2-Speciale 变体,形成「通用 + 推理」组合。
DeepSeek 发布 V3.2 正式版:通用能力增强,同步推出推理向 Speciale 变体
2025 年 12 月 1 日,
DeepSeek 以 MIT 协议发布
图:DeepSeek 官网对话界面。V3.2 于 2025 年 12 月 1 日以 MIT 协议发布,同步推出侧重推理的 DeepSeek-V3.2-Speciale 变体,将前序稀疏注意力等效率探索正式化。
版本速览
| 项目 | 内容 |
|---|---|
| 模型名称 | DeepSeek-V3.2 / V3.2-Speciale |
| 发布时间 | 2025 年 12 月 1 日 |
| 主要提升 | 通用能力进一步增强 |
| 配套变体 | V3.2-Speciale(侧重推理) |
| 技术沉淀 | 稀疏注意力等效率探索正式化 |
| 开源许可 | MIT License |
本次发布亮点
- 正式化迭代:在前序实验版基础上完成正式化,通用能力进一步增强。
- Speciale 变体:同步推出 DeepSeek-V3.2-Speciale,侧重推理能力。
- 延续开源策略:以 MIT 协议发布,保持开放权重。
V3.2 与 V3.2-Speciale 选型
| 版本 | 侧重 | 适用场景 |
|---|---|---|
| DeepSeek-V3.2 | 通用能力 | 对话、写作、通用任务 |
| DeepSeek-V3.2-Speciale | 推理能力 | 数学、逻辑、复杂推理 |
DeepSeek 版本演进时间线
| 版本 | 发布日期 | 定位 | 关键特性 |
|---|---|---|---|
| DeepSeek-V2 | 2024-05 | 架构奠基 | MLA + MoE,128K 上下文 |
| DeepSeek-V3 | 2024-12-26 | 旗舰基座 | 671B MoE,多 token 预测 |
| DeepSeek-R1 | 2025-01-20 | 推理特化 | 强化学习驱动,对标 o1 |
| DeepSeek-R1-0528 | 2025-05-28 | 推理升级 | 数学基准增强,幻觉更少 |
| DeepSeek-V3.1 | 2025-08-21 | 混合推理 | 思考 / 非思考双模式 |
| DeepSeek-V3.2-Exp | 2025-09-29 | 效率实验 | 稀疏注意力(DSA) |
| DeepSeek-V3.2 ✅ 本文 | 2025-12-01 | 正式迭代 | 通用增强 + Speciale |
| DeepSeek-V4(预览) | 2026-04-24 | 新一代 | Pro 1.6T / Flash 284B,百万上下文 |
重点影响解读
V3.2 将稀疏注意力等效率探索沉淀到正式版本中,并通过 Speciale 变体满足对推理质量有更高要求的场景,形成「通用 + 推理」的产品组合,便于团队按需选型。它也是
对开发者的影响
对于既需要通用对话又有强推理诉求的应用,可在 V3.2 与 V3.2-Speciale 之间按任务分流;建议在评测环境对比两者在目标任务上的质量与成本,再决定线上配置。
常见问题(FAQ)
Q:V3.2 与 V3.2-Exp 有什么区别? A:V3.2 是正式版,将实验版的稀疏注意力等探索正式化,并新增 Speciale 变体。
Q:什么时候选 V3.2-Speciale? A:当任务对数学、逻辑、复杂推理质量有更高要求时优先考虑 Speciale 变体。
Q:V3.2 是否开源? A:是,以 MIT 协议发布,保持开放权重。
参考链接
版权声明:本文内容来自
DeepSeek 官方
。本平台对该内容进行了编译和整理,仅用于信息传播和学习交流之用。如有侵权,请联系我们进行处理。
用户评价