DeepSeek 发布 V3.2 正式版:通用能力增强,同步推出推理向 Speciale 变体

2025 年 12 月 1 日,DeepSeek 以 MIT 协议发布 V3.2 正式版,将稀疏注意力等效率探索沉淀为正式版本,并同步推出侧重推理的 DeepSeek-V3.2-Speciale 变体,形成「通用 + 推理」组合。

DeepSeek 发布 V3.2 正式版:通用能力增强,同步推出推理向 Speciale 变体

2025 年 12 月 1 日,DeepSeek 以 MIT 协议发布 正式版。

DeepSeek-V3.2 正式版与 Speciale 变体发布概览

图:DeepSeek 官网对话界面。V3.2 于 2025 年 12 月 1 日以 MIT 协议发布,同步推出侧重推理的 DeepSeek-V3.2-Speciale 变体,将前序稀疏注意力等效率探索正式化。

版本速览

项目 内容
模型名称 DeepSeek-V3.2 / V3.2-Speciale
发布时间 2025 年 12 月 1 日
主要提升 通用能力进一步增强
配套变体 V3.2-Speciale(侧重推理)
技术沉淀 稀疏注意力等效率探索正式化
开源许可 MIT License

本次发布亮点

  • 正式化迭代:在前序实验版基础上完成正式化,通用能力进一步增强。
  • Speciale 变体:同步推出 DeepSeek-V3.2-Speciale,侧重推理能力。
  • 延续开源策略:以 MIT 协议发布,保持开放权重。

V3.2 与 V3.2-Speciale 选型

版本 侧重 适用场景
DeepSeek-V3.2 通用能力 对话、写作、通用任务
DeepSeek-V3.2-Speciale 推理能力 数学、逻辑、复杂推理

DeepSeek 版本演进时间线

版本 发布日期 定位 关键特性
DeepSeek-V2 2024-05 架构奠基 MLA + MoE,128K 上下文
DeepSeek-V3 2024-12-26 旗舰基座 671B MoE,多 token 预测
DeepSeek-R1 2025-01-20 推理特化 强化学习驱动,对标 o1
DeepSeek-R1-0528 2025-05-28 推理升级 数学基准增强,幻觉更少
DeepSeek-V3.1 2025-08-21 混合推理 思考 / 非思考双模式
DeepSeek-V3.2-Exp 2025-09-29 效率实验 稀疏注意力(DSA)
DeepSeek-V3.2 ✅ 本文 2025-12-01 正式迭代 通用增强 + Speciale
DeepSeek-V4(预览) 2026-04-24 新一代 Pro 1.6T / Flash 284B,百万上下文

重点影响解读

V3.2 将稀疏注意力等效率探索沉淀到正式版本中,并通过 Speciale 变体满足对推理质量有更高要求的场景,形成「通用 + 推理」的产品组合,便于团队按需选型。它也是 预览版发布前的最后一个 V3 系列正式版。

对开发者的影响

对于既需要通用对话又有强推理诉求的应用,可在 V3.2 与 V3.2-Speciale 之间按任务分流;建议在评测环境对比两者在目标任务上的质量与成本,再决定线上配置。

常见问题(FAQ)

Q:V3.2 与 V3.2-Exp 有什么区别? A:V3.2 是正式版,将实验版的稀疏注意力等探索正式化,并新增 Speciale 变体。

Q:什么时候选 V3.2-Speciale? A:当任务对数学、逻辑、复杂推理质量有更高要求时优先考虑 Speciale 变体。

Q:V3.2 是否开源? A:是,以 MIT 协议发布,保持开放权重。

参考链接

版权声明:本文内容来自 DeepSeek 官方 。本平台对该内容进行了编译和整理,仅用于信息传播和学习交流之用。如有侵权,请联系我们进行处理。

用户评价

  • 加载评价中...