DeepSeek 发布 V4 系列预览版:V4-Pro 达 1.6T 参数,支持百万 token 上下文
2026 年 4 月 24 日,DeepSeek 发布 V4 系列预览版,包含 1.6T 参数的 V4-Pro 与 284B 的 V4-Flash,均支持百万 token 上下文,以 MIT 协议开源,并被华为、寒武纪等芯片厂商采用。
DeepSeek 发布 V4 系列预览版:V4-Pro 达 1.6T 参数,支持百万 token 上下文
2026 年 4 月 24 日,
DeepSeek 发布 V4 系列预览版,以 MIT 协议开源。
图:DeepSeek 官网对话界面。V4 预览版于 2026 年 4 月 24 日以 MIT 协议开源,包含 1.6 万亿参数的 V4-Pro 与 2840 亿参数的 V4-Flash,二者均支持百万 token 上下文,并已获华为、寒武纪等芯片厂商采用。
版本速览
| 项目 | 内容 |
|---|---|
| 模型系列 | DeepSeek-V4(预览版) |
| 发布时间 | 2026 年 4 月 24 日 |
| 旗舰版本 | V4-Pro:1.6T 总参数 / 激活约 49B |
| 高性价比版本 | V4-Flash:284B 总参数 / 激活约 13B |
| 上下文长度 | 100 万 token |
| 开源许可 | MIT License |
| 生态进展 | 华为、寒武纪等芯片厂商采用 |
本次发布亮点
- V4-Pro 预览版:
1.6T 总参数(激活约 49B),代表新一代基础模型能力上限。 - V4-Flash 预览版:
284B 总参数(激活约 13B),强调经济高效与吞吐。 - 百万上下文:两款模型均支持 100 万 token 上下文窗口。
- MIT 开源:延续开放策略,便于研究与商用落地。
V4-Pro 与 V4-Flash 对比
| 维度 | DeepSeek-V4-Pro | DeepSeek-V4-Flash |
|---|---|---|
| 总参数 | 1.6T | 284B |
| 激活参数 | 约 49B | 约 13B |
| 上下文 | 100 万 token | 100 万 token |
| 定位 | 能力上限旗舰 | 经济高效高吞吐 |
| 适用场景 | 复杂推理、整库代码理解 | 高频应用、成本敏感场景 |
DeepSeek 版本演进时间线
| 版本 | 发布日期 | 定位 | 关键特性 |
|---|---|---|---|
| DeepSeek-V2 | 2024-05 | 架构奠基 | MLA + MoE,128K 上下文 |
| DeepSeek-V3 | 2024-12-26 | 旗舰基座 | 671B MoE,多 token 预测 |
| DeepSeek-R1 | 2025-01-20 | 推理特化 | 强化学习驱动,对标 o1 |
| DeepSeek-R1-0528 | 2025-05-28 | 推理升级 | 数学基准增强,幻觉更少 |
| DeepSeek-V3.1 | 2025-08-21 | 混合推理 | 思考 / 非思考双模式 |
| DeepSeek-V3.2-Exp | 2025-09-29 | 效率实验 | 稀疏注意力(DSA) |
| DeepSeek-V3.2 | 2025-12-01 | 正式迭代 | 通用增强 + Speciale |
| DeepSeek-V4(预览) ✅ 本文 | 2026-04-24 | 新一代 | Pro 1.6T / Flash 284B,百万上下文 |
重点影响解读
V4 系列以「旗舰 + 高性价比」双线并进,百万级上下文窗口显著拓展了长文档、代码库与多轮 Agent 场景的处理边界。媒体报道指出,V4 已被华为、寒武纪等芯片厂商采用,体现出国产软硬件协同的进展。
作为预览版,正式能力以官方后续公告为准,建议关注稳定版发布节奏。
对开发者的影响
V4-Pro 适合追求能力上限的复杂任务,V4-Flash 则适合对成本与吞吐敏感的高频应用。百万上下文为整库代码理解、长文档问答等场景提供了新的工程空间,建议在评测环境验证长上下文下的质量与时延表现。
常见问题(FAQ)
Q:V4-Pro 和 V4-Flash 怎么选? A:V4-Pro(1.6T)追求能力上限,适合复杂任务;V4-Flash(284B)经济高效,适合高频、成本敏感场景。
Q:V4 的上下文窗口有多大? A:两款预览版均支持 100 万 token 上下文窗口。
Q:V4 是否开源? A:是,以 MIT 协议发布;作为预览版,正式能力以官方后续公告为准。
参考链接
版权声明:本文内容来自
DeepSeek 官方
。本平台对该内容进行了编译和整理,仅用于信息传播和学习交流之用。如有侵权,请联系我们进行处理。
用户评价