DeepSeek 发布 V3 模型更新，编程能力大幅提升并采用更宽松的开源协议

2025年3月24日，DeepSeek发布了其V3模型的更新版本。此次更新并非是期待中的V4或R2版本，而是对V3模型的一次小版本升级。尽管如此，这一更新仍带来了显著的性能提升和更灵活的开源协议，为开发者和用户带来了诸多惊喜。

用户登录官方网页、APP、小程序进入对话界面后，关闭深度思考即可体验。API 接口和使用方式保持不变。

核心更新亮点

推理任务表现提高
- 强化学习技术：新版 V3 模型借鉴了 DeepSeek-R1 模型训练过程中使用的强化学习技术，大幅提高了在推理类任务上的表现水平。
- 评测集表现：在数学、代码类相关评测集上，新版 V3 模型取得了超过 GPT-4.5 的得分成绩。

前端开发能力增强
- 代码可用性：在 HTML 等代码前端任务上，新版 V3 模型生成的代码可用性更高。
- 视觉效果：生成的视觉效果更加美观、富有设计感。
中文搜索能力优化
- 联网搜索：在联网搜索场景下，新版 V3 模型能够输出更详实准确、排版更清晰美观的结果。
其他能力提升
- 工具调用：能力提升。
- 角色扮演：能力提升。
- 问答闲聊：能力提升。

在线体验：用户登录官方网页、APP、小程序进入对话界面后，关闭深度思考即可体验。
API 接口：API 接口和使用方式保持不变。
模型开源信息：
- 模型参数：约 660B 参数。
- 上下文长度：开源版本上下文长度为 128K（网页端、App 和 API 提供 64K 上下文）。
- 私有化部署：私有化部署时只需更新 checkpoint 和 tokenizer_config.json（tool calls 相关变动）。
- 开源许可：采用 MIT License，允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
- 权重下载：
  - Model Scope：https://modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324
  - Hugging Face：https://huggingface.co/deepseek-ai/DeepSeek-V3-0324