2026 年 04 月 24 日,深度求索(DeepSeek)正式发布全新系列大模型 DeepSeek‑V4 预览版,并同步全量开源。
本次发布最大亮点:全系标配 100 万 token 上下文,主打长上下文普惠,在 Agent、世界知识、推理性能 三大维度,站上开源与国内第一梯队。
双版本齐发:旗舰性能 × 高效经济
DeepSeek‑V4 一次性推出两大版本,覆盖极致性能与低成本部署两条路线,均采用 MoE 架构、MIT 协议开源、商用零门槛。
1. DeepSeek‑V4‑Pro:性能比肩顶级闭源模型
- • 参数规模:总参数 1.6T,激活参数 49B
- • 上下文:1M tokens 输入,最大输出 384K tokens
- • 核心能力
- 1. Agent 能力大幅跃升
Agentic Coding 达开源模型最佳水平,已成为公司内部标配编码模型。实测体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式。
- 2. 世界知识拉满
知识测评大幅领先其他开源模型,仅略逊于 Gemini‑Pro‑3.1。
- 3. 顶级推理性能
数学、STEM、竞赛代码等测评,超越所有开源模型,比肩国际闭源顶流。
2. DeepSeek‑V4‑Flash:更快捷高效的经济之选
- • 参数规模:总参数 284B,激活参数 13B
- • 上下文:同样标配 1M tokens,输出上限 384K tokens
- • 核心定位
- • 世界知识略逊于 Pro,但推理能力接近
- • 更小参数与激活量,带来更快推理、更低成本的 API 服务
- • 简单 Agent 任务与 Pro 相当,高难度任务存在一定差距
关键技术与生态:国产算力 + 低迁移成本
1. 华为昇腾首发部署
V4 实现前沿大模型首发即跑在华为昇腾,同时兼容 NVIDIA GPU。
- • 底层从 CUDA 迁移至华为 CANN 异构计算架构
- • 采用昇腾 950PR + 950DT 算力路线
- • 下半年 950 量产后,吞吐与成本将显著优化
2. Anthropic API 兼容
Claude 生态用户两行代码即可切换:
export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic
export ANTHROPIC_API_KEY=your_deepseek_api_key
支持流式输出、系统提示、工具调用、思考模式等核心能力,迁移成本极低。
3. API 定价:闭源价格 1/4–1/7
支持缓存折扣,大批量场景成本优势极强:
旧版 API(deepseek‑chat / deepseek‑reasoner)将于 2026‑07‑24 停用,请尽快迁移。
对开发者与企业意味着什么?
- 1. 长上下文真正普惠
100 万 token 不再是闭源专属,开源社区可低成本落地长文档、长对话、复杂 Agent 流程。
- 2. 国产算力走向顶流
1.6T 旗舰模型在昇腾首发,证明国产硬件可支撑世界级大模型,打破算力单一依赖。
- 3. 商用门槛大幅降低
MIT 全开源 + 亲民 API 价格,中小企业、独立开发者都能用得起“接近闭源顶流”的能力。
- 4. 极低迁移成本
兼容 Anthropic API,Claude 栈项目几乎无痛切换,兼顾成本与性能。
快速上手建议
- • 追求极致性能、复杂 Agent / 编码:选用 V4‑Pro
- • 批量业务、高并发、成本敏感:选用 V4‑Flash
- • Claude 用户:直接替换 API 地址与 Key
- • 高吞吐生产部署:建议等待下半年昇腾 950 量产
总结
DeepSeek‑V4 不只是一次模型升级,更是开源大模型迈入百万上下文时代、国产模型+国产算力并肩走向世界前沿的标志性事件。