重磅｜DeepSeek‑V4 今日开源：百万上下文普惠，性能直逼闭源顶流

DevLlama

发布于 2026-06-01 20:36:54

1280

2026 年 04 月 24 日，深度求索（DeepSeek）正式发布全新系列大模型 DeepSeek‑V4 预览版，并同步全量开源。

本次发布最大亮点：全系标配 100 万 token 上下文，主打长上下文普惠，在 Agent、世界知识、推理性能三大维度，站上开源与国内第一梯队。

双版本齐发：旗舰性能 × 高效经济

DeepSeek‑V4 一次性推出两大版本，覆盖极致性能与低成本部署两条路线，均采用 MoE 架构、MIT 协议开源、商用零门槛。

1. DeepSeek‑V4‑Pro：性能比肩顶级闭源模型

• 参数规模：总参数 1.6T，激活参数 49B
• 上下文：1M tokens 输入，最大输出 384K tokens
• 核心能力
1. 1. Agent 能力大幅跃升 Agentic Coding 达开源模型最佳水平，已成为公司内部标配编码模型。实测体验优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式。
2. 2. 世界知识拉满 知识测评大幅领先其他开源模型，仅略逊于 Gemini‑Pro‑3.1。
3. 3. 顶级推理性能 数学、STEM、竞赛代码等测评，超越所有开源模型，比肩国际闭源顶流。

2. DeepSeek‑V4‑Flash：更快捷高效的经济之选

• 参数规模：总参数 284B，激活参数 13B
• 上下文：同样标配 1M tokens，输出上限 384K tokens
• 核心定位
- • 世界知识略逊于 Pro，但推理能力接近
- • 更小参数与激活量，带来更快推理、更低成本的 API 服务
- • 简单 Agent 任务与 Pro 相当，高难度任务存在一定差距

关键技术与生态：国产算力 + 低迁移成本

1. 华为昇腾首发部署

V4 实现前沿大模型首发即跑在华为昇腾，同时兼容 NVIDIA GPU。

• 底层从 CUDA 迁移至华为 CANN 异构计算架构
• 采用昇腾 950PR + 950DT 算力路线
• 下半年 950 量产后，吞吐与成本将显著优化

2. Anthropic API 兼容

Claude 生态用户两行代码即可切换：

export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic
export ANTHROPIC_API_KEY=your_deepseek_api_key

支持流式输出、系统提示、工具调用、思考模式等核心能力，迁移成本极低。

3. API 定价：闭源价格 1/4–1/7

支持缓存折扣，大批量场景成本优势极强：

模型	输入（缓存命中）	输入（未命中）	输出
V4‑Flash	¥0.2 / 1M tokens	¥1 / 1M tokens	¥2 / 1M tokens
V4‑Pro	¥1 / 1M tokens	¥12 / 1M tokens	¥24 / 1M tokens

旧版 API（deepseek‑chat / deepseek‑reasoner）将于 2026‑07‑24 停用，请尽快迁移。

对开发者与企业意味着什么？

1. 长上下文真正普惠 100 万 token 不再是闭源专属，开源社区可低成本落地长文档、长对话、复杂 Agent 流程。
2. 国产算力走向顶流 1.6T 旗舰模型在昇腾首发，证明国产硬件可支撑世界级大模型，打破算力单一依赖。
3. 商用门槛大幅降低 MIT 全开源 + 亲民 API 价格，中小企业、独立开发者都能用得起“接近闭源顶流”的能力。
4. 极低迁移成本 兼容 Anthropic API，Claude 栈项目几乎无痛切换，兼顾成本与性能。

快速上手建议

• 追求极致性能、复杂 Agent / 编码：选用 V4‑Pro
• 批量业务、高并发、成本敏感：选用 V4‑Flash
• Claude 用户：直接替换 API 地址与 Key
• 高吞吐生产部署：建议等待下半年昇腾 950 量产

总结

DeepSeek‑V4 不只是一次模型升级，更是开源大模型迈入百万上下文时代、国产模型+国产算力并肩走向世界前沿的标志性事件。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-04-24，如有侵权请联系 cloudcommunity@tencent.com 删除

模型

本文分享自 DevLlama 微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度