首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >重磅|DeepSeek‑V4 今日开源:百万上下文普惠,性能直逼闭源顶流

重磅|DeepSeek‑V4 今日开源:百万上下文普惠,性能直逼闭源顶流

作者头像
DevLlama
发布2026-06-01 20:36:54
发布2026-06-01 20:36:54
1280
举报

2026 年 04 月 24 日,深度求索(DeepSeek)正式发布全新系列大模型 DeepSeek‑V4 预览版,并同步全量开源。

本次发布最大亮点:全系标配 100 万 token 上下文,主打长上下文普惠,在 Agent、世界知识、推理性能 三大维度,站上开源与国内第一梯队。

双版本齐发:旗舰性能 × 高效经济

DeepSeek‑V4 一次性推出两大版本,覆盖极致性能低成本部署两条路线,均采用 MoE 架构、MIT 协议开源、商用零门槛。

1. DeepSeek‑V4‑Pro:性能比肩顶级闭源模型
  • 参数规模:总参数 1.6T,激活参数 49B
  • 上下文:1M tokens 输入,最大输出 384K tokens
  • 核心能力
    1. 1. Agent 能力大幅跃升 Agentic Coding 达开源模型最佳水平,已成为公司内部标配编码模型。实测体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式
    2. 2. 世界知识拉满 知识测评大幅领先其他开源模型,仅略逊于 Gemini‑Pro‑3.1。
    3. 3. 顶级推理性能 数学、STEM、竞赛代码等测评,超越所有开源模型,比肩国际闭源顶流。
2. DeepSeek‑V4‑Flash:更快捷高效的经济之选
  • 参数规模:总参数 284B,激活参数 13B
  • 上下文:同样标配 1M tokens,输出上限 384K tokens
  • 核心定位
    • • 世界知识略逊于 Pro,但推理能力接近
    • • 更小参数与激活量,带来更快推理、更低成本的 API 服务
    • • 简单 Agent 任务与 Pro 相当,高难度任务存在一定差距

关键技术与生态:国产算力 + 低迁移成本

1. 华为昇腾首发部署

V4 实现前沿大模型首发即跑在华为昇腾,同时兼容 NVIDIA GPU。

  • • 底层从 CUDA 迁移至华为 CANN 异构计算架构
  • • 采用昇腾 950PR + 950DT 算力路线
  • • 下半年 950 量产后,吞吐与成本将显著优化
2. Anthropic API 兼容

Claude 生态用户两行代码即可切换

代码语言:javascript
复制
export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic
export ANTHROPIC_API_KEY=your_deepseek_api_key

支持流式输出、系统提示、工具调用、思考模式等核心能力,迁移成本极低。

3. API 定价:闭源价格 1/4–1/7

支持缓存折扣,大批量场景成本优势极强:

模型

输入(缓存命中)

输入(未命中)

输出

V4‑Flash

¥0.2 / 1M tokens

¥1 / 1M tokens

¥2 / 1M tokens

V4‑Pro

¥1 / 1M tokens

¥12 / 1M tokens

¥24 / 1M tokens

旧版 API(deepseek‑chat / deepseek‑reasoner)将于 2026‑07‑24 停用,请尽快迁移。


对开发者与企业意味着什么?

  1. 1. 长上下文真正普惠 100 万 token 不再是闭源专属,开源社区可低成本落地长文档、长对话、复杂 Agent 流程。
  2. 2. 国产算力走向顶流 1.6T 旗舰模型在昇腾首发,证明国产硬件可支撑世界级大模型,打破算力单一依赖。
  3. 3. 商用门槛大幅降低 MIT 全开源 + 亲民 API 价格,中小企业、独立开发者都能用得起“接近闭源顶流”的能力。
  4. 4. 极低迁移成本 兼容 Anthropic API,Claude 栈项目几乎无痛切换,兼顾成本与性能。

快速上手建议

  • • 追求极致性能、复杂 Agent / 编码:选用 V4‑Pro
  • • 批量业务、高并发、成本敏感:选用 V4‑Flash
  • • Claude 用户:直接替换 API 地址与 Key
  • • 高吞吐生产部署:建议等待下半年昇腾 950 量产

总结

DeepSeek‑V4 不只是一次模型升级,更是开源大模型迈入百万上下文时代国产模型+国产算力并肩走向世界前沿的标志性事件。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DevLlama 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 双版本齐发:旗舰性能 × 高效经济
  • 关键技术与生态:国产算力 + 低迁移成本
  • 对开发者与企业意味着什么?
  • 快速上手建议
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档