首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏前端工程

    DeepSeek-V4-Pro 写代码到底行不行?我拿 GLM-5.1 跟它硬碰硬比了一轮

    DeepSeek-V4-Pro 发了,官方说代码能力大幅升级。这种话我听得多了,每次新模型发布都这么说。 但我确实好奇:V4 在写代码这件事上,到底有没有追上 GLM-5.1? 经过一段时间的等待,可以看到 DeepSeek-V4-Pro 直接借鉴 Claude Code 源码 帮我实现了10个完整的功能模块;由此可见,DeepSeek-V4-Pro 的代码能力确实蛮强的。 1、DeepSeek-V4-Pro 2、GLM-5.1 同样的项目,同样的文件,同样的提示词,我现在让 GLM-5.1 拆一下看看。 现在 GLM-5.1 与 DeepSeek-V4-Pro 都已经对这个超过1000行的代码文件做完了拆分;GLM-5.1 将这个文件拆分为了4个文件,用时大概8分33秒;DeepSeek-V4-Pro 1、DeepSeek-V4-Pro 2、GLM-5.1 可以看到,现在 DeepSeek-V4-Pro 以及 GLM-5.1 都对我的项目进行了分析并给出完整的分析报告,通过上面的项目架构分析可以看出,

    3.6K10编辑于 2026-04-28
  • 来自专栏Hello工控

    如何在Claude Code里面用上DeepSeek V4 Pro模型?

    api.deepseek.com/anthropic" $env:ANTHROPIC_AUTH_TOKEN="<your DeepSeek API Key>" $env:ANTHROPIC_MODEL="deepseek-v4 -pro[1m]" $env:ANTHROPIC_DEFAULT_OPUS_MODEL="deepseek-v4-pro[1m]" $env:ANTHROPIC_DEFAULT_SONNET_MODEL ="deepseek-v4-pro[1m]" $env:ANTHROPIC_DEFAULT_HAIKU_MODEL="deepseek-v4-flash" $env:CLAUDE_CODE_SUBAGENT_MODEL -pro[1m]", "ANTHROPIC_DEFAULT_OPUS_MODEL":"deepseek-v4-pro[1m]", "ANTHROPIC_DEFAULT_SONNET_MODEL 我们为了确认链接成功,可以问下它是谁,用的是哪家大模型,确定回复为deepseek-v4-pro。那么,这个时候你就可以愉快地使用这个CC和Deepseek V4 Pro开启AI编程对话之旅了。

    5.8K10编辑于 2026-04-28
  • 来自专栏福大大架构师每日一题

    DeepSeek-V4更新:百万 token 上下文、1.6T MoE、FP4+FP8 混合精度、Pro-Max 与 Flash-Max 全面解析

    2026年4月24日,DeepSeek-AI正式发布DeepSeek-V4系列预览版本,该系列包含两款强大的混合专家(Mixture-of-Experts, MoE)语言模型——DeepSeek-V4- -Pro、DeepSeek-V4-Pro-Base,其中DeepSeek-V4-Flash与DeepSeek-V4-Pro为核心功能版本,Base版本则提供基础模型支持,满足不同开发者的轻量化或定制化需求 两款核心功能模型(DeepSeek-V4-Flash与DeepSeek-V4-Pro)均采用混合专家(MoE)架构,支持百万token(1M)的上下文长度,这意味着模型能够处理超长文本输入,适配长文档分析 二者的核心差异集中在参数量与性能定位上:DeepSeek-V4-Pro总参数量达1.6T,激活参数量49B,主打高性能、全场景覆盖;DeepSeek-V4-Flash总参数量284B,激活参数量13B, -Pro:可通过ModelScope搜索“deepseek-ai/DeepSeek-V4-Pro”获取下载链接。

    1.2K30编辑于 2026-04-28
  • 来自专栏低代码平台

    DeepSeek-V4-Pro GPT-5.5 GLM-5.1 MiniMax M2.7 横评:到底该选谁?

    JeecgBootAI专题研究|2026年4月大模型四强横评:参数、基准、价格、场景全维度对比48小时内两款旗舰接连亮相——昨天GPT-5.5,今天DeepSeek-V4-Pro。 基准测试二:推理与知识GPQADiamond(研究生级物理/化学/生物推理题):展开代码语言:TXTAI代码解释DeepSeek-V4-Pro██████████████████████████████ 深度解析三:DeepSeek-V4-Pro(今日发布)今天(4月24日)凌晨刚在HuggingFace放出的预览版。 一个开发者的实用建议如果你只能选一款长期用:预算优先:MiniMaxM2.7($0.30/M,速度还快)开源优先:DeepSeek-V4-Pro(1.6T+MIT+1M上下文)编程优先:GLM-5.1( 未来几周,随着DeepSeek-V4-Pro稳定版落地、GPT-5.5价格可能的调整、以及KimiK3和Qwen4的可能发布,格局还会继续演变。值得持续跟踪。

    7.1K70编辑于 2026-04-24
  • DeepSeek-V4 实战——我用国产大模型重写了3个项目

    ▪ 性能对比 我测了三个场景: 代码生成: DeepSeek-V4-Pro 在 HumanEval 上达到 89.2%,GPT-5.5 是 88.7%,Claude Opus 4.7 是 87.5% 长文本理解 : 10万 token 上下文,DeepSeek-V4 完全没问题 推理能力: 复杂逻辑题,DeepSeek-V4-Pro 和 GPT-5.5 差距在 5% 以内 结论: 对我的场景(代码生成 + 文本处理 ▪ 切到 DeepSeek-V4 后 同样的 1000 万 token,用 DeepSeek-V4-Pro: 输入成本(缓存命中率 60%):800 万 × 60% × ¥0.25/M + 800 万 if complexity_score < 0.7: model = "deepseek-v4-flash" else: model = "<em>deepseek-v4-pro</em>" 代价: 加了个复杂度评分逻辑 原因: DeepSeek-V4 的模型名是 deepseek-v4-pro 和 deepseek-v4-flash,不是 deepseek-v4。 解决: 查官方文档,用正确的模型名。

    30711编辑于 2026-05-09
  • DeepSeek V4长上下文推理与NVIDIA Blackwell架构

    DeepSeek刚刚发布了其第四代旗舰模型,包括DeepSeek-V4-Pro和DeepSeek-V4-Flash,两者均旨在实现高效的百万令牌上下文推理。 DeepSeek-V4-Pro是该系列中最大的模型,拥有1.6万亿总参数和490亿激活参数。 规格 | DeepSeek-V4-Pro | DeepSeek-V4-Flash | ---模态 | 文本 | 文本总参数 | 1.6万亿 | 2840亿激活参数 | 490亿 | 130亿上下文长度 在NVIDIA GB200 NVL72上对DeepSeek-V4-Pro进行的开箱即用测试显示,每用户每秒超过150个令牌。 图2:DeepSeek-V4-Pro在NVIDIA Blackwell B300上的开箱即用性能。

    26610编辑于 2026-05-06
  • DeepSeek V4 刚刚发布:API 定价、配置与最佳实践完全指南

    Thinking/Non-Thinking模式自由切换架构创新Token-wise压缩+DSA(DeepSeek稀疏注意力)Agent优化已集成ClaudeCode、OpenClaw、OpenCode性能表现DeepSeek-V4 模式两个模型都支持双模式切换:展开代码语言:PythonAI代码解释#Non-Thinking模式(默认)response=client.chat.completions.create(model="deepseek-v4 "user","content":"解释Python装饰器"}])#Thinking模式-模型先思考再回答response=client.chat.completions.create(model="deepseek-v4 completions\-H"Content-Type:application/json"\-H"Authorization:Bearer$DEEPSEEK_API_KEY"\-d'{"model":"deepseek-v4 end="",flush=True)Python:监控Token使用展开代码语言:PythonAI代码解释response=client.chat.completions.create(model="deepseek-v4

    8.8K290编辑于 2026-04-27
  • DeepSeek V4 领衔实测:国产 AI 大模型工程代码能力大测评!

    第一梯队是 deepseek-v4-pro、deepseek-v4-flash 和 minimax-m2.7。 在这个层面,deepseek-v4-pro 和 deepseek-v4-flash 在国产模型里表现最佳,为第一梯队,其余模型都有一定差距。 deepseek-v4-pro、deepseek-v4-flash 和 minimax-m2.7 在这一维度上的优势比较明显。 deepseek-v4-flash 在这一维度上表现最佳,deepseek-v4-pro 和 qwen3.6-plus 紧随其后。这类模型通常能够较快收敛到可用结果,整体路径较短。 结论以上几个维度分析下来,本实验中各模型的优劣势其实已经比较清晰了,现在我们将其汇总如下:把六个维度叠在一张雷达图上,模型之间的能力差异一目了然:从综合能力、稳定性和一致性来看,deepseek-v4-

    1.4K20编辑于 2026-05-06
  • 来自专栏AI大模型

    DeepSeek-V4来了:百万上下文为什么是开源模型的分水岭

    -pro,deepseek-v4-flashhttps://api.lingyaai.cn/DeepSeek-V4-Pro性能有多强? 三大维度对标顶级闭源模型DeepSeek-V4-Pro是当前开源模型中综合性能最强的选择,在Agent编码、世界知识和推理三大维度上均达到或接近顶级闭源模型的水平。 DeepSeek-V4-Pro在AgenticCoding评测中取得了开源模型最佳成绩。 模型定位SWE-Bench(泄露)Agent评级DeepSeek-V4-Pro开源旗舰83.7%开源最佳ClaudeOpus4.6闭源旗舰—顶级(思考模式)Gemini3.1Pro闭源旗舰80.6%顶级 建议开发者尽早迁移至新的模型名deepseek-v4-pro或deepseek-v4-flash,避免到期后服务中断。

    1.2K10编辑于 2026-04-27
  • 来自专栏低代码平台

    DeepSeek V4 来了!超越 Claude Sonnet 4.5,赶紧对接 Claude Code 体验一把

    -pro","ANTHROPIC_SMALL_FAST_MODEL":"deepseek-v4-flash","ANTHROPIC_DEFAULT_SONNET_MODEL":"deepseek-v4- pro","ANTHROPIC_DEFAULT_OPUS_MODEL":"deepseek-v4-pro","ANTHROPIC_DEFAULT_HAIKU_MODEL":"deepseek-v4-flash ","CLAUDE_CODE_SUBAGENT_MODEL":"deepseek-v4-pro","CLAUDE_CODE_EFFORT_LEVEL":"max"},"model":"deepseek-v4 配置完成后,ClaudeCode启动界面上已经清楚地显示deepseek-v4-pro·APIUsageBilling,问它"你是什么模型",回答干脆利落:我是DeepSeekV4Pro模型。 测试环境:ClaudeCodev2.1.119,DeepSeekV4-Pro(deepseek-v4-pro),2026-04-24本文为JeecgBootAI专题研究系列文章。

    1.8K31编辑于 2026-04-24
  • Claude Code 怎么接 DeepSeek?

    Claude Code 接入文档里写的是 ANTHROPIC_MODEL=deepseek-v4-pro[1m],模型价格页里写的是 V4 模型的上下文长度为 1M。 这里要把 1M 解释清楚。 所以 deepseek-v4-pro[1m] 里的 [1m],可以按“100 万 token 上下文版本”理解。它不是 1 分钟,也不是价格里的“每 100 万 token”。 Claude Code 场景按 DeepSeek 文档优先填 deepseek-v4-pro[1m] 和 deepseek-v4-flash。 如果某个工具界面不接受带 [1m] 的模型名,再退到 DeepSeek 标准模型名 deepseek-v4-pro 做测试。 比如 DeepSeek-v4-pro、DeepSeek-v4-flash,不要每个人随手起一个名字。 第三,正式项目第一次使用时,只允许先读项目,不直接改项目。

    54921编辑于 2026-05-20
  • 来自专栏低代码平台

    Claude Code + DeepSeek V4-Pro 真实评测:除了贵,没别的毛病

    -pro","ANTHROPIC_SMALL_FAST_MODEL":"deepseek-v4-flash","ANTHROPIC_DEFAULT_SONNET_MODEL":"deepseek-v4- ","CLAUDE_CODE_SUBAGENT_MODEL":"deepseek-v4-pro","CLAUDE_CODE_EFFORT_LEVEL":"max"},"model":"deepseek-v4 配置完启动,ClaudeCode界面上直接显示deepseek-v4-pro,问它"你是什么模型",回答干脆利落。 整个过程完全无感,如果不是终端上写着deepseek-v4-pro,我甚至以为自己在用Claude原生模型。改文档这类任务对V4-Pro来说属于"降维打击",速度快、理解准、输出干净。 测试环境:ClaudeCodev2.1.119,DeepSeekV4-Pro(deepseek-v4-pro),2026-04-24本文为JeecgBootAI专题研究系列文章。

    5.8K01编辑于 2026-04-24
  • BUG Report: DeepSeek V4 思考模式与工具调用兼容性问题

    一、问题描述使用WorkBuddy连接DeepSeekV4系列模型(deepseek-v4-pro/deepseek-v4-flash)时,当AI响应涉及工具调用(tool_calls),WorkBuddy 三、复现步骤在WorkBuddy中配置自定义模型,API地址指向DeepSeek官方API选择模型ID为deepseek-v4-pro或deepseek-v4-flash发起一段需要工具调用的对话(例如 七、参考信息DeepSeekV4发布日期:2026-04-24V4系列模型:deepseek-v4-pro,deepseek-v4-flash旧模型下线日期:2026-07-24相关协议字段:reasoning_content

    3.5K10编辑于 2026-04-26
  • 来自专栏算法一只狗

    DeepSeek-V4来了:百万上下文不是噱头,而是下一代 Agent 的底座千呼万唤,DeepSeek-V4终于出来了

    开发者只需将model_name修改为deepseek-v4-pro或deepseek-v4-flash,即可快速接入并调用DeepSeek-V4。模型跑分怎么样? 首先,V4版本性能比肩顶级闭源模型Agent能力大幅提高:相比前代模型,DeepSeek-V4-Pro的Agent能力显著增强。 丰富的世界知识:DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。 世界顶级推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。 在1Mtokencontext下:DeepSeek-V4-Pro的单token推理FLOPs只有DeepSeek-V3.2的27%KVcache只有V3.2的10%DeepSeek-V4-Flash更激进

    59830编辑于 2026-05-08
  • 把小龙虾切换到DeepSeek V4版吧

    粘贴到这里apikey", "models": [ {"id": "deepseek-v4-flash", "name": "DeepSeek V4 Flash"}, {"id": "deepseek-v4 pkill -f openclaw pkill -f node 然后运行刚才设计apikey的代码(直接在终端中运行) 最后,选择推理模型: openclaw models set deepseek/deepseek-v4

    62510编辑于 2026-04-30
  • DeepSeek-V4-Pro 深度解析:一次面向百万级上下文的开源大模型迭代

    该系列包含两款模型:DeepSeek-V4-Pro:总参数量1.6T,激活参数49BDeepSeek-V4-Flash:总参数量284B,激活参数13B两款模型都原生支持100万token的上下文长度, 这套机制带来的直接收益非常可观:在1Mtoken的上下文场景下,DeepSeek-V4-Pro相较V3.2,单token推理FLOPs仅需27%,KVCache仅需10%。 七、总结与思考DeepSeek-V4-Pro这次发布,有几个信号值得重点关注:第一,开源阵营在编程能力上已经追上甚至反超闭源旗舰。 如果工程实测能贴近这个理论值,DeepSeek-V4-Pro可能成为长文档处理、代码仓库分析等场景的默认选择,因为同样的硬件能跑更长的上下文,或者同样的上下文能服务更多并发。 原项目地址:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro

    1.7K20编辑于 2026-04-26
  • 来自专栏网络安全攻防

    划时代发布!DeepSeek-V4 预览版重磅登场,百万上下文从此普惠

    Pro:总参数1.6万亿,激活参数49B,采用MoE(混合专家)架构,性能全面向世界最顶级的闭源模型看齐 V4-Flash:总参数 284B,激活参数 13B,主打轻量与高效,推理成本极低 在能力表现上,DeepSeek-V4 新增 KV Cache 滑窗和压缩算法,进一步降低访存开销 使用方法 目前DeepSeek-V4 API已经同步上线了V4-Pro 与 V4-Flash,我们可以通过在CC-Switch中调整模型至deepseek-v4 modelscope.cn/collections/deepseek-ai/DeepSeek-V4 DeepSeek-V4 技术报告 https://huggingface.co/deepseek-ai/DeepSeek-V4

    45210编辑于 2026-05-07
  • 来自专栏胡琦

    折腾一下 Codex 接上 DeepSeek 了:CLI 和 App 都能用

    (GitHub[1]) mode: "Transform" server: addr: "127.0.0.1:38440" models: deepseek-v4-pro: context_window " user_agent: "moonbridge/1.0" web_search: support: "auto" offers: - model: deepseek-v4 -pro provider: deepseek 也就是说,后面 Codex 侧不需要直接感知 deepseek-v4-pro,它只要访问 deepseek 这个模型名即可。 当然如果 Codex 已经配置 config.toml,只需补充: model_provider = "deepseek" model = "deepseek-v4-pro" [model_providers.deepseek deepseek-v4-pro"] context_window = 262144 max_context_window = 1048576 supports_parallel_tool_calls =

    3.8K60编辑于 2026-05-20
  • 来自专栏后端架构师

    开多个 Agent 后 Claude Code 账单翻了 4 倍,一个配置解决了

    ANTHROPIC_API_KEY="sk-你的 DeepSeek API Key" # 主 Agent:V4-Pro 保证推理质量,附加 [1m] 解锁 1M 上下文 export ANTHROPIC_MODEL="deepseek-v4 ="deepseek-v4-pro" # Sonnet 级 → V4-Pro # 子 Agent:V4-Flash,速度快、成本低 export ANTHROPIC_DEFAULT_HAIKU_MODEL 如果账单里同时出现 deepseek-v4-pro 和 deepseek-v4-flash 两种模型,说明分层路由已经在工作了——文件扫描走的是 Flash,你的主对话走的是 Pro。 model: deepseek-v4-pro[1m] tools: - Read - WebSearch --- 你是一个系统架构师,擅长分析权衡、给出有立场的技术建议。 坑 3:[1m] 不加就只有 200K 上下文 deepseek-v4-prodeepseek-v4-pro[1m] 是两个不同的路由结果。

    53510编辑于 2026-05-08
  • 来自专栏大模型系列

    打造你的百万上下文AI智能体:OpenClaw深度集成DeepSeek V4全攻略—— 解锁 DeepSeek-V4 的百万上下文与 MoE 架构

    它包含两个主要版本:DeepSeek-V4-Pro:旗舰版,总参数量高达1.6万亿,激活参数为49B。DeepSeek-V4-Flash:经济版,总参数量为284B,激活参数为13B。 模型名称(ModelName):旗舰版:deepseek-v4-pro经济版:deepseek-v4-flash这些信息是后续配置的核心。 例如,为deepseek-v4-pro设置一个别名:展开代码语言:BashAI代码解释openclawconfigset'models.models.deepseek/deepseek-v4-pro'- /deepseek-v4-pro'如果您更倾向于使用经济版,可以替换为deepseek/deepseek-v4-flash。 5.3成本与性能权衡DeepSeek-V4-Pro:适用于需要最高推理精度和代码生成质量的任务,如复杂的软件架构设计、高难度算法题解答等。成本相对较高。

    2.9K51编辑于 2026-04-24
领券