首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • DeepSeek-V4-Pro 还是 GLM-5.1?腾讯云 TokenHub 一站式接入两大模型

    摘要: DeepSeek-V4-Pro 与 GLM-5.1 是当下国产开源旗舰阵营中两款代表性的大模型,能力侧重不同、定价结构差异明显。 这就是为什么"在哪一个平台能同时接入 DeepSeek-V4-Pro 与 GLM-5.1,并且共用一套 API Key"会成为关键诉求。 维度 DeepSeek-V4-Pro GLM-5.1 调用参数(model 字段) deepseek-v4-pro glm-5.1 上下文窗口 1M 200k 最大输入 1M 200k 最大输出 384k GLM-5.1 按输入长度分两档计费,DeepSeek-V4-Pro 单一档位。 在 TokenHub 控制台模型广场启用 DeepSeek-V4-Pro 与 GLM-5.1 的"免费体验"和"启用后付费"; b.

    41510编辑于 2026-05-27
  • 来自专栏前端工程

    DeepSeek-V4-Pro 写代码到底行不行?我拿 GLM-5.1 跟它硬碰硬比了一轮

    DeepSeek-V4-Pro 发了,官方说代码能力大幅升级。这种话我听得多了,每次新模型发布都这么说。 但我确实好奇:V4 在写代码这件事上,到底有没有追上 GLM-5.1? 经过一段时间的等待,可以看到 DeepSeek-V4-Pro 直接借鉴 Claude Code 源码 帮我实现了10个完整的功能模块;由此可见,DeepSeek-V4-Pro 的代码能力确实蛮强的。 1、DeepSeek-V4-Pro 2、GLM-5.1 同样的项目,同样的文件,同样的提示词,我现在让 GLM-5.1 拆一下看看。 现在 GLM-5.1 与 DeepSeek-V4-Pro 都已经对这个超过1000行的代码文件做完了拆分;GLM-5.1 将这个文件拆分为了4个文件,用时大概8分33秒;DeepSeek-V4-Pro 1、DeepSeek-V4-Pro 2、GLM-5.1 可以看到,现在 DeepSeek-V4-Pro 以及 GLM-5.1 都对我的项目进行了分析并给出完整的分析报告,通过上面的项目架构分析可以看出,

    5.4K10编辑于 2026-04-28
  • 来自专栏Hello工控

    如何在Claude Code里面用上DeepSeek V4 Pro模型?

    api.deepseek.com/anthropic" $env:ANTHROPIC_AUTH_TOKEN="<your DeepSeek API Key>" $env:ANTHROPIC_MODEL="deepseek-v4 -pro[1m]" $env:ANTHROPIC_DEFAULT_OPUS_MODEL="deepseek-v4-pro[1m]" $env:ANTHROPIC_DEFAULT_SONNET_MODEL ="deepseek-v4-pro[1m]" $env:ANTHROPIC_DEFAULT_HAIKU_MODEL="deepseek-v4-flash" $env:CLAUDE_CODE_SUBAGENT_MODEL -pro[1m]", "ANTHROPIC_DEFAULT_OPUS_MODEL":"deepseek-v4-pro[1m]", "ANTHROPIC_DEFAULT_SONNET_MODEL 我们为了确认链接成功,可以问下它是谁,用的是哪家大模型,确定回复为deepseek-v4-pro。那么,这个时候你就可以愉快地使用这个CC和Deepseek V4 Pro开启AI编程对话之旅了。

    7.6K10编辑于 2026-04-28
  • 来自专栏低代码平台

    DeepSeek-V4-Pro GPT-5.5 GLM-5.1 MiniMax M2.7 横评:到底该选谁?

    JeecgBootAI专题研究|2026年4月大模型四强横评:参数、基准、价格、场景全维度对比48小时内两款旗舰接连亮相——昨天GPT-5.5,今天DeepSeek-V4-Pro。 基准测试二:推理与知识GPQADiamond(研究生级物理/化学/生物推理题):展开代码语言:TXTAI代码解释DeepSeek-V4-Pro██████████████████████████████ 深度解析三:DeepSeek-V4-Pro(今日发布)今天(4月24日)凌晨刚在HuggingFace放出的预览版。 一个开发者的实用建议如果你只能选一款长期用:预算优先:MiniMaxM2.7($0.30/M,速度还快)开源优先:DeepSeek-V4-Pro(1.6T+MIT+1M上下文)编程优先:GLM-5.1( 未来几周,随着DeepSeek-V4-Pro稳定版落地、GPT-5.5价格可能的调整、以及KimiK3和Qwen4的可能发布,格局还会继续演变。值得持续跟踪。

    9.1K70编辑于 2026-04-24
  • 来自专栏福大大架构师每日一题

    DeepSeek-V4更新:百万 token 上下文、1.6T MoE、FP4+FP8 混合精度、Pro-Max 与 Flash-Max 全面解析

    2026年4月24日,DeepSeek-AI正式发布DeepSeek-V4系列预览版本,该系列包含两款强大的混合专家(Mixture-of-Experts, MoE)语言模型——DeepSeek-V4- -Pro、DeepSeek-V4-Pro-Base,其中DeepSeek-V4-Flash与DeepSeek-V4-Pro为核心功能版本,Base版本则提供基础模型支持,满足不同开发者的轻量化或定制化需求 两款核心功能模型(DeepSeek-V4-Flash与DeepSeek-V4-Pro)均采用混合专家(MoE)架构,支持百万token(1M)的上下文长度,这意味着模型能够处理超长文本输入,适配长文档分析 二者的核心差异集中在参数量与性能定位上:DeepSeek-V4-Pro总参数量达1.6T,激活参数量49B,主打高性能、全场景覆盖;DeepSeek-V4-Flash总参数量284B,激活参数量13B, -Pro:可通过ModelScope搜索“deepseek-ai/DeepSeek-V4-Pro”获取下载链接。

    1.6K30编辑于 2026-04-28
  • DeepSeek-V4 实战——我用国产大模型重写了3个项目

    ▪ 性能对比 我测了三个场景: 代码生成: DeepSeek-V4-Pro 在 HumanEval 上达到 89.2%,GPT-5.5 是 88.7%,Claude Opus 4.7 是 87.5% 长文本理解 : 10万 token 上下文,DeepSeek-V4 完全没问题 推理能力: 复杂逻辑题,DeepSeek-V4-Pro 和 GPT-5.5 差距在 5% 以内 结论: 对我的场景(代码生成 + 文本处理 ▪ 切到 DeepSeek-V4 后 同样的 1000 万 token,用 DeepSeek-V4-Pro: 输入成本(缓存命中率 60%):800 万 × 60% × ¥0.25/M + 800 万 if complexity_score < 0.7: model = "deepseek-v4-flash" else: model = "<em>deepseek-v4-pro</em>" 代价: 加了个复杂度评分逻辑 原因: DeepSeek-V4 的模型名是 deepseek-v4-pro 和 deepseek-v4-flash,不是 deepseek-v4。 解决: 查官方文档,用正确的模型名。

    40411编辑于 2026-05-09
  • DeepSeek-V4-Pro 与 V4-Flash 区别:1M 上下文场景下的接入与价格

    摘要: DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 是 TokenHub 上同时支持 1M 上下文的两款 DeepSeek V4 模型。 二、能力规格全字段对比 维度 DeepSeek-V4-Pro DeepSeek-V4-Flash 调用参数 deepseek-v4-pro deepseek-v4-flash 上下文窗口 1M 1M 最大输入 3.1 输入侧差距 12 倍 DeepSeek-V4-Pro 的输入 12 元/百万 tokens,Flash 的 1 元/百万 tokens。 七、零成本验证两款 V4 模型 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 都在 TokenHub 新人免费体验包覆盖范围内,各赠送 100 万 Tokens,有效期 90 结语 DeepSeek-V4-Pro 和 V4-Flash 在能力清单上是兄弟,但价格上相差 12 倍。

    1.3K10编辑于 2026-05-28
  • DeepSeek V4长上下文推理与NVIDIA Blackwell架构

    DeepSeek刚刚发布了其第四代旗舰模型,包括DeepSeek-V4-Pro和DeepSeek-V4-Flash,两者均旨在实现高效的百万令牌上下文推理。 DeepSeek-V4-Pro是该系列中最大的模型,拥有1.6万亿总参数和490亿激活参数。 规格 | DeepSeek-V4-Pro | DeepSeek-V4-Flash | ---模态 | 文本 | 文本总参数 | 1.6万亿 | 2840亿激活参数 | 490亿 | 130亿上下文长度 在NVIDIA GB200 NVL72上对DeepSeek-V4-Pro进行的开箱即用测试显示,每用户每秒超过150个令牌。 图2:DeepSeek-V4-Pro在NVIDIA Blackwell B300上的开箱即用性能。

    36610编辑于 2026-05-06
  • 深度思考、结构化输出、Function Calling、Cache 缓存:TokenHub 模型四大核心能力

    长流程规划:智能体执行多步任务前的策略制定 2.3 TokenHub 上支持深度思考的代表模型 Hy3 preview(交错式思考)、DeepSeek-V4-Pro、DeepSeek-V4-Flash、 3.4 TokenHub 上支持结构化输出的代表模型 Hy3 preview、DeepSeek-V4-Pro、DeepSeek-V4-Flash、Deepseek-v3.2、Deepseek-v3.1、 在 TokenHub 价格表里,DeepSeek-V4-Pro 推理输入 12 元/百万 tokens,缓存命中只要 1 元/百万 tokens,差 12 倍。 5.4 TokenHub 上支持 Cache 缓存的代表模型 Hy3 preview、DeepSeek-V4-Pro、DeepSeek-V4-Flash、GLM-5.1、GLM-5V-Turbo、GLM DeepSeek-V4-Pro 缓存命中价是常规输入价的 1/12,是高频调用场景的黄金选项。 7.4 角色扮演与情感陪聊 Hunyuan-role 专为该场景设计,能力差异化定位。

    20410编辑于 2026-05-27
  • DeepSeek V4 领衔实测:国产 AI 大模型工程代码能力大测评!

    第一梯队是 deepseek-v4-pro、deepseek-v4-flash 和 minimax-m2.7。 在这个层面,deepseek-v4-pro 和 deepseek-v4-flash 在国产模型里表现最佳,为第一梯队,其余模型都有一定差距。 deepseek-v4-pro、deepseek-v4-flash 和 minimax-m2.7 在这一维度上的优势比较明显。 deepseek-v4-flash 在这一维度上表现最佳,deepseek-v4-pro 和 qwen3.6-plus 紧随其后。这类模型通常能够较快收敛到可用结果,整体路径较短。 结论以上几个维度分析下来,本实验中各模型的优劣势其实已经比较清晰了,现在我们将其汇总如下:把六个维度叠在一张雷达图上,模型之间的能力差异一目了然:从综合能力、稳定性和一致性来看,deepseek-v4-

    2.2K20编辑于 2026-05-06
  • 来自专栏AI大模型

    DeepSeek-V4来了:百万上下文为什么是开源模型的分水岭

    -pro,deepseek-v4-flashhttps://api.lingyaai.cn/DeepSeek-V4-Pro性能有多强? 三大维度对标顶级闭源模型DeepSeek-V4-Pro是当前开源模型中综合性能最强的选择,在Agent编码、世界知识和推理三大维度上均达到或接近顶级闭源模型的水平。 DeepSeek-V4-Pro在AgenticCoding评测中取得了开源模型最佳成绩。 模型定位SWE-Bench(泄露)Agent评级DeepSeek-V4-Pro开源旗舰83.7%开源最佳ClaudeOpus4.6闭源旗舰—顶级(思考模式)Gemini3.1Pro闭源旗舰80.6%顶级 建议开发者尽早迁移至新的模型名deepseek-v4-pro或deepseek-v4-flash,避免到期后服务中断。

    1.4K10编辑于 2026-04-27
  • DeepSeek-V4-Pro 深度解析:一次面向百万级上下文的开源大模型迭代

    该系列包含两款模型:DeepSeek-V4-Pro:总参数量1.6T,激活参数49BDeepSeek-V4-Flash:总参数量284B,激活参数13B两款模型都原生支持100万token的上下文长度, 这套机制带来的直接收益非常可观:在1Mtoken的上下文场景下,DeepSeek-V4-Pro相较V3.2,单token推理FLOPs仅需27%,KVCache仅需10%。 七、总结与思考DeepSeek-V4-Pro这次发布,有几个信号值得重点关注:第一,开源阵营在编程能力上已经追上甚至反超闭源旗舰。 如果工程实测能贴近这个理论值,DeepSeek-V4-Pro可能成为长文档处理、代码仓库分析等场景的默认选择,因为同样的硬件能跑更长的上下文,或者同样的上下文能服务更多并发。 原项目地址:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro

    2K20编辑于 2026-04-26
  • DeepSeek V4 刚刚发布:API 定价、配置与最佳实践完全指南

    Thinking/Non-Thinking模式自由切换架构创新Token-wise压缩+DSA(DeepSeek稀疏注意力)Agent优化已集成ClaudeCode、OpenClaw、OpenCode性能表现DeepSeek-V4 模式两个模型都支持双模式切换:展开代码语言:PythonAI代码解释#Non-Thinking模式(默认)response=client.chat.completions.create(model="deepseek-v4 "user","content":"解释Python装饰器"}])#Thinking模式-模型先思考再回答response=client.chat.completions.create(model="deepseek-v4 completions\-H"Content-Type:application/json"\-H"Authorization:Bearer$DEEPSEEK_API_KEY"\-d'{"model":"deepseek-v4 end="",flush=True)Python:监控Token使用展开代码语言:PythonAI代码解释response=client.chat.completions.create(model="deepseek-v4

    10.2K290编辑于 2026-04-27
  • TokenHub 已上架的国产旗舰:混元 Hy3 preview、DeepSeek-V4、GLM-5.1、Kimi-K2.6、MiniMax-M2.7

    摘要: 腾讯云 TokenHub 已经把国产开源旗舰阵营里讨论度最高的几款模型集中上架到同一个平台:混元 Hy3 preview、DeepSeek-V4-Pro/Flash、GLM-5.1、Kimi-K2.6 三、DeepSeek-V4 系列:百万上下文双子星 TokenHub 上 DeepSeek-V4 提供 Pro 与 Flash 两个版本,最大差异在定价档位: 维度 DeepSeek-V4-Pro DeepSeek-V4 -Flash 调用参数 deepseek-v4-pro deepseek-v4-flash 上下文 / 最大输入 / 最大输出 1M / 1M / 384k 1M / 1M / 384k 核心能力 深度思考 长合同 / 长研报 / 长代码仓审阅:DeepSeek-V4-Pro(1M 窗口)+ Hy3 preview(256K)双轨; b. DeepSeek-V4-Pro / DeepSeek-V4-Flash:各 100 万 Tokens; c. GLM-5.1:50 万 Tokens; d.

    30010编辑于 2026-05-29
  • 来自专栏低代码平台

    Claude Code + DeepSeek V4-Pro 真实评测:除了贵,没别的毛病

    -pro","ANTHROPIC_SMALL_FAST_MODEL":"deepseek-v4-flash","ANTHROPIC_DEFAULT_SONNET_MODEL":"deepseek-v4- ","CLAUDE_CODE_SUBAGENT_MODEL":"deepseek-v4-pro","CLAUDE_CODE_EFFORT_LEVEL":"max"},"model":"deepseek-v4 配置完启动,ClaudeCode界面上直接显示deepseek-v4-pro,问它"你是什么模型",回答干脆利落。 整个过程完全无感,如果不是终端上写着deepseek-v4-pro,我甚至以为自己在用Claude原生模型。改文档这类任务对V4-Pro来说属于"降维打击",速度快、理解准、输出干净。 测试环境:ClaudeCodev2.1.119,DeepSeekV4-Pro(deepseek-v4-pro),2026-04-24本文为JeecgBootAI专题研究系列文章。

    7.1K01编辑于 2026-04-24
  • Claude Code 怎么接 DeepSeek?

    Claude Code 接入文档里写的是 ANTHROPIC_MODEL=deepseek-v4-pro[1m],模型价格页里写的是 V4 模型的上下文长度为 1M。 这里要把 1M 解释清楚。 所以 deepseek-v4-pro[1m] 里的 [1m],可以按“100 万 token 上下文版本”理解。它不是 1 分钟,也不是价格里的“每 100 万 token”。 Claude Code 场景按 DeepSeek 文档优先填 deepseek-v4-pro[1m] 和 deepseek-v4-flash。 如果某个工具界面不接受带 [1m] 的模型名,再退到 DeepSeek 标准模型名 deepseek-v4-pro 做测试。 比如 DeepSeek-v4-pro、DeepSeek-v4-flash,不要每个人随手起一个名字。 第三,正式项目第一次使用时,只允许先读项目,不直接改项目。

    1.7K21编辑于 2026-05-20
  • 来自专栏低代码平台

    DeepSeek V4 来了!超越 Claude Sonnet 4.5,赶紧对接 Claude Code 体验一把

    -pro","ANTHROPIC_SMALL_FAST_MODEL":"deepseek-v4-flash","ANTHROPIC_DEFAULT_SONNET_MODEL":"deepseek-v4- pro","ANTHROPIC_DEFAULT_OPUS_MODEL":"deepseek-v4-pro","ANTHROPIC_DEFAULT_HAIKU_MODEL":"deepseek-v4-flash ","CLAUDE_CODE_SUBAGENT_MODEL":"deepseek-v4-pro","CLAUDE_CODE_EFFORT_LEVEL":"max"},"model":"deepseek-v4 配置完成后,ClaudeCode启动界面上已经清楚地显示deepseek-v4-pro·APIUsageBilling,问它"你是什么模型",回答干脆利落:我是DeepSeekV4Pro模型。 测试环境:ClaudeCodev2.1.119,DeepSeekV4-Pro(deepseek-v4-pro),2026-04-24本文为JeecgBootAI专题研究系列文章。

    2.1K31编辑于 2026-04-24
  • 来自专栏算法一只狗

    DeepSeek-V4来了:百万上下文不是噱头,而是下一代 Agent 的底座千呼万唤,DeepSeek-V4终于出来了

    开发者只需将model_name修改为deepseek-v4-pro或deepseek-v4-flash,即可快速接入并调用DeepSeek-V4。模型跑分怎么样? 首先,V4版本性能比肩顶级闭源模型Agent能力大幅提高:相比前代模型,DeepSeek-V4-Pro的Agent能力显著增强。 丰富的世界知识:DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。 世界顶级推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。 在1Mtokencontext下:DeepSeek-V4-Pro的单token推理FLOPs只有DeepSeek-V3.2的27%KVcache只有V3.2的10%DeepSeek-V4-Flash更激进

    75530编辑于 2026-05-08
  • BUG Report: DeepSeek V4 思考模式与工具调用兼容性问题

    一、问题描述使用WorkBuddy连接DeepSeekV4系列模型(deepseek-v4-pro/deepseek-v4-flash)时,当AI响应涉及工具调用(tool_calls),WorkBuddy 三、复现步骤在WorkBuddy中配置自定义模型,API地址指向DeepSeek官方API选择模型ID为deepseek-v4-pro或deepseek-v4-flash发起一段需要工具调用的对话(例如 七、参考信息DeepSeekV4发布日期:2026-04-24V4系列模型:deepseek-v4-pro,deepseek-v4-flash旧模型下线日期:2026-07-24相关协议字段:reasoning_content

    4.1K10编辑于 2026-04-26
  • 把小龙虾切换到DeepSeek V4版吧

    粘贴到这里apikey", "models": [ {"id": "deepseek-v4-flash", "name": "DeepSeek V4 Flash"}, {"id": "deepseek-v4 pkill -f openclaw pkill -f node 然后运行刚才设计apikey的代码(直接在终端中运行) 最后,选择推理模型: openclaw models set deepseek/deepseek-v4

    81310编辑于 2026-04-30
领券