首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏工具分享

    想要免费体验 DeepSeek-V4-Flash ?AtomCode 可以试试

    又有一个可以直接用 DeepSeek-V4-Flash 的地方 —— AtomCode。 这个模型标注为 284B 总参数、13B 激活参数。 对于只是想体验 DeepSeek-V4-Flash 编程效果的人来说,这个入口还挺省事。 AtomCode 是什么 AtomCode 是一个开源的终端 AI 编码助手。 对普通用户来说,更直接的价值是: 它现在可以免费领取 CodingPlan,在终端里体验 DeepSeek-V4-Flash。 Qwen3.6-35B-A3B:图文转文本模型,更适合处理带图片的输入 这里最值得关注的,还是 DeepSeek-V4-Flash。 体验感受 AtomCode 最大的优点是省事——装好领取CodingPlan就能在终端体验 DeepSeek-V4-Flash

    45710编辑于 2026-05-14
  • 来自专栏Hello工控

    如何在Claude Code里面用上DeepSeek V4 Pro模型?

    [1m]" $env:ANTHROPIC_DEFAULT_SONNET_MODEL="deepseek-v4-pro[1m]" $env:ANTHROPIC_DEFAULT_HAIKU_MODEL="deepseek-v4 -flash" $env:CLAUDE_CODE_SUBAGENT_MODEL="deepseek-v4-flash" $env:CLAUDE_CODE_EFFORT_LEVEL="max" 当然,这个是指导的文件 ", "ANTHROPIC_DEFAULT_SONNET_MODEL":"deepseek-v4-pro[1m]", "ANTHROPIC_DEFAULT_HAIKU_MODEL":"deepseek-v4 -flash", "CLAUDE_CODE_SUBAGENT_MODEL":"deepseek-v4-flash", "CLAUDE_CODE_EFFORT_LEVEL":"max"

    5.7K10编辑于 2026-04-28
  • 来自专栏AI工具测评

    一招教你如何快速免费无限调用 DeepSeek-V4-Flash,本地终端直接用

    无需充值、无需付费,就能在本地终端中无限制调用 284B 参数的 DeepSeek-V4-Flash,全程白嫖、稳定可用,核心入口就藏在 AtomCode 的 CodingPlan 免费计划中。 一、核心亮点:顶配 DeepSeek-V4-Flash 完全免费DeepSeek-V4-Flash 一经推出就凭借超高性价比出圈,模型总参数达284B,实际激活参数仅13B,推理成本仅为前代模型的十分之一 、福利详解:CodingPlan 免费权益包CodingPlan 是 AtomCode 联合 AtomGit 专为开发者打造的免费AI权益计划,无需订阅、无需付费,解锁顶配模型使用权限:✅ 专属解锁 DeepSeek-V4 五、DeepSeek-V4-Flash 实战能力适配场景结合GitCode AI社区官方介绍,这款模型适配绝大多数开发与办公场景: 全流程代码开发:智能补全代码、精准修复Bug、重构代码模块、代码审查优化 七、总结如果你是开发者,想要免费体验DeepSeek-V4-Flash顶配模型、想要一款开源免费、媲美Claude Code的终端AI助手、想要依托国产平台实现可控稳定开发,那 AtomCode + CodingPlan

    48210编辑于 2026-05-20
  • 来自专栏福大大架构师每日一题

    DeepSeek-V4更新:百万 token 上下文、1.6T MoE、FP4+FP8 混合精度、Pro-Max 与 Flash-Max 全面解析

    4月24日,DeepSeek-AI正式发布DeepSeek-V4系列预览版本,该系列包含两款强大的混合专家(Mixture-of-Experts, MoE)语言模型——DeepSeek-V4-Pro与DeepSeek-V4 -Flash、DeepSeek-V4-Flash-Base、DeepSeek-V4-Pro、DeepSeek-V4-Pro-Base,其中DeepSeek-V4-Flash与DeepSeek-V4-Pro 两款核心功能模型(DeepSeek-V4-Flash与DeepSeek-V4-Pro)均采用混合专家(MoE)架构,支持百万token(1M)的上下文长度,这意味着模型能够处理超长文本输入,适配长文档分析 二者的核心差异集中在参数量与性能定位上:DeepSeek-V4-Pro总参数量达1.6T,激活参数量49B,主打高性能、全场景覆盖;DeepSeek-V4-Flash总参数量284B,激活参数量13B, 其中,ModelScope平台的模型地址分别为: - DeepSeek-V4-Flash:可通过ModelScope搜索“deepseek-ai/DeepSeek-V4-Flash”获取下载链接; -

    1.2K30编辑于 2026-04-28
  • DeepSeek-V4首发即支持,ZStack AIOS 私有化部署即刻可用

    DeepSeek-V4:效率与能力的双重跃升DeepSeek-V4 系列包括 DeepSeek-V4-Pro(1.6T 总参数 / 49B 激活) 与 DeepSeek-V4-Flash(284B 总参数 AIOS 率先完成私有化适配,全面支持国产化算力ZStack AIOS 现已全面支持 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 在自有数据中心的私有化部署。 三步上手:以 DeepSeek-V4-Flash 为例DeepSeek-V4-Flash 每次推理仅需激活 13B 参数,推理效率较高,是在有限 GPU 资源下验证 V4 系列能力的合适起点。 在 ModelScope 上找到 DeepSeek-V4-Flash 的 Model ID并填入,点击下载,系统将自动根据 Model ID 拉取模型文件至平台模型仓库。

    37100编辑于 2026-04-24
  • DeepSeek V4 刚刚发布:API 定价、配置与最佳实践完全指南

    OpenCode性能表现DeepSeek-V4-Pro:Agent编程能力:开源SOTA世界知识:开源模型第一,仅次于Gemini-3.1-Pro推理能力:数学/STEM/编程全面领先,对标顶级闭源模型DeepSeek-V4 定价详解DeepSeekV4定价模型输入(缓存命中)输入(缓存未命中)输出deepseek-v4-flash$0.028/M$0.14/M$0.28/Mdeepseek-v4-pro$0.145/M$1.74 DEEPSEEK_API_KEY"),base_url="https://api.deepseek.com")response=client.chat.completions.create(model="deepseek-v4 response.choices[0].message.content)Python:流式输出展开代码语言:PythonAI代码解释stream=client.chat.completions.create(model="deepseek-v4 sk-deepseek-key",base_url="https://api.deepseek.com"#改这一行)response=client.chat.completions.create(model="deepseek-v4

    8.7K290编辑于 2026-04-27
  • 百万上下文成为标配:DeepSeek-V4-Flash上线Canopy Wave,7 天免费试用怎么玩?

    对大多数开发者来说,更直接的一个变化是:DeepSeek-V4-Flash 已经同步登陆 Canopy Wave 平台,并且 Canopy Wave 新用户注册后可以享受 7 天免费试用。 Canopy Wave 平台已经上线 DeepSeek-V4-Flash,我自己也是使用的这个平台,有兴趣可以试试https://canopywave.com/.新用户注册并绑定后,即可享受 7 天免费试用 五、小结DeepSeek-V4-Flash 的定位非常明确:它不是“缩水版”,而是“经济主力版”。 感兴趣的同行可以去 Canopy Wave 注册,开启 7 天免费试用,拿自己的业务数据测一下DeepSeek-V4-Flash的效果。

    36601编辑于 2026-04-30
  • DeepSeek V4 领衔实测:国产 AI 大模型工程代码能力大测评!

    第一梯队是 deepseek-v4-pro、deepseek-v4-flash 和 minimax-m2.7。 在这个层面,deepseek-v4-pro 和 deepseek-v4-flash 在国产模型里表现最佳,为第一梯队,其余模型都有一定差距。 deepseek-v4-pro、deepseek-v4-flash 和 minimax-m2.7 在这一维度上的优势比较明显。 deepseek-v4-flash 在这一维度上表现最佳,deepseek-v4-pro 和 qwen3.6-plus 紧随其后。这类模型通常能够较快收敛到可用结果,整体路径较短。 如果更看重响应速度和吞吐效率,deepseek-v4-flash 值得优先考虑。它的平均耗时是所有模型里最短的,效率评分也排在国产第一。

    1.4K20编辑于 2026-05-06
  • 来自专栏机器学习与统计学

    DeepSeek-V4-Flash 本地部署,2 x H20(96GB版本),性能简测

    继续看看 V4,本文看下 DeepSeek-V4-Flash 本地部署 我的设备 CPU:Intel Xeon Platinum 8457C 内存:480 GiB GPU:2 x NVIDIA H20, 580.126.09 CUDA 版本:13.0 系统盘:100G 数据盘:1T 1、模型下载 模型文件 160GB 国内网络,模型下载 modelscope download --model deepseek-ai/DeepSeek-V4 -Flash --local_dir /data/models/DeepSeek-V4-Flash 2、vLLM Docker 镜像准备 安装vllm-nightly我从没有成功过,只有Docker最省心 models:ro \ -e VLLM_ENGINE_READY_TIMEOUT_S=3600 \ vllm/vllm-openai:deepseekv4-cu129 \ /models/DeepSeek-V4

    2.5K20编辑于 2026-05-08
  • 来自专栏后端架构师

    开多个 Agent 后 Claude Code 账单翻了 4 倍,一个配置解决了

    -flash" # Haiku 级 → V4-Flash export CLAUDE_CODE_SUBAGENT_MODEL="deepseek-v4-flash" # 显式绑定子 Agent 如果账单里同时出现 deepseek-v4-pro 和 deepseek-v4-flash 两种模型,说明分层路由已经在工作了——文件扫描走的是 Flash,你的主对话走的是 Pro。 model: deepseek-v4-flash tools: - Read - Bash --- 你是一个专注代码质量的 reviewer,检查以下四个维度: 安全漏洞、性能问题、代码规范、 坑 2:模型名写错不报错,会静默 fallback DeepSeek 的 Anthropic 端点在遇到不认识的模型名时,会静默 fallback 到 deepseek-v4-flash,不返回错误。 -flash", "CLAUDE_CODE_SUBAGENT_MODEL": "deepseek-v4-flash" } } 只对当前项目生效,不影响其他项目的配置。

    52810编辑于 2026-05-08
  • BUG Report: DeepSeek V4 思考模式与工具调用兼容性问题

    一、问题描述使用WorkBuddy连接DeepSeekV4系列模型(deepseek-v4-pro/deepseek-v4-flash)时,当AI响应涉及工具调用(tool_calls),WorkBuddy 三、复现步骤在WorkBuddy中配置自定义模型,API地址指向DeepSeek官方API选择模型ID为deepseek-v4-pro或deepseek-v4-flash发起一段需要工具调用的对话(例如 七、参考信息DeepSeekV4发布日期:2026-04-24V4系列模型:deepseek-v4-pro,deepseek-v4-flash旧模型下线日期:2026-07-24相关协议字段:reasoning_content

    3.4K10编辑于 2026-04-26
  • DeepSeek-V4 实战——我用国产大模型重写了3个项目

    ▪ 切到 DeepSeek-V4-FlashDeepSeek-V4-Flash 是轻量版,专门为快速推理设计。平均每个接口 1.5 秒,100 个接口只要 2.5 分钟。 速度提升了 3 倍。 if complexity_score < 0.7: model = "<em>deepseek-v4-flash</em>" else: model = "deepseek-v4-pro" 代价: 加了个复杂度评分逻辑 api.deepseek.com/v1") response = client.chat.completions.create( model="deepseek-v4-pro", # 或 "deepseek-v4 原因: DeepSeek-V4 的模型名是 deepseek-v4-pro 和 deepseek-v4-flash,不是 deepseek-v4。 解决: 查官方文档,用正确的模型名。

    30211编辑于 2026-05-09
  • 来自专栏大模型系列

    边缘计算应用:DeepSeek V4轻量级部署实战——让万亿参数大模型在消费级设备上飞驰

    展开代码语言:TXTAI代码解释fromhuggingface_hubimportsnapshot_downloadsnapshot_download(repo_id="deepseek-ai/DeepSeek-V4 /DeepSeek-V4-Flash",local_dir_use_symlinks=False)步骤3:启动推理服务针对消费级显卡(如RTX4090),我们需要限制上下文长度并利用量化来节省显存。 /DeepSeek-V4-Flash\--tensor-parallel-size4\--max-model-len1048576\#启用百万Token--dtypebfloat16对于RTX4090单卡 /DeepSeek-V4-Flash\--tensor-parallel-size1\--max-model-len131072\#128Ktokens--gpu-memory-utilization0.95 你可以选择使用deepseek-v4-flash作为模型。

    22410编辑于 2026-05-17
  • Claude Code 怎么接 DeepSeek?

    DeepSeek 文档已经说明,这两个老模型名后续会废弃,只是为了兼容才映射到 deepseek-v4-flash 的不同模式。 -flash" $env:CLAUDE_CODE_SUBAGENT_MODEL="deepseek-v4-flash" $env:CLAUDE_CODE_EFFORT_LEVEL="max" macOS -flash export CLAUDE_CODE_SUBAGENT_MODEL=deepseek-v4-flash export CLAUDE_CODE_EFFORT_LEVEL=max 这些变量不用长期手敲 Claude Code 场景按 DeepSeek 文档优先填 deepseek-v4-pro[1m] 和 deepseek-v4-flash。 比如 DeepSeek-v4-pro、DeepSeek-v4-flash,不要每个人随手起一个名字。 第三,正式项目第一次使用时,只允许先读项目,不直接改项目。

    46221编辑于 2026-05-20
  • 来自专栏爱可生开源社区

    SCALE | 2026 年 4 月《大模型 SQL 能力排行榜》发布

    一、发版摘要与核心价值 本月,SCALE 测评榜单新增纳入 DeepSeek-V4-Pro、DeepSeek-V4-Flash、GPT-5.5 和 Claude Opus 4.7 四款最新模型。 Claude Opus 4.7 在 SQL 优化和方言转换两个维度均进入前 10,SQL 优化语法错误检测 88.7 分,国产数据库转换达到 100.0 分 • DeepSeek-V4-Pro / DeepSeek-V4 3.4 专项测评:DeepSeek-V4-Flash (DeepSeek) 1. 能力定位判断 DeepSeek-V4-Flash 是 DeepSeek 本期新增的轻量高效思考型对话模型,模型介绍为 284B total / 13B active params。 图 4:DeepSeek-V4-Flash 能力维度评分 2. 核心维度分析 • SQL 理解:模型在基础 SQL 识别和结果判断方面具备可用性;执行计划检测仍有提升空间。

    21010编辑于 2026-05-18
  • 来自专栏大模型系列

    打造你的百万上下文AI智能体:OpenClaw深度集成DeepSeek V4全攻略—— 解锁 DeepSeek-V4 的百万上下文与 MoE 架构

    DeepSeek-V4-Flash:经济版,总参数量为284B,激活参数为13B。 模型名称(ModelName):旗舰版:deepseek-v4-pro经济版:deepseek-v4-flash这些信息是后续配置的核心。 -flash设置别名:展开代码语言:BashAI代码解释openclawconfigset'models.models.deepseek/deepseek-v4-flash'--json'{"alias openclawconfigset'agents.defaults.model.primary'--string'deepseek/deepseek-v4-pro'如果您更倾向于使用经济版,可以替换为deepseek/deepseek-v4 DeepSeek-V4-Flash:适用于日常对话、内容创作、普通编程辅助等场景。成本极低(根据官方信息,输出定价约为2元人民币/百万token),性价比极高。

    2.9K51编辑于 2026-04-24
  • 来自专栏大模型系列

    从零部署:Hermes + DeepSeek V4 打造企业级智能助手(附完整代码)

    这次发布包含了两个主要版本:DeepSeek-V4-Pro:旗舰版本总参数量:1.6万亿(1.6T)激活参数:490亿(49B)适用于复杂推理、长文本分析等高性能场景DeepSeek-V4-Flash: 2.1.3 充值与配额管理DeepSeek V4 采用按量计费模式:DeepSeek-V4-Flash:输入:¥0.2/百万 tokens输出:¥0.8/百万 tokensDeepSeek-V4-Pro deepseek-v4(自定义名称)Base URL:https://api.deepseek.com/v1API Key:您在 2.1.2 节中获取的 API KeyDefault Model:选择 deepseek-v4 # Available models: deepseek-v4-flash, deepseek-v4-pro 您也可以直接在 Hermes pro" reason: "代码生成需要更强的推理能力" - condition: "task_type == 'simple_qa'" provider: "deepseek-v4

    4.3K81编辑于 2026-04-24
  • DeepSeek V4长上下文推理与NVIDIA Blackwell架构

    DeepSeek刚刚发布了其第四代旗舰模型,包括DeepSeek-V4-Pro和DeepSeek-V4-Flash,两者均旨在实现高效的百万令牌上下文推理。 DeepSeek-V4-Flash是一个较小的2840亿参数模型,拥有130亿激活参数,专为更高速度、更高效率的工作负载而设计。 规格 | DeepSeek-V4-Pro | DeepSeek-V4-Flash | ---模态 | 文本 | 文本总参数 | 1.6万亿 | 2840亿激活参数 | 490亿 | 130亿上下文长度

    26310编辑于 2026-05-06
  • 来自专栏Java面试教程

    DeepSeek-V4,终于发布,很强!

    模型按大小分为两个版本: DeepSeek-V4-Flash,更快更便宜一点,在处理简单的任务上面和 Pro 的版本没太大差距,但如果在难度系数更大的任务上,推荐使用 Pro 的版本。 DeepSeek-V4-Flash,极致性价比,适合高频、简单任务,提供快速响应。简单推理和Agent能力媲美Pro版 DeepSeek-V4-Pro,极致性能,面向复杂逻辑、深度思考和高性能场景。

    79230编辑于 2026-04-27
  • 实操教程:OpenClaw 对接 DeepSeek 大模型方法

    步骤 8:选择模型并发起对话 进入 OpenClaw 左侧聊天页面,在模型选择框搜索 “deepseek”,选择对应模型(如 deepseek-chat、deepseek-v4-flash、deepseek-v4 新手推荐以下常用模型: deepseek-chat:通用对话场景适配性强; deepseek-v4-flash:响应速度快,适合高频对话; deepseek-v4-pro:输出效果优质,适合复杂任务。

    73420编辑于 2026-05-13
领券