首页
学习
活动
专区
圈层
工具
发布

#LLM

智谱GLM-5.2开源刷屏:大模型开闭源江湖,一文讲明白

Klein.Z

昨天(6月19日),国内AI圈被一件事刷屏了——智谱的GLM-5.2模型,正式宣布开源。**

100

12 万字符提示词泄露后,人们发现 Claude Fable 5 可能根本不是一个"大模型"

术哥

为什么要叠四层?因为 LLM 天生倾向于复述训练数据和搜索结果,这是模型的固有弱点。单靠一句不要抄袭压不住,于是用硬数值兜底、用概念澄清堵漏洞、用自检清单做二次...

900

OpenClaw.NET 祭出 TokenJuice:Agent 时代的"Token 瘦身引擎",让 LLM 上下文不再膨胀

张善友

业界当然意识到了这个问题。常见的解法是什么?让 LLM 自己来总结。但这本身就是一个悖论——你用消耗 Token 的方式来节省 Token,延迟从毫秒级变成秒级...

1500

GLM-5.1 vs Qwen3.6 Plus vs MiniMax M2.7:2026 年三大国产旗舰模型深度横评

A小码哥

2026 年的 AI 大模型战场,国产模型已经不再是追赶者,而是在多个关键赛道上与 OpenAI、Anthropic、Google 三巨头正面交锋。

3710

别再问“AI会不会取代我”:用这张表每周自测你的不可替代性

jack.yang

2026年的职场空气里,弥漫着一种比2018年中台泡沫期更粘稠的焦虑。那时我们担心的是组织架构调整、岗位合并;如今我们恐惧的是物种层面的替代。每当大模型发布新版...

5520

2026年技术决策复盘实录:当AI狂热撞上工程铁律,一个稳定系统的崩塌与重生

jack.yang

我站在公司NOC(网络运营中心)的监控大屏前,看着那条代表核心交易转化率的曲线以一种近乎垂直的角度坠落。红色的告警弹窗像病毒一样在屏幕上蔓延,Slack群里消息...

4020

企业级LLM RAG检索延迟优化:从理论极限到工程落地的全景实战指南

jack.yang

在2024年至2026年的大模型应用浪潮中,检索增强生成(RAG)已从实验室的概念验证迅速演变为企业级知识管理的核心基础设施。然而,随着企业知识库规模从百万级向...

5620

claude fable 5发布你用得起吗?

A小码哥

官方版本说明fable 5 是 Mythos 的补丁版本,支出对外展示,在输入和输出如果遇到敏感信息会降级城Opus 4.8。Anthropic 解释了“为什么...

5410

VibeThinker-3B:探索小型语言模型

A小码哥

VibeThinker-3B是VibeThinker系列在3B参数规模上的进一步探索,专注于具有明确验证信号的挑战性推理任务,如数学、编程和STEM。通过系统优...

4300

单屏 Claude 写得很好,5 屏开始漂 —— 我做了一套 Figma+PRD 到 React 的 Harness

用户12569313

我让 Claude / Codex 看 Figma + 一段 PRD,要它写出 5-10 屏可跑的 React 页面。单屏输出很好,多屏开始漂,而且漂的模式相当...

7110

qKnow智能体构建平台专业版插件中心架构重构设计预告:三层一体化设计与全生命周期管理

吴同

随着平台客户规模持续扩大、插件类型日益丰富,现有插件管理模块在功能深度、信息组织与扩展性方面已难以承载后续业务演进需求。

4310

借助 Flomesh 零信任网格重塑分布式 MCP 与 LLM 访问

乱世不浮生

在当今互联环境中,安全地暴露 MCP 服务器或 LLM 工具等服务不应需要 VPN、静态 IP 或复杂的隧道技术。Flomesh MCP Remote 可在数秒...

6210

2026毕业季残酷真相:不会用AI Agent的人,正在被“一人公司”淘汰

jack.yang

2026年6月,又一批千万级规模的毕业生涌入就业市场。但与往年不同的是,今年的求职者在面试桌对面遇到的,往往不再是庞大的HR团队或部门主管,而是一个个看似单薄、...

20810

2026年不会用Dify的AI工程师,正在失去议价权

jack.yang

如果你是一名AI工程师,打开任意一个主流招聘平台,搜索“大模型应用”、“RAG”、“Agent开发”等关键词,你会发现一个令人不安的趋势:超过70%的中高级岗位...

18520

别再手搓RAG了!2026年还在自己写知识库的企业,正在被Dify用户甩开三个身位

jack.yang

一边是仍在“手搓RAG”(Retrieval-Augmented Generation)的团队:他们花费数月时间搭建向量数据库、编写分块脚本、调试检索策略、处理...

14120

BISHENG毕昇 vs Dify,LLM应用开发平台,企业场景,谁更胜一筹

匙亮旭

这点很令我惊喜,作为一个主打LLM应用的平台,BISHENG毕昇竟然还支持模型微调,Dify本身是不支持的(顺带提一下,Coze也不支持)。虽然没有LLaMA-...

15210

Code-Text-Code:语义也需要一道闸门

Akir.weiwen

作者是 EPAM Systems 的工程师 Vasyl Yaremovych 。他在做一件很实际的事:用 LLM 把代码从语言 A 转换到语言 B,比如 Pyt...

8710

11让LLM更懂FunctionCalling返回值

步步为营DotNet

当前,在向AI模型提供函数返回类型元数据这一领域,尚未有清晰明确的行业标准。当出现返回类型属性的名称无法让大语言模型(LLM)准确推断其内容,或者需要关联其他上...

8100

MiniMax M3 vs 质谱GLM5.2 vs Kimi k2.7对比

A小码哥

本月国产大模型已经发布三款,6月1日MiniMax M3发布。 Kimi 6月12日 K2.7-Code发布。 6月13日GLM-5.2发布。

55440

不只是 mem0:YC CEO 开源了他的 AI 记忆引擎,正则替代 LLM 撑起一张知识图谱

术哥

大部分知识图谱系统靠 LLM 抽取实体关系。GBrain 不一样:它的知识图谱靠正则表达式 + 上下文动词匹配构建,所有函数都是纯函数,零 LLM 调用。核心逻...

14310
领券