首页
学习
活动
专区
圈层
工具
发布

#路由

国产大模型API选型,别再盲目跟风了

用户12493922

000

国产大模型选型指南:避开这3个坑

用户12493922

700

《最常见 50 条 BGP 配置命令》(华为 VRP 企业网络实战版)

知孤云出岫

BGP(Border Gateway Protocol,边界网关协议)是互联网和大型企业网络中使用最广泛的路径矢量路由协议(Path Vector)。

6410

多模态大模型落地:开发者最该避开的三个坑

用户12493922

6310

AI写代码终于不瞎烧钱了:边车路由让顶级性能成本直降35%

用户11563501

传统模型路由是个看起来很美的东西:基准测试能打,真用来写生产代码就掉链子,省的那点钱还不够改bug的。强如OpenAI和Anthropic都在模型路由上栽跟头,...

11310

从 PilotDeck 源码看 AI Agent 路由架构的设计方法论

heidsoft

外部扩展可以实现自己的路由逻辑,通过 CustomRouterRegistry 注册进来。RouterRuntime 在决策时优先调用自定义路由。

10210

OpenClaw 3.2 重磅更新:PDF 原生支持上线,4 项破坏性变更你必须知道!

用户1640761

旧行为: 新安装默认包含编程、系统等全套工具。 新行为:tools.profile 默认值改为 messaging,不再自动加载代码执行和系统操作类工具。

9300

Perplexity Computer vs Claude Cowork:19 模型云端超级大脑 vs Claude 桌面深度执行官,谁才是你的终极数字搭档?

用户1640761

2 月 26 日,Perplexity 官宣 Perplexity Computer;近期,Anthropic 也重磅更新了 Claude Cowork 插件。...

11600

11-Reward不是一个分数函数这么简单

anzhsoft

上一篇写 KL、clip、entropy,说明 actor 更新需要限速器。但限速器限制的是 reward 和 advantage 驱动出来的更新方向。继续往前...

11100

一周七条重磅,2026年下半场AI竞争的三条主线已经画好了

袁锐钦

这是一个多智能体编排系统。你调一个API,它自动把任务路由到GPT-5.5、Gemini 3.5、Claude Opus等模型池里最合适的那个。你自己不用管理多...

21710

智谱开源 slime 框架研究报告

勇哥AI笔记

国内几家大模型在不同的方向上投入资源,而且开源出来造福全行业。每个模型团队在训练时可以采集各家之长,每一家的技术突破都会迅速变成全行业的“公共养料”。

18910

模型之外的事——这一周,三个信号不约而同

用户10097875

这一周,技术圈很安静。没有新模型刷屏,没有跑分屠榜,朋友圈也没出现那种“不学就被淘汰”的标题。

8610

多智能体架构下的多轮对话上下文管理:从设计到实现

tunsuy

单体 Agent 的多轮对话很简单——所有消息都在一个 messages[] 列表里,LLM 天然能理解上下文。但当架构变成这样时:

14110

RAG模式到底有8种?还是9种?还是25种?

jeffery_jcm

首先一句话通俗解释什么是RAG? 全称: Retrieval-Augmented Generation (检索增强生成) :RAG是一种结合信息检索与大语言模型...

10200

vLLM的语义路由框架:把"改策略"从工程问题变成配置问题

唐国梁Tommy

这篇来自 vLLM 开源社区的工作不是在刷榜,而是在解决一个实际的系统工程问题:当企业同时运行十几个来自不同提供商的语言模型,一条请求进来,谁来决定路由给哪个模...

15510

KAIST最新研究:一文读懂UniversalRAG如何实现多模态、多粒度的高效检索

唐国梁Tommy

今天,我们要深入探讨一个最新框架——UniversalRAG。这篇来自KAIST与DeepAuto.ai的最新研究,不仅仅是对现有RAG技术的简单升级,更是一次...

9300

22M 小模型搞定 Tool 路由一份蒸馏训练方案从架构到部署

javpower

最开始我让 GPT-4o / Qwen 直接判断 "该调哪些 tool",效果不差,但生产上有三个硬伤:

11310

用 SDD 方法开发一个 AI Gateway

用户5602664

企业用大模型,四个问题绕不开:谁在调模型?敏感数据有没有出内网?花了多少钱?出事怎么查?AI Gateway 做的就是在客户端和上游模型之间插一层治理层,把这四...

10310

ECCV 2026 | GeoSR:让VLM真正用上几何信息,静态/动态空间推理均达SOTA!

Amusi

过去几年,VLM 在图像理解、视频问答、多模态对话上进展很快。它们可以识别物体、描述场景、总结事件,甚至完成不少复杂问答。但空间推理并不是简单的语义识别。

15310
领券