一、版本概览
ragflow v0.25.6 于 2026年5月26日 发布,是一次覆盖 Agent、RAG、API、Go 驱动、文档解析、异步调度、权限安全、国际化 等多个模块的综合性更新。
从这次发布内容来看,v0.25.6 并不是单点功能补丁,而是一次明显偏向 能力补齐、体验增强、问题修复、生态扩展 的版本升级。
本次版本最值得关注的方向包括:
- • Agent 新增 Browser 组件,让 AI 能够自主浏览和操作网页
- • RAG RAPTOR 构建升级到 AHC 模式,语义扩展从文档级别提升到数据集级别
- • Agent 新增轻量级
@tool 装饰器,简化 Python 函数注册流程 - • Agent 消息支持显示 base64 图片
- • Doc Generator 文件元数据可作为独立变量暴露
- • Agent chat completion 支持传入
chat_template_kwargs - • /chat/completions 接口支持只发送最新消息
- • 检索阶段向量相似度权重修复
- • 大量异步、解析器、表格、HTML、日志、文档状态、空响应等问题修复
- • Go 侧继续补充大量模型与能力驱动
- • 安全性增强,包括 SSRF、防止 user_id 伪造、敏感字段泄露修复
- • 国际化完善,法语翻译补齐大量缺失项
- • 最低 Python 版本提升到 3.13
下面将严格按照本次发布内容,完整梳理 v0.25.6 的更新要点。
二、新功能:Agent 新增 Browser 组件
本次版本最核心的新功能之一,是 Agent 新增 Browser 组件。
这个组件的作用是:
让 AI 能够 自主导航并与网页交互。
这意味着 Agent 不再只是被动接收页面内容,而是可以具备更强的网页操作能力,在实际使用中可以执行更多基于浏览器的任务。对于需要网页访问、页面交互、信息获取、在线操作等场景来说,这项能力是非常关键的补强。
从版本说明来看,这一新增功能属于 Agent 能力层面的重要扩展,也是 v0.25.6 最具代表性的新增特性之一。
三、RAG 改进:RAPTOR 构建引入 AHC 模式
在 RAG 方面,本次版本对 RAPTOR 构建 做了重要升级,引入了 AHC 模式(Ψ-RAG)。
1. 语义扩展维度升级
AHC 模式的特点是:
将语义扩展从 文档级别 提升到了 数据集级别。
这意味着构建索引时,系统不仅仅是围绕单篇文档做语义聚合,而是可以在更大范围的数据集合上进行语义建模,从而增强整体的结构表达能力。
2. 构建性能提升
版本说明明确指出:
- • 索引构建性能显著高于旧 RAPTOR
- • 在 Recall@5 和 平均 F1 上也优于旧 RAPTOR
也就是说,这次升级不仅是“快”,同时也是“准”。
3. 支持模式切换
用户可以在 AHC 和 GMM 模式之间切换。
这说明系统保留了不同构建策略的选择能力,便于根据实际场景做灵活配置。
4. 本版本修复问题
该特性在 v0.25.3 中已引入,本次 v0.25.6 主要是 修复了多个相关 Bug,进一步增强稳定性与可用性。
四、Agent 改进:轻量级 @tool 装饰器
本次版本新增了一个非常实用的 Agent 改进:
轻量级 @tool 装饰器。
它的目标是 简化 Python 函数注册流程,让开发者更方便地把 Python 函数注册给 chat 模型使用。
从开发体验角度看,这种轻量化的装饰器形式,能够减少样板代码,提升工具定义效率。
这是 Agent 工程化体验上的一个明确优化。
五、Agent 改进:消息支持显示 base64 图片
Agent 消息现在支持显示 base64 编码图片。
这项改进的意义在于:
- • 提高多模态消息展示能力
- • 使 Agent 消息不再局限于纯文本
- • 在实际交互中可以更自然地携带和展示图片内容
这对于图文混合、截图展示、视觉信息传递等场景非常有帮助。
六、Agent 改进:Doc Generator 文件元数据作为独立变量暴露
本次版本还改进了 Doc Generator 组件。
现在,Doc Generator 组件的 文件元数据 可以作为 离散变量 暴露出来。
这意味着开发者在处理文档生成流程时,可以更精细地访问和使用这些元信息,提升工作流灵活性。
七、Agent 改进:支持传入 chat_template_kwargs
Agent chat completion 接口现在支持开发者传入 chat_template_kwargs。
这一能力的开放,意味着在构建 chat completion 请求时,可以对模板参数进行更细粒度的控制。
从版本描述来看,这是对 Agent chat completion 接口能力的一次增强。
本次版本修复了一个非常实用的接口问题:
/chat/completions 现在允许请求体中只发送最新消息,不再强制要求传递完整对话历史。
这意味着:
- • API 调用更轻量
- • 请求体更简洁
- • 更适合“只传当前轮输入”的调用方式
- • 也更符合实际集成中的常见使用习惯
这一点在版本说明中被单独强调,说明是一个重要的 API 行为修复。
九、检索修复:向量相似度权重在检索阶段未生效
本次版本修复了一个 RAG 检索相关问题:
向量相似度权重在检索阶段没有被正确应用。
这类问题会直接影响检索结果排序和召回质量。
版本修复后,相关权重能够在检索阶段正确生效,使检索行为更符合配置预期。
十、数据集与配置页面修复
本次版本修复了多个管理页面问题:
1. 解析器配置保存失败
修复了 数据集配置页面中 parser configs 无法保存 的问题。
2. 数据源详情页日志显示不完整
修复了 数据源详情页面日志不能完全展示 的问题。
3. 文档状态过滤失败
修复了 document status filtering failure 的问题。
这些都是影响日常运维和配置管理的关键体验问题。
十一、空响应与解析修复
本次版本也修复了一些更底层的健壮性问题:
- • 修复了 空 LLM choices response 时的 crash guard 问题
- • 修复了 HTML 标签在 ingestion pipeline parser output 中残留 的问题
- • 修复了 table parser metadata 问题
- • 修复了 empty file 的提示问题,使错误信息更清晰
这些修复共同提升了 ingestion 和解析链路的稳定性。
十二、RAG RAPTOR 相关修复
除了 AHC 模式升级外,本版本还修复了 RAPTOR 的构建问题:
- • 修复了 使用 Infinity document engine 时 RAPTOR 构建过程停止 的问题
这说明 RAPTOR 相关功能在不同文档引擎下的兼容性得到了进一步修正。
十三、流式响应解析修复
本次版本修复了:
- • Mistral / Upstage reasoning models 的流式响应解析问题
这类问题主要影响模型流式输出的稳定解析,修复后有助于提升 reasoning 模型在流式场景中的可用性。
十四、异步与事件循环问题修复
本次版本对 asyncio 相关问题做了集中修复,包括:
- • 修复 asyncio event loop nesting
- • 修复 fire-and-forget task 问题
- • 修复 asyncio.Semaphore bound to different event loop 错误
- • 修复了与 asyncio 正确性相关的问题
这些问题通常出现在高并发、异步任务调度或多事件循环环境中,修复后将显著提升系统稳定性。
十五、Agent 相关 bug 修复
Agent 在本次版本中也有多项修复:
- • 修复 Agent component prompt variable 消失 的问题
- • 修复 search vector_similarity_weight 相关问题
- • 修复 agent attachment download api 的移动问题
- • 修复 agent 创建与更新 API 中 canvas_type 的支持问题
这些都属于 Agent 功能细节上的关键修正。
十六、API 与安全性增强
本次版本在 API 与安全方面也有多项重要修复:
1. session user_id 伪造修复
修复了 通过 request body 伪造 session user_id 的问题。
2. /dify/retrieval 权限校验
修复了 /dify/retrieval 中 kb ownership 校验 问题。
3. 敏感字段泄露防护
修复了 用户 API 响应中敏感字段泄露 的问题。
4. SSRF 防护
修复了 misc_utils.download_img 在 OAuth avatars 场景下的 SSRF 风险。
这些改动说明本次版本对安全性进行了明显加固。
十七、文档与工具能力修复
本次版本还修复或增强了文档相关能力:
- • 修复 /documents/{id}/download 相关问题后又进行了回退处理
- • 修复 解析器输出中的 HTML 标签
- • 修复 PDF 文档顶部红色高亮替换为黄色
- • 修复 chunk 标签列表显示
- • 提供了 chunk management、chat assistant、retrieval 的 SDK 和 cURL 示例
- • 修复 metadata 相关问题
这些更新有助于提升文档处理、展示和接口调用的可用性。
十八、Go 侧能力大规模补齐
本次版本中,Go 相关驱动和模型支持非常丰富,涉及大量 provider、embed、rerank、ASR、TTS、OCR 等能力扩展。下面按内容完整整理。
1. 新增或补充的 provider / driver
- • TogetherAI
- • n1n.ai
- • GPUStack(chat)
- • Azure OpenAI 模型驱动
- • PPIO provider
- • Groq provider
- • Tencent Hunyuan provider
- • TokenPony provider
- • HuaweiCloud model provider
- • ModelScope provider
- • OrcaRouter provider
- • FuturMix provider
- • TokenHub provider
- • AWS Bedrock provider
2. 新增 embed 能力
- • TogetherAI embed
- • Xinference embed
- • Tencent Hunyuan embed
3. 新增 rerank 能力
- • Xinference rerank
- • Novita rerank
- • DeepInfra rerank
- • TogetherAI rerank
4. 新增 ASR / TTS 能力
- • Xinference ASR
- • Xinference TTS
- • TogetherAI ASR
- • TogetherAI TTS
- • ZhipuAI ASR
- • OpenRouter ASR
- • Groq reasoning_chat、TTS、ASR
5. 新增 OCR 能力
- • ZhipuAI OCR
- • Baidu OCR 输入校验
- • PaddleOCR_Local provider
- • hosted OCR providers 通过 drivers 路由
6. 其他 Go 侧能力
- • OpenAI audio endpoints 支持
- • Ollama 的 chat、listmodels、embed 重写
- • Elasticsearch functions in Go
这些内容说明 Go 生态能力在本版本中持续扩展,覆盖更多模型服务与多模态任务。
十九、Evaluation 与测试增强
本次版本还涉及评估和测试能力增强:
- • evaluation 中增加 token usage 跟踪
- • 增加新的 restful api suite 测试与测试用例
- • 改进 retry 和 timeout
- • 改进 CI
这些变化主要提升研发质量、测试覆盖与持续集成稳定性。
二十、国际化与文档更新
本次版本也完成了不少文档和国际化工作:
- • 将 Python 最低版本要求提升至 3.13
- • 更新 README 和文档中的版本引用到 v0.25.6
- • 更新 v0.25.5 发布说明
- • 完成 Discord 集成指南
- • 初稿与草稿形式的 v0.25.6 发布说明同步完善
- • 法语翻译补齐约 1400 个缺失键
这说明项目在文档、版本维护和语言支持方面也持续推进。
二十一、其他修复与完善
除了前述大项,本次版本还包括以下修复与调整:
- • 修复 API 路径错误
- • 修复 任务语言缺失
- • 修复 模型类型加入 llm_setting
- • 修复 OpenAI chat completion 与 session_id / conversation_id 关联问题
- • 修复 文档下载内容类型推断相关问题后回退
- • 修复 数据源详情日志显示不完整
- • 修复 表格解析 metadata
- • 修复 PDF 高亮颜色
- • 修复 空文件报错信息
- • 修复 tag list 显示
- • 修复 parser config 保存问题
- • 修复 restful api suite 测试
- • 修复 agent attachment download API
- • 修复 search vector_similarity_weight
- • 修复 prompt variable 消失
- • 修复 canvas_type 支持
- • 修复 敏感字段泄露
- • 修复 SSRF
- • 修复 empty LLM choices
- • 修复 event loop 相关问题
这些修复覆盖了前后端、API、任务调度、解析链路和安全边界多个层面。
二十二、版本总结
代码地址:github.com/infiniflow/ragflow
总体来看,ragflow v0.25.6 是一次非常全面的版本更新,核心特征可以概括为:
- 1. Agent 能力增强
- • Browser 组件
- •
@tool 装饰器 - • base64 图片展示
- • 文件元数据独立暴露
- •
chat_template_kwargs 支持
- 2. RAG 能力升级
- • RAPTOR 引入 AHC 模式
- • 构建性能和检索指标提升
- • 修复 Infinity engine 兼容问题
- • 修复向量相似度权重问题
- 3. API 行为优化
- • /chat/completions 允许只传最新消息
- • 权限、会话、路径、响应结构等问题修复
- 4. 稳定性全面提升
- • async / event loop 修复
- • parser / metadata / HTML / table 修复
- • 空响应、空文件、流式解析修复
- 5. 安全性增强
- • 防 user_id 伪造
- • 防敏感字段泄露
- • 防 SSRF
- • 权限校验加强
- 6. 生态扩展
- • 大量 Go provider、embed、rerank、ASR、TTS、OCR 能力补齐
- 7. 工程化完善
- • 测试增强
- • CI 改进
- • 文档更新
- • Python 3.13 适配
- • 法语翻译补齐
如果从“升级价值”来看,v0.25.6 兼具 功能增强、性能优化、问题修复和生态扩张 四个维度,属于非常值得关注的一次版本更新。
·
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。
欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。
·