一句话解释,RAG就是:让大模型在回答问题之前,先来"查资料",然后再根据查到的资料来回答。
如同:
大模型虽然很聪明,但它有几个天生的问题:
RAG 正好能解决这三个问题。
分三步走,就像你在做"开卷考试":
普通大模型(闭卷): 问:"2025年奥运会的主办城市是哪里?" 模型(知识只到2023年)可能回答:“2025年没有奥运会” 或瞎猜一个"巴黎"。(实际上2024巴黎,2025确实无夏季奥运会,但若问2026冬奥会它可能错) → 容易出错。
RAG 模型(开卷): 问同样问题 → 系统去维基百科或官方新闻检索 → 找到"2026年冬季奥运会将在米兰-科尔蒂纳举行" → 模型基于这个资料回答:"根据最新信息,2026年冬季奥运会将在意大利的米兰-科尔蒂纳举行。" → 准确,而且可以附上来源链接。
问题 | RAG 如何解决 |
|---|---|
知识过时 | 实时检索最新资料(新闻、数据库、网页) |
幻觉瞎编 | 强制模型基于检索到的真实内容作答,没有资料就不瞎说 |
无法访问私有数据 | 可以把公司内部文档、个人笔记作为知识库,实现"企业版GPT" |