首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >90%的人都误解了模型微调,到底何时应该使用模型微调

90%的人都误解了模型微调,到底何时应该使用模型微调

作者头像
匙亮旭
发布2026-06-17 16:16:04
发布2026-06-17 16:16:04
290
举报

现在有这样一个常见的场景,老板这样问:小王啊,我们企业有1T的PDF文档,现在想要做知识检索,之前咱们用RAG方式做的知识检索不太好用,幻觉率太高,而且回答速度实在太慢了,20秒才能出结果。你说把这1T的PDF文档直接微调进大模型怎么样,那样是不是回答就快了,而且幻觉也能降低一些,毕竟都让模型学会了。

小王自己结合之前看的一些AI文章,感觉老板说的很有道理,现在做知识检索,无非就是RAG或者直接把知识微调进模型里,让知识根深蒂固刻在模型骨子里,那既然RAG不行,那就微调吧。

我相信,很多人都这样认为的,但真的应该这么做吗?今天跟大家聊聊大模型微调这件事。

------

首先我们要明白大模型微调(Fine-tuning)的本质,是要调整其模型内部参数的分布,让模型学会特定的指令和语言风格,做格式对齐和风格迁移,尤其以LoRA为代表的微调方式。而上面的场景中,你要把1T的PDF文档作为知识微调到大模型中,这一步其实应该是大模型预训练阶段(Pre-training)应该做的事,或者再做一次增量预训练。为了更好地理解,我们举一个例子来说明:

假如,你面前坐着一个精通20种语言,读过世界上所有百科全书的天才翻译家。预训练过程就是他在过去的20年里,阅读了图书馆里数亿册的书籍,学会了语言的逻辑、世界的知识、人类的情感,但此时他是一个全才,但他不知道该为谁服务。

而微调呢,就好比现在你雇佣他去参加一场【顶级医疗学术会议】做同声传译,你不需要再教他什么是生物学,也不需要让他背诵1TB的医学百科(那应该是他在过去20年预训练里做的事)。而你需要告诉他,在这场会议里,请不要用口语化的词汇,所有的‘发烧’都要翻译成‘发热’,所有的输出必须严格遵守‘术语-解释-建议’的结构,并且说话语气要极其专业冷静,而这才是微调应该做的事,要对齐规范。

说到这里,大家应该理解了微调是用来做什么的了。那如果,我们将这1T的PDF文档微调进大模型后,会有什么后果呢?

第一个,必然是降低其原有的通用能力。因为微调后,模型一定会因为过度关注这些新内容,而突然忘了或降低了其原本一些通用的能力,甚至忘了怎么流利地组织普通句子,这都有可能。第二点,幻觉会更加严重。因为模型可能只是记住了这些新内容表面,没理解其深层逻辑,最后就会造成它会胡乱组合一些词汇,一本正经的胡说八道,然后还很难发现,例如,虚构了一个不存在的产品参数,或者给出了一个错误的产品参数值,这类问题往往很难发现,但是带来的后果绝对是灾难性的。

所以,最后总结一下,微调的本质是行为对齐和模式识别,而非知识注入

------

其实,上面通过RAG外挂知识库的方式做知识检索,对现阶段AI发展而言,是正确的方案,只不过效果不佳的原因有很多,例如有可能是数据清洗阶段没做好,或者所选择的Chunk方式不合理,又或者是Embedding模型能力有限,Retrieval算法不合理,没有做Rerank处理,提问的Prompt命中率低等,原因太多了,所以我们需要一步步具体分析,结合精度、召回率和F值综合进行评估。

(正文完)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-02-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 极客e家 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档