



2026 年 5 月 30 日,LlamaFactory 正式发布 v0.9.5。这是一个 Immutable release,意味着该版本发布后,只有 release title 和 notes 可以被修改。从这次更新说明来看,v0.9.5 的核心方向非常明确:新增对 Qwen3.5、Qwen3.6、Gemma4 的主力支持,并完成对 Transformers v5 的兼容适配。
如果用一句话概括这个版本,那就是:模型支持继续快速扩容,v1 训练栈持续补强,分布式与多后端训练能力进一步完善,同时大量修复围绕 Qwen3.5、Gemma4、多模态、Transformers v5 的兼容问题。
下面就按照功能模块,对 LlamaFactory v0.9.5 的更新内容进行完整梳理。
v0.9.5 最醒目的升级,就是在版本标题中直接点明了两件事:
这意味着,这一版已经把新一代主流模型和新版 Transformers 生态的适配,推到了核心支持层面。围绕这个目标,后续整个更新列表里也能看到大量与这些模型和框架相关的补丁、功能接入与兼容性修复。
尤其是 Qwen3.5 和 Qwen3.6,这次不仅是“支持”,而是围绕模板、视觉模块、projector 路径、packing、FlashAttention、NPU、Liger Kernel、文档等多个层面进行了完善,说明其在实际训练与使用链路中的适配已经非常深入。
在模型支持方面,LlamaFactory v0.9.5 延续了高频扩展节奏,新增和完善的模型覆盖语言模型、多模态模型、视觉语言模型以及多种训练场景。
本次新增或增强支持的模型包括:
除了模型本体的支持外,还有多项与模型生态配套的更新:
这意味着 v0.9.5 不只是简单“识别模型”,而是把模型模板、示例、工作流、容器环境、生态文档和自动化流程一并跟上了。
如果把本次更新按模型聚焦来看,Qwen3.5 无疑是最重要的适配对象之一。相关更新非常多,覆盖了从模型注册到模板、从视觉模块到训练性能、从多后端到文档修复的完整链路。
与 Qwen3.5 / Qwen3.6 直接相关的更新包括:
另外还包括与 Qwen3-Next 相关的专项增强:
这组更新非常能说明问题:LlamaFactory v0.9.5 对 Qwen3.5/3.6 的支持已经不只是“能跑”,而是开始进入模板、视觉、多模态、打包、训练后端、NPU、Kernel 优化、FlashAttention、文档一致性的全面成熟阶段。
除了 Qwen3.5/3.6,Gemma4 也是本版本标题级重点。对应更新包括:
这说明 Gemma4 的支持并不仅是模型入口层面的接入,还包括多模态 token 类型、padding 细节以及 projector 模块检索修复。对于实际训练和多模态适配来说,这些通常都属于非常关键的落地问题。
v0.9.5 的另一条主线,是 v1 训练体系 的持续建设。更新说明中有大量以 v1 标注的改动,表明该体系正在快速完善。
这部分新增能力包括:
从这些内容可以看出,v1 在本版本已经覆盖了训练初始化、采样、渲染测试、批处理生成、SFT、LoRA/Freeze、量化、DeepSpeed、FSDP2、恢复训练、MoE Kernel、FlashAttention、动态 batching 等多个关键模块,已经形成比较完整的训练能力拼图。
特别值得关注的是三块能力:
相关更新包括:
这说明 FSDP2 已经不只是初步接入,而是扩展到了 SFT、DPO/KTO、并行策略、初始化流程和设备网格修复层面。
相关更新包括:
相关更新包括:
这部分更新非常契合大模型训练对吞吐、显存和并行效率的需求。
v0.9.5 的另一个核心主题,是适配 Transformers v5。从更新清单看,这并不是一句口号,而是经过了大量分散修复之后形成的整体兼容。
与 Transformers v5 直接相关的更新包括:
此外,还有一些兼容性相关更新也属于适配过程中的关键组成部分:
可以说,LlamaFactory v0.9.5 在新版本 Transformers 生态下已经完成了模型加载、序列化、导出、测试、依赖边界、文档要求等多个层面的适配。
在训练基础设施方面,这一版继续加强多种后端与分布式场景的可用性。
相关更新包括:
这些更新覆盖了分布式启动、日志并发安全、数据集采样策略、性能剖析、MoE、奖励模型训练、NPU 后端等多个方向,说明 v0.9.5 对复杂训练任务的支持在进一步增强。
这一版还有一个很明显的特点,就是多模态细节修复数量很多。这说明项目正在处理越来越多真实训练和推理链路中的边缘情况。
相关更新包括:
再加上前面提到的 Gemma4、Qwen3.5 的视觉部分修复,可以看出多模态已经是这一版本非常重要的适配方向之一。
数据链路方面,v0.9.5 也有不少很实用的修复和增强:
这些更新说明,LlamaFactory v0.9.5 不仅在模型和训练层升级,也在面向真实数据集、OpenAI-style message 格式、tool_calls、对话式训练样本处理等方面做了较多兼容工作。
围绕训练配置、模板与样例使用,本次也有不少补丁:
这些改动对于实际落地非常重要。很多时候版本升级并不卡在大功能,而是卡在模板路径、打包策略、配置字段、示例不一致这些细节上。v0.9.5 在这些方面补得很细。
除了功能本身,这一版也同步进行了不少文档、依赖和 CI 基础设施更新。
相关内容包括:
可以看出,这一版不仅在功能层推进,还在构建、测试、CI 缓存、容器镜像和文档说明上同步完善,让整个版本更适合持续维护和部署。
还有一些虽然不属于某一个大类,但同样值得记录的重要修复与增强:
这些补丁共同构成了版本稳定性的底层支撑。
如果把这次版本压缩成几条主线,可以归纳为以下几点:
Qwen3.5、Qwen3.6、Gemma4 是这次的核心主角,同时新增和补齐了大量模型支持,包括 Youtu-LLM-2B、LFM2.5、LFM2.5-VL、Phi-4-mini、HY-MT、Hunyuan、youtu-vl、MiniCPM-o-4.5、GLM-4.7-Flash、GLM-OCR、Aeva、Hy3-Preview、MiniCPM-V-4.6 等。
从依赖、导出、序列化、测试、meta 初始化,到 safe_serialization 参数、429 错误处理、版本边界控制,v0.9.5 围绕 Transformers v5 做了大量实战补丁。
插件、CLI sampler、渲染测试、batch generator、SFT、LoRA/Freeze、量化、DeepSpeed、FSDP2、恢复训练、FlashAttention、动态 padding-free batching、fused moe kernel 等能力都在继续补齐。
视觉模块、projector、timestamp、audio_processor fallback、视频训练、dummy image、mixed multimodal payloads 等问题都得到了修复。
包括 Ray 分布式启动、LoggerHandler 竞态修复、Profiler、KTransformers、NPU、ROCm、CI 缓存、GitHub Actions、Docker 等。
代码地址:github.com/hiyouga/LlamaFactory
总体来看,LlamaFactory v0.9.5 是一个覆盖面极广、工程含量很高的版本。它的重点并不只是“新增几个模型”,而是围绕 Qwen3.5/Qwen3.6/Gemma4 + Transformers v5 这个核心目标,把模型支持、训练框架、分布式能力、多模态处理、模板配置、CI 环境、文档说明一起往前推进了一大步。
对于关注 LlamaFactory 的开发者来说,这个版本最值得注意的几个关键词就是:
·
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。
·