使用NNCF(神经网络压缩框架)量化与压缩YOLO11

OpenCV学堂

发布于 2026-04-02 19:32:00

1140

文章被收录于专栏：贾志刚-OpenCV学堂贾志刚-OpenCV学堂

NNCF介绍与安装

NNCF提供了一系列的训练时量化与训练后量化神经网络的接口支持，支持ONNX、OpenVINO、Pytorch等多种模型格式的压缩与量化。同时NNCF不光支持CNN系列模型的压缩与量化，还支持大模型（包含LLM与VLM）压缩与量化转换。

训练后压缩量化支持以下算法：

从中可以看出，先把模型转换为OpenVINO的IR格式以后会比直接用ONNX格式模型获取更多压缩算法支持，比如：权重压缩支持。

训练时压缩与量化支持算法：

推荐版本第三方依赖版本：

pytorch2.6
openvino2025.1
opencv-python4.10

安装NNCF

pip install nncf

模型量化与压缩

训练后量化（PTQ）YOLO系列INT8

这里以YOLO11为例，实现自定义YOLO11对象检测模型的训练后量化，通过PTQ在维持精度的同时大幅提升推理速度。PTQ 是最简洁的INT8量化方法，只需要模型和一个小的（~300 个样本）校准数据集即可实现对模型的INT8量化。对训练后的模型转为IR格式以后用，OpenVINO的NNCF框架把模型量化为INT8模式。PTQ的量化代码如下：