YOLO26 + BiFPN:多尺度特征融合 YOLO26 的 Neck 有几种不同的实现。这篇单独说说 YOLO26 + BiFPN 这个版本——只升级 Neck,不动检测头。 和原版 YOLO26 Neck 的对比 原版 YOLO26 用的是 PAFPN(带有自顶向下和侧向连接的特征金字塔)。 512] reg_max: 16 freeze_backbone: 0 lr0: 0.0005 weight_decay: 0.0005 mosaic: 0.8 mixup: 0.1 配置和原版 YOLO26 Neck 不想引入 Decoupled Head 的额外复杂度 想要比 PAFPN 更轻量的实现 不太适合的场景: 追求最高精度(原版 PAFPN 更好) 多尺度目标检测(真正的双向融合更合适) 以上是 YOLO26
二是 YOLO26:更简化的设计,直接端到端出检测结果。不用再搞后处理了呢,利于边缘做部署。 既然 YOLO 上新了,那一起玩一玩吧 ☺️体验 YOLO-Master: https://huggingface.co/spaces/gatilin/YOLO-Master-WebUI-Demo体验 YOLO26 : https://platform.ultralytics.com/ultralytics/yolo26以下则是动手实践了呢。 # 如果使用多 GPU scale=0.5, mosaic=1.0, mixup=0.0, copy_paste=0.1)YOLO-Master 还可以 LoRA 微调 ☺️YOLO26 环境准备 Conda 环境,conda create -n yolo26 python=3.12conda activate yolo26# Install PyTorch (CPU version)pip
YOLO26介绍 YOLO26是一个原生的端到端模型,直接生成预测结果,无需非极大值抑制(NMS)。通过消除这一后处理步骤,推理变得更快、更轻量,并且更容易部署到实际系统中。 这种突破性方法最初由清华大学的王傲在YOLOv10中开创,并在YOLO26中得到了进一步发展。 主要改进 DFL 移除 分布式焦点损失(DFL)模块虽然有效,但常常使导出复杂化并限制了硬件兼容性。 YOLO26 完全移除了 DFL,简化了推理过程,并拓宽了对边缘和低功耗设备的支持。 端到端无NMS推理 与依赖NMS作为独立后处理步骤的传统检测器不同,YOLO26是原生端到端的。 CPU推理速度提升高达43% YOLO26专为边缘计算优化,提供显著更快的CPU推理,确保在没有GPU的设备上实现实时性能。
本文主要内容:YOLO26全新发布(原理介绍+代码详见+结构框图)| YOLO26如何训练自己的数据集(NEU-DET为案列)结构框图如下: 博主简介AI小怪兽 | 计算机视觉布道者 | 视觉检测领域创新者深耕计算机视觉与深度学习领域 除架构外,本研究将YOLO26定位为多任务框架,支持目标检测、实例分割、姿态/关键点估计、定向检测及分类。 文章重点展示了YOLO26在机器人、制造业及物联网等领域的实际应用案例,以证明其跨行业适应性。最后,讨论了关于部署效率及更广泛影响的见解,并展望了YOLO26及YOLO系列的未来发展方向。 YOLO11 vs YOLO26结构差异性1.1.1 SPPF 核心差异对比1)池化次数灵活性:YOLO11 的 3 次池化是硬编码的,要修改必须改源码;YOLO26 通过n参数可灵活调整(比如设为 C3k2代码: 源码位置:ultralytics/nn/modules/block.py1.2 YOLO26核心创新点YOLO26引入了多项关键架构创新,使其区别于前几代YOLO模型。
YOLO26 的架构遵循三个核心原则: 简单:YOLO26 是一个原生的端到端模型,无需非最大抑制(NMS)即可直接生成预测结果。 培训创新:YOLO26 引入了MuSGD 优化器,它是SGD和Muon的混合体,灵感来自 Moonshot AI 在 LLM 训练中取得的Kimi K2突破。 YOLO26 完全取消了 DFL,简化了推理,扩大了对边缘和低功耗设备的支持。 端到端无 NMS 推断 与依赖 NMS 作为单独后处理步骤的传统检测器不同,YOLO26本身就是端到端的。 CPU 推理速度提高 YOLO26 专门针对边缘计算进行了优化,大大加快了CPU 推理速度,确保在没有 GPU 的设备上实现实时性能。 最后 目前为止YOLO26还未发布,官方何时正式发布,尚无确切消息!只是让大家敬请期待。先放一个卫星,让大家高兴一场
点击上方蓝字关注我们 微信公众号:OpenCV学堂 关注获取更多计算机视觉与深度学习知识 YOLO26系列模型 YOLO26 基于深度学习和 计算机视觉领域的最新进展构建,具备端到端NMS 推理和优化的边缘部署能力 对于稳定的生产工作负载,YOLO26 和 YOLO11 均值得推荐。 对象检测部署 YOLO26对象检测模型,基于COCO数据集训练,支持80个类别对象检测,相比YOLO11,它的输出框的总数目更少,更适配边缘端侧部署。 ONNX格式的YOLO26对象检测预训练模型的输入与输出格式如下: 其中输出格式为300x6, 300表示输出框的数目,6个数据中前面四个x,y,w,h后面两个是得分跟类别。 ONNX格式的YOLO26姿态评估预训练模型的输入与输出格式如下: 其中输出格式为300x57, 300表示输出框的数目,57个数据,前面6个数据跟对象检测输出完全一致,后面的51个数据是个17个关键点
YOLO26介绍 YOLO26是Ultralytics于2025年9月发布的最新目标检测模型,专为边缘和低功耗设备设计,在速度和部署效率上实现重大突破。 客户端调用代码 OpenVINOYOLO26Detector detector = new OpenVINOYOLO26Detector(); detector.Detect(); 第二步:完整代码 - 构建YOLO26 Mat res_mat = Visualize.draw_det_result(result, frame); Cv2.ImShow("YOLO26
为什么是YOLO26?在YV25上,Glenn Jocher也解释为什么是YOLO26?他们其实也是参考了苹果公司的命名思路。 所以这就是 YOLO26 的命名原因。但核心性能是否又升级呢? 正如 Glenn Jocher 在所说:“最大的挑战之一就是确保用户能够最大限度地利用YOLO26,同时还能提供最佳性能。” 这句话或许揭示了YOLO版本号的跃升会和苹果一样:YOLO26并非简单迭代,而是一次架构层面的重构与革新。目前,YOLO26模型仍在润色中,性能数据也仅为初步结果。 使用YOLO26检测图像中物体的示例YOLO26的核心突破:更好、更快、更小根据Ultralytics官方提供的数据中我们可以粗略了解到YOLO26延续了YOLO系列的一贯优势,同时在三个方面实现了显著提升 得益于其简化的架构,YOLO26可以很好地处理量化,在这些量化级别上都能提供一致的性能。从机器人到制造业:YOLO26的实用价值YOLO26的性能提升在实际应用中意义重大。
YOLO26入门指南——目标检测界的"一眼万年" 2.0 用吃火锅、找对象的比喻,让你秒懂这个"看一眼就懂"的AI黑科技 新版特性:更快、更准、更懒(自动标注)一、YOLO26到底是个啥? (YOLO26通常很准,微调即可)状态对吗?(睡觉 vs 拆家,对二哈很重要)4. 八、YOLO26内部在干啥? 特供版Q1:YOLO26和YOLO11有什么区别? Q4:YOLO26的模型文件更大吗?
除架构外,本研究将YOLO26定位为多任务框架,支持目标检测、实例分割、姿态/关键点估计、定向检测及分类。 文章重点展示了YOLO26在机器人、制造业及物联网等领域的实际应用案例,以证明其跨行业适应性。最后,讨论了关于部署效率及更广泛影响的见解,并展望了YOLO26及YOLO系列的未来发展方向。 YOLO11 vs YOLO26结构差异性1.1.1 SPPF 核心差异对比1)池化次数灵活性:YOLO11 的 3 次池化是硬编码的,要修改必须改源码;YOLO26 通过n参数可灵活调整(比如设为 核心创新点YOLO26引入了多项关键架构创新,使其区别于前几代YOLO模型。 这使得YOLO26对于移动设备、无人机和嵌入式机器人平台特别有利,在这些平台上,毫秒级的延迟可能产生重大的操作影响。
作为YOLO系列的最新成员,YOLO26承诺成为更好、更快、更小的Vision AI模型,专门为边缘和低功耗设备设计。为什么YOLO26是游戏规则改变者? 实际应用场景:从机器人到智能交通YOLO26的轻量化和高精度特性,使其在多个行业展现巨大潜力:在机器人技术领域,YOLO26能帮助机器人实时解读周围环境,使导航更加顺畅,物体处理更加精确。 这意味着YOLO26不仅能在服务器集群中高速运行,也能在手持设备、智能相机等边缘环境中稳定工作。何时可以体验YOLO26?根据官方信息,YOLO26模型仍在训练中,尚未开源。 结语:视觉AI的未来之路YOLO26的发布标志着实时目标检测领域的又一个重要里程碑。通过端到端简化、架构优化和训练创新,YOLO26为计算机视觉带来了全新的速度与灵活性。 让我们一起期待2025年10月底YOLO26的正式发布,见证视觉AI的新纪元!
ConvNeXt + YOLO26:CNN 的现代化逆袭 这两年 Vision Transformer 火得一塌糊涂,各种 ViT 变体层出不穷。 整体框架 ConvNeXt + YOLO26 的框架和之前 DINOv3 那套思路类似,核心区别在于特征提取层: 特征提取:ConvNeXt (ImageNet-22k 预训练) 多尺度融合:FPN 风格 检测输出:YOLO26 Detect Head ConvNeXt 特征怎么用 ConvNeXt 的多尺度输出通过 timm 的 features_only=True 获取: self.convnext 检测头的适配 YOLO26 的检测头需要适配多尺度输出: self.detect = nn.Identity() def forward(self, x): neck_feats = [f8, 四种 Backbone 方案对比总结 以上是 ConvNeXt + YOLO26 方案的一些整理。如果有具体问题可以讨论,但不一定能及时回复。
除架构革新外,本研究将YOLO26定位为多任务框架,支持目标检测、实例分割、姿态/关键点估计、定向检测及分类任务。 YOLO26果断地移除了DFL模块,将边界框预测回归到更直接的回归任务,极大地简化了模型结构。 引入ProgLoss与STAL为了解决训练稳定性和小目标检测这两大难题,YOLO26引入了两种新策略。 结论YOLO26 的一个主要贡献在于其对部署优势的强调。 所有这些改进都证明了一个总体主题:YOLO26 弥合了前沿研究思想与可部署 AI 解决方案之间的差距。
除架构外,本研究将YOLO26定位为多任务框架,支持目标检测、实例分割、姿态/关键点估计、定向检测及分类。 文章重点展示了YOLO26在机器人、制造业及物联网等领域的实际应用案例,以证明其跨行业适应性。最后,讨论了关于部署效率及更广泛影响的见解,并展望了YOLO26及YOLO系列的未来发展方向。 YOLO11 vs YOLO26结构差异性1.1.1 SPPF 核心差异对比1)池化次数灵活性:YOLO11 的 3 次池化是硬编码的,要修改必须改源码;YOLO26 通过n参数可灵活调整(比如设为 C3k2代码: 源码位置:ultralytics/nn/modules/block.py1.2 YOLO26核心创新点YOLO26引入了多项关键架构创新,使其区别于前几代YOLO模型。 源码位置:ultralytics/optim/muon.py 2.如何训练YOLO26模型2.1 如何训练坑洼分割数据集2.1.1 数据集介绍 用于智能道路监测的坑洼分割数据集(YOLO26 格式)️
基于NMS的后处理流程和复杂损失公式的局限性,催生了YOLO26(Ultralytics YOLO26官方源码)的开发。 2 YOLO26的架构增强YOLO26的架构遵循一个为跨边缘和服务器平台实时目标检测专门构建的流线型高效流程。 总体而言,YOLO26的架构展示了一种精心平衡的设计理念,同时推进了精度、稳定性和部署简洁性。YOLO26引入了多项关键架构创新,使其区别于前几代YOLO模型。 YOLO26在设计时已考虑到这一限制。由于其流线型架构和简化的边界框回归流程,YOLO26在半精度(FP16)和整型(INT8)量化方案下均表现出一致的精度。 4.4 从YOLO26部署中获得的更广泛见解综上所述,YOLO26的部署特性强调了目标检测演进中的一个中心主题:架构效率与精度同等重要。
就在9月25日结束的伦敦YOLOVision 2025上,Ultralytics官宣将在10月份推出YOLO26模型。 00 - 17:00地点:深圳市南山区华侨城创意文化园北区 B10 栋线下参会注册:这次国内工程师们可以直击线下,还是免费参加,不仅能与AI社区的领先专家、研究人员和开源贡献者面对面交流,更有机会见证YOLO26 活动亮点活动为大家准备了丰富精彩的干货内容与互动体验:行业专家们的主题演讲专题讨论与实战演示,聚焦真实场景中的计算机视觉应用与来自全球的AI从业者面对面交流、结识新伙伴独家分享:最新一代 Ultralytics YOLO26 虽然官宣了YOLO26,但也只有少量关于物体检测模型的数据,没有其他内容。借此新活动之机,YOLO26 和 Ultralytics 平台很可能正式发布,或者在活动结束后的几天内发布。
YOLO 家族最新成员——YOLO26横空出世,以“彻底移除NMS”为核心变革,开启了真正的端到端目标检测新时代。 今天,我们将深入解析这篇技术报告,看看YOLO26如何通过架构革新,解决长期困扰业界的部署难题,为边缘AI应用带来全新可能。 如今,YOLO26决定彻底解决这个问题。架构革命:从“候选+筛选”到“直接输出”YOLO26的核心创新可以概括为“一个架构革命”和“三大训练神器”。 YOLO26引入了三套精妙的训练机制。 多任务扩展:不止于检测YOLO26的优秀架构设计使其自然支持多种视觉任务。
引言 本文提出一种融合YOLO26姿态评估与Qwen-VL多模态大模型的跌倒检测系统。 该系统采用“检测-分析-生成”的三段式架构:YOLO26负责实时捕捉人体关键点并判定跌倒事件,Qwen-VL对检测到的跌倒画面进行深度语义理解,最终生成包含跌倒人数、性别、衣着等细节的标准化报告。 通常近似于髋部中心)在垂直方向上的速度骤降 关键点几何关系: 例如,躯干与地面的夹角小于临界值、四肢呈现非典型的伸展模式 运动轨迹突变: 从直立姿态到倒地状态过程中,关键点加速度超出正常阈值 具体到实现层面,YOLO26 其最新版本Qwen3.5-VL进一步扩展了视频理解能力,可支持超过1小时的视频内容分析,并具备精确到秒的事件定位功能 千问审图 结论 本文提出的融合YOLO26与Qwen-VL的跌倒检测系统,充分发挥了两类模型各自的优势 :YOLO26以轻量、高效的方式完成姿态评估与实时跌倒判定;Qwen-VL在此基础上注入深度语义理解,将抽象的“跌倒事件”转化为包含人数、性别、衣着等细节的结构化报告。
实战评测:与YOLO26正面对决为了验证真实性能,作者在TACO数据集(1500张图像,59类废弃物)上,将D-FINE-seg与Ultralytics YOLO26进行了全面对比。 评测条件非常贴近实际部署:统一输入尺寸:640×640均使用COCO预训练权重进行微调统一转换为TensorRT FP16格式端到端延迟测量:包含预处理、GPU前向、后处理全过程使用框架默认置信度阈值(YOLO26 为0.25,D-FINE-seg为0.5)综合评价D-FINE-seg的优势:精度领先:在多数模型尺寸下,检测和分割精度均超越YOLO26端到端设计:无需NMS,推理流程简洁部署友好:原生支持ONNX/ 推理全流程开源协议宽松:Apache-2.0,商业应用友好目前的局限性:预训练权重待完善:掩码头尚未在COCO上预训练,当前需从随机初始化微调(作者已列为未来工作)超大模型延迟略高:在X尺寸上,分割延迟比YOLO26
本文主要内容:YOLO26全新发布(原理介绍+代码详见+结构框图)| YOLO26如何训练自己的obb数据集(无人机航拍船舶为案列)结构框图如下: 博主简介AI小怪兽 | 计算机视觉布道者 | 视觉检测领域创新者深耕计算机视觉与深度学习领域 本文主要内容:YOLO26全新发布(原理介绍+代码详见+结构框图)| YOLO26如何训练自己的数据集(裂缝分割为案列)结构框图如下: 博主简介AI小怪兽 | 计算机视觉布道者 | 视觉检测领域创新者深耕计算机视觉与深度学习领域 文章重点展示了YOLO26在机器人、制造业及物联网等领域的实际应用案例,以证明其跨行业适应性。最后,讨论了关于部署效率及更广泛影响的见解,并展望了YOLO26及YOLO系列的未来发展方向。 YOLO11 vs YOLO26结构差异性1.1.1 SPPF 核心差异对比1)池化次数灵活性:YOLO11 的 3 次池化是硬编码的,要修改必须改源码;YOLO26 通过n参数可灵活调整(比如设为 C3k2代码: 源码位置:ultralytics/nn/modules/block.py1.2 YOLO26核心创新点YOLO26引入了多项关键架构创新,使其区别于前几代YOLO模型。