

2026 年 3 月 9 日,Hugging Face 旗下开源机器人学习框架 LeRobot 正式推出 v0.5.0 版本,这也是该项目迄今为止规模最大的一次更新。自 v0.4.0 以来,LeRobot 社区迎来了超 50 名新贡献者,合并了 200 余个 PR,实现了硬件支持、模型策略、数据处理、仿真环境及代码底座的全维度突破。从首次接入人形机器人,到自回归 VLA 模型的回归,再到仿真环境的云端化加载,LeRobot v0.5.0 不仅大幅提升了机器人学习的开发效率与部署能力,更向通用机器人技术的落地迈出了关键一步,为科研人员和开发者打造了更易用、更可扩展、更贴合实际应用的开源机器人学习生态。
Blog:https://huggingface.co/blog/lerobot-release-v050
LeRobot v0.5.0 的核心突破之一,是完成了硬件支持体系的跨越式扩展,从传统的桌面机械臂延伸至全功能人形机器人,同时完善了移动机器人、高性能执行器的兼容能力,真正实现了从单一设备到多品类硬件生态的全覆盖。
作为本次更新的最大亮点,LeRobot 首次实现了对 Unitree G1 人形机器人的完整支持,这也是该框架首款集成的人形机器人硬件。基于全身控制模型(WBC),Unitree G1 在 LeRobot 中可实现运动、操作、遥操作的全功能落地:既能完成自主行走、环境导航等基础运动任务,也能执行高精度的物体灵巧操作,更可通过直观的遥操作界面实现远程控制,同时支持运动与操作的协同执行,轻松应对复杂的现实世界任务。这一集成标志着 LeRobot 正式从桌面级机器人学习走向全身具身智能,为通用机器人技术的研究提供了全新的硬件载体。
在机械臂领域,新版本新增对 OpenArm 及配套的 OpenArm Mini 遥操作器的支持,二者均兼容双臂配置,可实现更复杂的双机械臂协同操作;同时纳入 Earth Rover 移动机器人,首次将 LeRobot 的能力拓展至户外导航与地面机器人领域,OMX 机械臂则凭借可配置的夹爪设置和校准支持,进一步丰富了工业级操作场景的选择。此外,SO-100/SO-101 的代码实现完成统一,大幅减少了代码冗余,提升了维护效率。
在执行器层面,LeRobot v0.5.0 新增 CAN 总线电机控制器支持,纳入 RobStride(高扭矩场景专用)和 Damiao 两款控制器,打破了此前对 Dynamixel 和 Feetech 生态的依赖,可适配更多专业级高性能执行器,为机器人硬件的性能升级提供了底层支撑。
模型策略是机器人学习的核心,LeRobot v0.5.0 新增六大全新策略与技术,丰富了模型库的同时,针对性解决了机器人控制中的低延迟、长任务、跨模态适配等痛点,推动开源机器人学习的技术边界不断突破。
Pi0-FAST 自回归 VLA 模型的加入成为技术亮点,该模型基于 FAST(频率空间动作序列分词)技术,将连续机器人动作离散为令牌序列,依托 Gemma 300M 打造自回归动作专家模块,相比传统流匹配方法的 Pi0 模型,实现了动作令牌的灵活解码,可通过配置温度和解码步数平衡推理速度与效果,且兼容实时分块技术,为高精度、高频率的机器人控制提供了新方案。
Real-Time Chunking(RTC)实时分块技术则解决了机器人推理的延迟问题,作为流匹配策略的增强插件,它无需等待完整动作块生成即可重新规划,通过将新预测与执行中的动作持续融合,实现更平滑、更具响应性的行为,成为实际场景部署中降低延迟的 “游戏规则改变者”。
此外,新版本还纳入了多款特色 VLA 模型:基于 Qwen2.5-VL 的 Wall-X 模型,融合强大的视觉语言理解能力与流匹配动作预测,实现跨载体机器人控制;基于微软 Florence-2 的 X-VLA 模型,为 VLA 策略提供了全新的基础模型选择,丰富了生态多样性。SARM(阶段感知奖励建模)技术则专门针对机器人学习中的长周期任务痛点,通过分阶段预测任务进度,替代传统单一的全局进度信号,让复杂多步骤操作任务的训练更高效。
为降低大模型微调门槛,LeRobot v0.5.0 还新增 PEFT 支持,开发者可通过 LoRA 等方法微调大型 VLA 模型,无需修改核心训练流水线,仅通过策略层配置即可将大模型适配至特定机器人和任务,大幅减少计算资源消耗。
数据集的采集与训练效率直接决定机器人学习的开发周期,LeRobot v0.5.0 对数据处理流水线进行了全方位优化,实现了从数据采集、编码到训练的全链路提速,同时丰富了数据工具集,让数据管理更高效。
流媒体视频编码技术的引入彻底解决了数据采集的等待痛点,此前每段任务采集完成后,开发者需等待视频编码结束才能开始下一段,而新版本可在帧捕获的同时实现实时编码,实现任务间零等待,且支持硬件编码器自动检测,可自动调用 GPU 加速编码,大幅提升采集效率。
在底层性能上,LeRobot 通过修复数据访问瓶颈、重构图像处理流程,实现了图像训练速度提升 10 倍、编码速度提升 3 倍,并行编码成为全平台默认配置,可根据数据集类型(视频 / 图像)动态调整压缩级别,同时优化了 CPU 利用率,让数据采集和创建过程的资源使用更高效。
数据工具集也迎来丰富升级,新增子任务标注与查询功能,支持分层任务学习;实现图像到视频的格式转换,提升存储效率,单视频文件可支持多段任务;新增info操作可快速检查数据集信息,完善了分割、合并、特征编辑等现有操作,同时开放了视频编解码器、元数据缓冲区大小等可配置选项,让开发者能精细化控制数据集创建。
LeRobot v0.5.0 在仿真环境和代码底座上完成了关键升级,通过云端化仿真环境加载和代码的现代化重构,大幅降低了机器人学习的开发与协作门槛,同时提升了框架的兼容性和可扩展性。
全新推出的 EnvHub 功能实现了仿真环境的云端化加载,开发者无需在本地安装环境包和配置注册,只需指向 Hugging Face Hub 上的仓库,LeRobot 即可自动完成环境代码下载、Gymnasium 注册,并直接用于训练和评估,大幅降低了自定义仿真环境的共享与协作成本,让社区开发者能更便捷地交流和复用仿真资源。同时,新版本完成了与 NVIDIA IsaacLab-Arena 的集成,将 GPU 加速仿真引入 LeRobot 生态,依托 NVIDIA Isaac Sim 的大规模并行环境实例,实现强化学习的快速训练,且配套专属的预处理 / 后处理步骤,与 LeRobot 训练流水线完全兼容。
代码底座的现代化重构则为框架的长期发展奠定基础:LeRobot v0.5.0 将 Python 最低版本要求提升至 3.12,支持现代语法并提升运行性能;完成向 Hugging Face Transformers v5 的迁移,紧跟最新模型生态;新增第三方策略插件系统,开发者可将自定义策略封装为可安装包,通过pip安装后直接调用,无需修改核心库代码,与硬件插件系统形成互补,进一步提升框架的可扩展性。此外,新版本还实现了基于 Rerun 的远程遥测可视化,支持压缩图像流的低带宽传输;优化了安装流程,新增uv安装方式,完善依赖管理;实现文档版本化,让开发者总能找到与安装版本匹配的文档;更新 PyTorch 版本以支持 NVIDIA Blackwell GPU,为高性能计算提供支撑。
除了技术功能的升级,LeRobot v0.5.0 还对社区和生态体系进行了全方位完善,为项目的持续发展注入活力。社区方面,Discord 论坛完成升级,优化了频道组织,提升了交流效率;GitHub 仓库更新了 README 文档,新增问题和 PR 模板、贡献指南,并实现工单自动标签,让贡献流程更清晰。学术层面,LeRobot 相关论文成功被 ICLR 2026 接收,标志着其技术价值得到学术界的认可。
工具链方面,LeRobot Visualizer 可视化工具完成升级,新增数据集可视化徽章,功能更完善;全新推出的 LeRobot Annotation Studio 作为 HuggingFace Space 应用,支持开发者用自然语言为数据集的每个时刻标注子任务,大幅提升数据标注的效率和便捷性。
此外,本次更新还包含数百个 bug 修复、文档优化、CI/CD 增强等细节改进,从类型检查到测试基础设施,全方位提升了框架的稳定性和可维护性,让 LeRobot 能在规模扩张的同时保持可靠的运行表现。
LeRobot v0.5.0 的全维度升级,不仅是技术功能的叠加,更是对开源机器人学习生态的重构。从硬件层面,人形机器人、移动机器人的加入,让 LeRobot 覆盖了从桌面操作到户外场景、从单一机械臂到全身智能的全场景需求;从模型层面,六大新策略针对性解决了低延迟、长周期、大模型微调等实际痛点,让机器人学习的技术方案更贴合实际部署需求;从数据层面,十倍提速和零等待采集大幅缩短了开发周期;从仿真和代码层面,云端化仿真和现代化重构降低了入门门槛,让更多开发者能参与到机器人学习的研究中。
作为一款端到端的开源机器人学习框架,LeRobot 始终聚焦易用性、可扩展性和可复现性,v0.5.0 的发布进一步强化了这一核心优势,让科研人员能更高效地开展前沿研究,让开发者能更便捷地将机器人学习技术落地到实际场景。随着硬件生态的不断丰富、模型策略的持续创新和社区的不断壮大,LeRobot 正逐步成为通用机器人技术研发的核心开源平台,推动机器人学习从实验室走向更广阔的现实世界。
目前,LeRobot v0.5.0 已正式上线,开发者可通过官方文档快速上手,开启全新的机器人学习开发体验。