
深圳市人工智能与机器人研究院(AIRS)夏轩团队推出的 AIRSPEED(开源具身智能数据生产平台),旨在通过软硬件解耦与高度兼容的架构,解决具身智能模型在Scaling Laws驱动下面临的海量数据获取难题。
具身智能设备潜在市场规模庞大。据测算,全球机器人数量预计达100亿台,其产生的数据总估值高达 10万亿美元,是传统互联网数据估值的三倍以上。然而,随着Scaling Laws在具身智能领域的延续,模型性能对数据质量、数量和多样性的要求急剧上升,行业在数据驱动范式下面临三大核心瓶颈:
当前行业中的数据采集服务商受制于设备适配周期长、产品覆盖面窄等问题,亟需一种能够跨越硬件鸿沟、实现“所有数据应收尽收”的标准共识与通用基建。
针对上述产业痛点,AIRS 研发了 AIRSPEED 开源具身智能数据生产平台。该平台通过提供标准接口规范和底层逻辑支撑,成为对接真实世界、仿真环境、多元采集设备与多格式数据集的便捷桥梁。
AIRSPEED 平台在实际应用中,通过自动化数据集构建机制,成功为具身智能模型迭代注入了强劲的加速动力。基于同构遥操作与仿真环境(如Mojoco)的实际运行,平台实现了以下量化业务指标:
通过开源消减软件成本,平台有效填补了“成本黑洞”;通过最广泛的技术兼容,确保了“场景/任务/型号”类别数据的丰富度,打破了“数据孤岛”;并通过自动化的构建流程与数据集金字塔结构划分,填补了模型潜力评估的空白。
面对具身智能向端到端模型演进的趋势,模型对“大脑+小脑”合并训练的数据量与泛化期望达到了前所未有的高度。AIRSPEED 摒弃了零散且不可持续的定制化数据生产模式,通过标准化接口与数据合成流程,将物理世界的操作数据、感知数据与仿真数据统一聚拢。这种底层基建的开源共建模式,不仅极大降低了行业从业者获取泛化数据的门槛,更为未来具身智能数据资产在关键时刻的价值爆发提供了确定的技术支撑。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。