8 月 15 日消息,智元机器人于 8 月 14 日通过公众号宣布,推出行业首个面向真实世界机器人操控的统一世界模型平台 ——Genie Envisioner(GE)。这一平台的问世,为机器人操控领域带来了全新的技术架构与发展方向。
创新架构:打破传统,实现端到端闭环推理
传统的机器人 “数据 — 训练 — 评估” 模式相互割裂,而 GE 平台创新性地将未来帧预测、策略学习与仿真评估整合进以视频生成为核心的闭环架构。基于 3000 小时真机数据,GE 建立起从语言指令到视觉空间的直接映射,完整保留了机器人与环境交互的时空信息,让机器人能在同一世界模型中完成从 “看” 到 “想” 再到 “动” 的端到端推理与执行,极大提升了机器人的操控效率与智能化程度。
卓越性能:跨平台泛化与长时序任务表现出色
GE-Act 作为平台的关键组件,基于强大的视觉空间预训练,展现出惊人的跨平台迁移能力。在 Agilex Cobot Magic 和 Dual Franka 等全新机器人平台上,仅需 1 小时(约 250 个演示)的遥操作数据,就能实现高质量的任务执行,在跨平台泛化和长时序任务执行方面显著超越现有 SOTA,为具身智能从视觉理解到动作执行开辟了新路径。
开源助力:推动行业发展
智元机器人团队表示,将开源全部代码、预训练模型和评测工具。这一开源举措不仅能促进技术的交流与创新,还能吸引更多开发者参与,加速机器人技术在智能制造与服务领域的应用落地。
未来展望:拓展功能,深化应用
GE 平台的发布,标志着机器人从被动执行向主动 “想象 — 验证 — 行动” 的转变。未来,智元机器人计划扩展更多传感器模态,支持全身移动与人机协作,持续推动智能制造与服务机器人在更多场景的落地应用,为机器人行业的发展注入新的活力。