11月21日,小米集团宣布正式发布并全面开源其具身大模型MiMo-Embodied。该模型是业界首个成功打通自动驾驶与具身智能的跨域具身基座模型,实现了两大领域任务的统一建模,标志着通用具身智能研究的重要进展。MiMo-Embodied具备三大核心技术亮点:跨域能力覆盖、双向协同赋能和全链优化可靠,同步支持具身智能和自动驾驶的关键任务,验证了室内交互与道路决策的知识转移协同效应,并采用多阶段训练策略提升模型的部署可靠性。
在涵盖感知、决策与规划的29项核心基准测试中,MiMo-Embodied确立了性能新标杆,全面优于现有的开源、闭源及专用模型。在具身智能领域,MiMo-Embodied在17个基准测试上取得SOTA成绩,重新定义了任务规划、可供性预测及空间理解的能力边界。在自动驾驶领域,该模型在12个基准测试上表现卓越,实现了环境感知、状态预测与驾驶规划的全链路性能突破。此外,在通用视觉语言领域,MiMo-Embodied也展现了卓越的泛化性。模型与代码现已开源,可通过相关链接访问。

