5月13日,小米宣布发布并开源了XiaomiOneVL自动驾驶模型,该模型在自动驾驶领域率先实现了VLA、世界模型、潜空间推理等多项技术路线的统一。XiaomiOneVL结合了VLA和世界模型,通过潜空间推理将两者整合到同一框架中,提升了推理速度和精度。在多个主流基准测试中,XiaomiOneVL刷新了潜在推理方法的性能上限,特别是在ROADWork、Impromptu、Alpamayo-R1三项基准上达到了SOTA,并在NAVSIM上取得了优越性能,PDM-score达到88.84,超越了显式CoT。
XiaomiOneVL不仅在性能上表现出色,还能为模型决策提供语言和视觉双维度的可解释性,即能用文字说明驾驶决策的原因,也能用预测画面展示未来场景。此外,该模型挂载MLP回归头变体后,延迟进一步降低至0.24秒(4.16Hz),仅为VLA自回归推理的5.4%,为量产车端实时部署提供了可行路径。消融实验结果表明,压缩物理世界的动态信息能显著提升性能。


