今日,MiniMax宣布开源其M2.7模型,这一模型被设计为能够深度参与自身的训练与优化流程,构建复杂的Agent框架,并完成高度复杂的生产力任务。M2.7在真实软件工程场景中表现出色,涉及端到端项目交付、日志分析、Bug排查、代码安全和机器学习等多个领域。在SWE-Pro基准测试中,M2.7得分56.22%,接近顶级模型水平,并在完整项目交付(VIBE-Pro55.6%)和复杂系统理解(TerminalBench2:57.0%)方面表现强劲。
M2.7模型还具备自我进化的能力,其内部系统可以自动收集反馈、构建评估集,并持续优化自身的架构、技能和记忆机制。在优化编程能力时,M2.7能够自主运行超过100轮循环,内部测试显示性能提升可达30%。此外,M2.7还配备了OpenRoom交互系统,将AI交互从文本扩展到可视化界面,支持实时场景反馈,并具备高度扩展性,为未来探索全新人机交互方式提供了可能。
