6月12日,MiniMax新一代原生多模态旗舰模型M3正式开源。同日,摩尔线程宣布其旗舰级AI训推一体智算卡MTTS5000已完成对M3模型的Day-0适配。MTTS5000针对M3的核心技术特性,在硬件算力、软件栈到开源框架方面进行了全链路精准匹配与深度优化。该智算卡具备硬件级原生FP8加速,单卡AI算力高达1000TFLOPS,并配备80GB大容量显存与1.6TB/s的超高带宽,为百万token级长序列提供充足的缓存空间与卓越的数据吞吐能力。
摩尔线程基于MUSAC++与Triton-MUSA等抽象层,实现了M3新算子结构的快速迁移,确保平台能够快速完成架构适配。公司还赋能了M3的前沿Coding与Agentic能力,通过原生算子定制,在保障模型精度无损的前提下,显著提升推理吞吐、降低响应延迟。此外,摩尔线程完成了vLLM与SGLang两大主流推理框架的同步拉起,以MUSA开放架构拥抱开源生态,为开发者提供灵活多样的部署选择。
MTTS5000智算卡覆盖从FP8至FP64全计算精度,可无缝适配从模型研发到商业化落地的完整链路,助力国产旗舰大模型快速完成生态普及。随着M3在MTTS5000上完成适配,开发者现在即可基于MUSA软件栈与vLLM/SGLang双框架完成部署,并持续获得算子级性能优化。
