2月2日,阶跃星辰公司发布了其最新的开源基座模型Step3.5Flash,该模型以其卓越的推理能力和Agent智能而著称。官方宣称,Step3.5Flash在Agent场景和数学任务上的表现可与闭源模型相媲美,同时在复杂和长链条任务中展现出稳定性。模型的核心亮点包括更快的推理速度,最高可达350TPS(单请求代码类任务),以及更强的性能。
Step3.5Flash采用了稀疏MoE架构,每个token仅激活约110亿个参数,总计1960亿参数。此外,模型还采用了MTP-3技术,即一次预测3个Token,效率翻倍。3:1滑动窗口与全局注意力混合架构(SWA+FullAttention)使得模型在长文本处理中只关注“重点”,显著降低了计算开销,能够高效处理高达256K的上下文。
目前,Step3.5Flash已经全量上线,并且官方已经开始了Step4模型的训练,同时邀请社区成员深度参与共创。这一举措旨在推动开源模型的发展,为用户提供更聪明、更值得信任、响应迅速且成本可控的模型解决方案。

