开源AI新突破!Step3.5Flash模型性能超群,推理速度高达350TPS
创始人
2026-02-02 11:09:57
0

2月2日,阶跃星辰公司发布了其最新的开源基座模型Step3.5Flash,该模型以其卓越的推理能力和Agent智能而著称。官方宣称,Step3.5Flash在Agent场景和数学任务上的表现可与闭源模型相媲美,同时在复杂和长链条任务中展现出稳定性。模型的核心亮点包括更快的推理速度,最高可达350TPS(单请求代码类任务),以及更强的性能。

Step3.5Flash采用了稀疏MoE架构,每个token仅激活约110亿个参数,总计1960亿参数。此外,模型还采用了MTP-3技术,即一次预测3个Token,效率翻倍。3:1滑动窗口与全局注意力混合架构(SWA+FullAttention)使得模型在长文本处理中只关注“重点”,显著降低了计算开销,能够高效处理高达256K的上下文。

目前,Step3.5Flash已经全量上线,并且官方已经开始了Step4模型的训练,同时邀请社区成员深度参与共创。这一举措旨在推动开源模型的发展,为用户提供更聪明、更值得信任、响应迅速且成本可控的模型解决方案。

相关内容

热门资讯

经济热点快评丨重磅意见印发,服... 刚刚,国务院《关于推进服务业扩能提质的意见》(以下简称《意见》)正式对外发布。从4月初新时代首次聚焦...
以新促质 看经济开门红背后的“... 今年一季度,5.0%的GDP增速令人振奋,其背后的“含新量”同样值得关注。从数据来看,一季度,我国规...
县县通千兆、5G基站近500万... 4月21日,国务院新闻办公室举行新闻发布会,工业和信息化部相关负责人介绍2026年一季度工业和信息化...
“正视历史错误、坚守和平宪法,... 据日本共同社报道,日本政府4月21日通过内阁决议,完成了对“防卫装备转移三原则”及其运用指南的修改,...
“海外替代游”加持“Color... 石榴云/新疆日报讯(记者 任江报道)同程旅行近期发布《2026年五一旅行趋势报告》,对国内旅游市场进...
科技“组合拳”保障智慧大棚“四... 央视网消息:眼下,山西河津市的24万余亩小麦进入抽穗扬花期,当地抢抓晴好天气,调集新型植保无人机,启...
晶采观察丨小手工大市场 “指尖... 你有没有发现,最近身边的朋友突然都变得“手巧”了?有人晒自己做的陶杯,虽然粗糙却爱不释手;有人展示戳...
“果味地图” :让懂水果、会带... 春天赏花,夏秋摘果在云浮,四季的甜蜜从不缺席荔枝、黄皮、西瓜芒果、葡萄、凤梨嘉宝果、火龙果、砂糖桔…...
“莫氏鸡煲”老莫暖心喊话台湾同... 近期,两岸民众交流互动愈发热络,从广东佛山一家鸡煲店老板与台湾食客亲切互动喊话“中国人要团结一致,祖...
麦当劳又改名了?广州一分店挂出... 4月22日,继此前农讲所星火分店后,广州又有麦当劳餐厅挂出“牡丹楼”招牌。据悉,本次“牡丹楼”招牌,...