小米发布309B参数AI模型MiMo-V2-Flash,推理成本仅2.5%,速度翻倍!
创始人
2025-12-17 00:03:12
0

12月16日,小米公司发布了一款名为XiaomiMiMo-V2-Flash的开源MoE(Mixture of Experts)模型,该模型总参数量达到309B,活跃参数量为15B,专为智能体AI设计,以快速推理效率为核心。小米官方表示,这一模型通过Hybrid注意力架构创新及多层MTP推理加速,在多个Agent测评基准上保持全球开源模型Top2的位置。其代码能力超越所有开源模型,与标杆闭源模型Claude4.5Sonnet相媲美,但推理成本仅为后者的2.5%,生成速度提升2倍。

XiaomiMiMo-V2-Flash采用了1:5的GlobalAttention与SlidingWindowAttention(SWA)混合结构,窗口大小为128,支持原生32K外扩至256K训练。小米还推出了在线AI聊天服务XiaomiMiMOStudio,用户可以在该平台体验XiaomiMiMo-V2-Flash模型,并支持深度搜索和联网搜索功能。模型的权重和推理代码均采用MIT协议全面开源,API定价为输入$0.1/Mtokens,输出$0.3/Mtokens,目前API服务限时免费。

相关内容

热门资讯

小鹏G9L亮相工信部:轴距加长... 5月9日,工信部最新一期申报图中曝光了小鹏汽车的全新车型——小鹏G9L。这款新车在设计上延续了小鹏G...
地块控规修正获批 逾120年黄... 新快报讯 记者陈慕媛报道 新快报记者近日从广州市规划和自然资源局了解到,《广州市道教黄大仙祠AF02...
在当代文学史上留下中阿“同写一... 文/羊城晚报全媒体记者 梁善茵 熊安娜图/主办方提供“青春似火焰源源暖众生,唤醒天地飞奔不了情,冲破...
男子7年间将女友家中近15万元... 近日,辽宁鞍山警方破获了一起男友用练功券替换女友现金的盗窃案件。日前,刘女士发现,家中冰箱里的14....
早接晚送、途经菜市场!广州越秀... 文/羊城晚报全媒体记者 卢佳圳 通讯员 詹苹苹图/欧广傑“妈,明天早上9点,车在楼下接您,晚上5点半...
广州高新区投资集团有限公司党委... 广州市纪委监委5月8日通报:广州高新区投资集团有限公司党委委员、副总经理罗淡彬涉嫌严重违纪违法,目前...
TCL华星t8项目封顶,广州黄... 文/羊城晚报全媒体记者 卢佳圳 通讯员 郑嘉俊 范敏玲图/通讯员提供5月8日,位于广州开发区、黄埔区...
总台记者观察丨日本舆论对高市内... 日本高市早苗内阁推动的设立“国家情报局”相关法案5月8日在日本参议院全体会议进入审议阶段。总台记者 ...
(乡村行·看振兴)广东连江口镇... 中新网清远5月8日电 (张璐 林钰欣)时下,走进清远英德市连江口镇的一片麻竹林,只见翠绿的竹林竹节拔...
馕咖啡风靡北京 | 真相 在新疆,馕不只是食物,更是传承千年的丝路文化符号,是刻在各族人民生活里的烟火底气。从丝路馕香到网红馕...