法国AI新突破!MistralAI发布675B参数混合专家模型
创始人
2025-12-03 09:59:57
0

法国人工智能初创企业MistralAI于12月2日宣布推出新一代Mistral3系列模型,其中包括首款采用稀疏架构的混合专家模型MistralLarge和三款小型密集模型。MistralLarge拥有675B的总参数量和41B的活跃参数规模,而Ministral3系列的参数规模分别为14B、8B和3B。这些模型及其衍生版本均以Apache2.0许可证开源,意味着它们可以被广泛地用于研究和商业用途。

MistralAI表示,MistralLarge3是全球顶尖的开放权重模型之一,使用3000块英伟达H200GPU从头开始训练。该模型在通用提示方面与市场上最佳的指令微调开放权重模型达到了同等水平,并在多语言对话方面展示了图像理解和行业顶尖性能。在LMArena排行榜的OSS非推理模型类别中,MistralLarge3位列第二,而在OSS总榜中排名第六。

对于参数较小的Ministral3系列,MistralAI声称它们实现了所有OSS模型中最佳的性价比。这些模型的指令变体在性能上与同类模型相当或更优,同时在生成的token数量上通常降低了一个数量级,这表明它们在效率和成本效益方面具有显著优势。

相关内容

热门资讯

昆仑万维方汉:豆包手机无渠道必... 5月8日,昆仑万维董事长方汉在接受凤凰网财经采访时对豆包手机的前景表示悲观。方汉认为,由于豆包手机缺...
昆仑万维CEO:AI时代白领最... 5月7日,昆仑万维董事长兼总经理方汉在接受凤凰网财经《封面》采访时表示,在AI时代,普通人应多使用A...
赛力斯动力携手一汽铸锻,开创“... 5月10日,赛力斯集团执行董事、副总裁康波在重庆广电第一眼的采访中分享了赛力斯动力工厂的最新进展。康...
中国汽车零部件崛起:美市场超4... 近日,中国汽车产业在全球市场的影响力显著提升,中国车企已跃居全球销量冠军。专家西蒙指出,海外车企和零...
宝马2027年推中国特供长轴距... 近日,北京国际车展上宝马品牌多款新车重磅首发,其中三款全新车型成为焦点。宝马7系/i7改款车型即将登...
粤菜,分轮点菜吃更爽 | 茶楼... 朋友聚会时点菜,你会不会把菜一股脑点完,就赶紧进入开吃、聊天环节?其实,如果一大帮人聚餐,把要吃的完...
今晚11时起,广州荔湾蓬莱路部... 为确保车行道路面沥青刨铺工程以及标注交通标线顺利推进,经有关部门批准,广东省第一建筑工程有限公司将对...
晚霞落“镜”中 稻乡入画来 晚霞映照下的富锦市万亩水稻公园(5月9日摄,无人机照片)。时下,黑龙江省三江平原陆续进入水稻插秧时节...
蓝厅观察丨自卫队右倾化 日本恐... 2026年美菲“肩并肩”联合军事演习自4月20日起在菲律宾多地举行。这场演习从一开始就引发了菲律宾民...
单月出口表现强劲 中国外贸延续... 海关总署5月9日发布数据,今年前4个月,我国货物贸易进出口总值16.23万亿元,同比增长14.9%,...