40B参数大模型Yuan3.0Flash开源,多模态推理新突破!
创始人
2025-12-31 18:11:02
0

12月31日,浪潮旗下YuanL网页链接团队宣布开源发布源Yuan3.0Flash多模态基础大模型。Yuan3.0Flash是一个40B参数规模的模型,采用稀疏混合专家(MoE)架构,单次推理仅激活约3.7B参数。该模型通过强化学习训练方法(RAPO)和反思抑制奖励机制(RIRM),在提升推理准确性的同时,显著降低了推理过程的token消耗和算力成本。

Yuan3.0Flash由视觉编码器、语言主干网络和多模态对齐模块组成。语言主干网络使用局部过滤增强的Attention结构(LFA)和混合专家(MoE)结构,以提高注意力精度并降低训练与推理的算力开销。在多模态方面,模型将视觉信号转化为token,并与语言token一起输入到语言主干网络,通过多模态对齐模块实现跨模态特征对齐。此外,引入自适应图像分割机制,支持高分辨率图像理解,同时降低显存需求及算力开销。

在企业场景的多个任务中,如RAG(ChatRAG)、多模态检索(Docmatix)、多模态表格理解(MMTab)和摘要生成(SummEval),Yuan3.0Flash的表现已优于GPT-5.1。在多模态推理与语言推理评测中,Yuan3.0Flash(40B)的精度接近Qwen3-VL235B-A22B(235B)与DeepSeek-R1-0528(671B),但token消耗仅约为其1/4~1/2,有效降低了企业大模型应用成本。Yuan3.0Flash现已全面开源,全系列模型参数和代码均可免费下载使用。

相关内容

热门资讯

2026年起汽车油耗新标:百公... 2026年1月1日起,中国将实施三项新的汽车节能强制性国家标准,旨在提高汽车燃油效率,减少能耗。这些...
今年A股每10只股票就有1只翻... 今日,A股市场迎来2025年的“收官战”,虽然没能跨过4000点大关,但沪指迎来11连阳(含12月3...
广州多区发布寒冷预警!冷空气明... 广州市气象台表示,截至12月31日傍晚,冷空气前锋已经到达湖南、江西北部一带,预计其将继续南压,20...
双IP驱动!广州增城小楼镇:何... 12月30日晚,2025广州(增城)何仙姑文化旅游季暨迟菜心美食文化汇在小楼镇何仙姑广场盛大开幕。此...
“十五五”公共文化服务如何发展... 12月31日,在广东省“十五五”公共文化服务“征集令”新闻发布会上,广东省文化和旅游厅提出了公共文化...
广州邀您共赴2026:500余... 2026年元旦将至,万象更新。值此岁末年初之际,广州将以500余场文旅活动喜迎新年,涵盖精品演出、新...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
国产存储芯片巨头长鑫科技科创板... 12月30日,国产内存厂商长鑫科技集团股份有限公司(长鑫科技)科创板上市申请获上交所受理,迈出了IP...
上海新政:2026年起非营运新... 12月31日,上海市人民政府办公厅转发了市发展改革委等五部门制订的《上海市鼓励购买和使用新能源汽车实...
小马智行Robotaxi破千辆... 12月31日,小马智行宣布其Robotaxi车队规模已突破1159辆,提前完成2025年千辆战略目标...