40B参数大模型Yuan3.0Flash开源,多模态推理新突破!
创始人
2025-12-31 18:11:02
0

12月31日,浪潮旗下YuanL网页链接团队宣布开源发布源Yuan3.0Flash多模态基础大模型。Yuan3.0Flash是一个40B参数规模的模型,采用稀疏混合专家(MoE)架构,单次推理仅激活约3.7B参数。该模型通过强化学习训练方法(RAPO)和反思抑制奖励机制(RIRM),在提升推理准确性的同时,显著降低了推理过程的token消耗和算力成本。

Yuan3.0Flash由视觉编码器、语言主干网络和多模态对齐模块组成。语言主干网络使用局部过滤增强的Attention结构(LFA)和混合专家(MoE)结构,以提高注意力精度并降低训练与推理的算力开销。在多模态方面,模型将视觉信号转化为token,并与语言token一起输入到语言主干网络,通过多模态对齐模块实现跨模态特征对齐。此外,引入自适应图像分割机制,支持高分辨率图像理解,同时降低显存需求及算力开销。

在企业场景的多个任务中,如RAG(ChatRAG)、多模态检索(Docmatix)、多模态表格理解(MMTab)和摘要生成(SummEval),Yuan3.0Flash的表现已优于GPT-5.1。在多模态推理与语言推理评测中,Yuan3.0Flash(40B)的精度接近Qwen3-VL235B-A22B(235B)与DeepSeek-R1-0528(671B),但token消耗仅约为其1/4~1/2,有效降低了企业大模型应用成本。Yuan3.0Flash现已全面开源,全系列模型参数和代码均可免费下载使用。

相关内容

热门资讯

广仲以域外法查明实践提升东莞涉... ■广州仲裁委员会是全国十佳仲裁机构和涉外服务十佳仲裁机构■2025年11月,广州仲裁委员会在东莞举办...
新政点燃“五一”楼市:广深成交... 文/图 羊城晚报全媒体记者 陈玉霞刚过去的“五一”小长假,是广深两地4月底出台楼市新政后的首个长假。...
广州花都推行商品房“预售定学位... 羊城晚报讯 记者陈玉霞、范晗越报道:5月5日,广州市花都区人民政府印发了《花都区进一步促进房地产市场...
“开门杀”致人受伤保险能拒赔吗... 最高法发布相关解释及典型案例明确,保险公司和乘车人、驾驶人应依法赔偿“开门杀”情形下受害人权益如何保...
“菜市场不准剥蚕豆”引热议,网... 近日,“菜市场不准剥蚕豆”引发网友讨论。有网友称,是因有人吃蚕豆后会引发蚕豆病,闻到蚕豆的气味也会出...
广州房企“五一”成绩单来了!不... 刚过去的“五一”小长假,广州楼市捷报频传。广州市住建局数据显示,5月1-5日,全市11区一手楼盘日均...
“五一”假期荔湾文旅“成绩单”... 文/羊城晚报全媒体记者 江皓轩 通讯员 荔宣图/通讯员提供记者从广州市荔湾区文化广电旅游体育局了解到...
新华社权威快报|税收发票数据显... 国家税务总局5月6日发布的增值税发票数据显示,“五一”假期消费相关行业销售收入同比增长14.3%。其...
又火了!广东“潮汐车道”治堵成... 文/羊城晚报全媒体记者 张璐瑶 通讯员 粤公宣图/广东公安记者5月6日从广东省公安厅了解到,今年“五...
体验上新、场景破圈:这个“五一... 2026年“五一”假期落下帷幕,广东文旅市场交出了一份成色十足的成绩单:据初步测算,五天假期全省接待...