今日,上海AI实验室宣布开源了基于“通专融合”技术架构SAGE打造的万亿参数科学多模态大模型Intern-S1-Pro。该模型作为全球开源社区中参数规模最大的科学多模态模型,其核心科学能力实现了显著提升,在AI4S领域的国际评测中稳居领先水平,数理逻辑推理能力达到奥赛金牌水平,智能体能力在开源模型中位居第一梯队。
Intern-S1-Pro模型采用混合专家架构(MoE),包含512个专家,总参数达到1T,每次调用仅激活8个专家、22B参数。模型在SAGE基础模型层引入傅里叶位置编码并重构时序编码器,赋予模型统一理解微观生命信号到宏观宇宙波动的“物理直觉”。同时,通过高效路由机制,攻克了训练万亿参数MoE模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。
此外,Intern-S1-Pro验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的AGI4S基础设施奠定了基础。模型的开源地址已公布,包括在线体验链接和GitHub链接,方便用户访问和使用。

