12月15日,英伟达宣布推出Nemotron3开源模型系列,旨在构建AI智能体应用时提供“具有最佳准确性的最高效开源模型家族”。Nemotron3系列模型引入了混合潜在专家(MoE)架构,助力开发者构建和部署多智能体系统。面对通信开销、上下文漂移和推理成本等挑战,Nemotron3提供所需表现力和开放性,以构建专门化的智能体AI。
Nemotron3系列包括Nano、Super和Ultra三种规格。Nemotron3Nano是一款小型30-billion-parameter模型,适用于针对性强、高度高效的任务,如软件调试、内容摘要等。Nemotron3Super是一款高准确性的推理模型,拥有约1000亿参数,适用于多智能体应用。Nemotron3Ultra是一款大型推理引擎,拥有约5000亿参数,适用于复杂AI应用。Nemotron3Nano已在HuggingFace上线,Super和Ultra预计将在2026年上半年推出。
