今日,腾讯发布了自研AI大模型混元2.0(TencentHY2.0),包含TencentHY2.0Think和TencentHY2.0Instruct。该模型采用混合专家(MoE)架构,拥有406B总参数和32B激活参数,支持256K上下文窗口,其推理能力和效率在国内处于领先地位。HY2.0在文本创作和复杂指令遵循等实用场景中表现突出,特别是在数学、科学、代码和指令遵循等复杂推理场景中,HY2.0Think的综合表现稳居国内第一梯队,泛化性显著提升。
HY2.0Think在数学科学知识推理方面,通过LargeRollout强化学习,推理能力大幅增强,在IMO-AnswerBench和HMMT2025等权威测试中取得一流成绩。同时,在Humanity'sLastExam(HLE)和泛化性的ARCAGI等任务上也取得显著进步。在指令遵循与长文多轮能力方面,通过重要性采样修正和多样化可验证的任务沙盒,HY2.0Think在MultiChallenge等指令遵循和多轮任务的效果显著提升。此外,HY2.0Think在AgenticCoding及复杂工具调用场景下的落地能力也得到极大增强。
在效率方面,HY2.0Think引入精细的长度惩罚策略,平衡思维链的效率和效果,避免模型堆砌废话,实现了计算资源的更有效分配。在IMO-AnswerBench、HMMT2025、ARC-AGI、HLE等权威推理任务上,HY2.0Think在取得类似准确率的情况下消耗更少的tokens,单位token的智能密度处于业界领先水平。HY2.0的输出质感显著进步,在文本创作、前端开发、指令遵循等实用场景上展现了差异化优势。


