腾讯AI大模型HY2.0发布:国内顶尖推理能力,效率与效果双飞跃!
创始人
2025-12-05 22:59:43
0

今日,腾讯发布了自研AI大模型混元2.0(TencentHY2.0),包含TencentHY2.0Think和TencentHY2.0Instruct。该模型采用混合专家(MoE)架构,拥有406B总参数和32B激活参数,支持256K上下文窗口,其推理能力和效率在国内处于领先地位。HY2.0在文本创作和复杂指令遵循等实用场景中表现突出,特别是在数学、科学、代码和指令遵循等复杂推理场景中,HY2.0Think的综合表现稳居国内第一梯队,泛化性显著提升。

HY2.0Think在数学科学知识推理方面,通过LargeRollout强化学习,推理能力大幅增强,在IMO-AnswerBench和HMMT2025等权威测试中取得一流成绩。同时,在Humanity'sLastExam(HLE)和泛化性的ARCAGI等任务上也取得显著进步。在指令遵循与长文多轮能力方面,通过重要性采样修正和多样化可验证的任务沙盒,HY2.0Think在MultiChallenge等指令遵循和多轮任务的效果显著提升。此外,HY2.0Think在AgenticCoding及复杂工具调用场景下的落地能力也得到极大增强。

在效率方面,HY2.0Think引入精细的长度惩罚策略,平衡思维链的效率和效果,避免模型堆砌废话,实现了计算资源的更有效分配。在IMO-AnswerBench、HMMT2025、ARC-AGI、HLE等权威推理任务上,HY2.0Think在取得类似准确率的情况下消耗更少的tokens,单位token的智能密度处于业界领先水平。HY2.0的输出质感显著进步,在文本创作、前端开发、指令遵循等实用场景上展现了差异化优势。

相关内容

热门资讯

宝马2027年推中国特供长轴距... 近日,北京国际车展上宝马品牌多款新车重磅首发,其中三款全新车型成为焦点。宝马7系/i7改款车型即将登...
粤菜,分轮点菜吃更爽 | 茶楼... 朋友聚会时点菜,你会不会把菜一股脑点完,就赶紧进入开吃、聊天环节?其实,如果一大帮人聚餐,把要吃的完...
今晚11时起,广州荔湾蓬莱路部... 为确保车行道路面沥青刨铺工程以及标注交通标线顺利推进,经有关部门批准,广东省第一建筑工程有限公司将对...
晚霞落“镜”中 稻乡入画来 晚霞映照下的富锦市万亩水稻公园(5月9日摄,无人机照片)。时下,黑龙江省三江平原陆续进入水稻插秧时节...
蓝厅观察丨自卫队右倾化 日本恐... 2026年美菲“肩并肩”联合军事演习自4月20日起在菲律宾多地举行。这场演习从一开始就引发了菲律宾民...
单月出口表现强劲 中国外贸延续... 海关总署5月9日发布数据,今年前4个月,我国货物贸易进出口总值16.23万亿元,同比增长14.9%,...
金观平:理解把握好“更大力度”... 近期召开的中央政治局会议,在分析研究当前经济形势和经济工作时,明确提出“要增强信心,以更大力度和更实...
国产咖啡有“咖位”(经济新方位... 图为李金合在咖啡园采摘咖啡果。  杨 磊摄(人民视觉)“一、二、三,开始!”咖啡师李金合打开喷枪,加...
哈弗猛龙PLUS 5月15日上... 5月10日,长城汽车宣布哈弗猛龙PLUS将于5月15日上市,预售价18.98万元起。该款新能源硬派方...
传承逾百年!广州石牌村举行娘妈... 羊城晚报讯 记者徐炜伦报道:5月9日,农历三月廿三,是妈祖诞民俗节日,在广州市天河区石牌村被称为“娘...