英伟达小模型ARC-AGI2夺冠,成本仅GPT-5Pro的1/36
创始人
2025-12-08 16:10:58
0

近日,英伟达的ARC-AGI2竞赛中,NVARC小模型以27.64%的成绩超越GPT-5Pro的18.3%,成为榜首。NVARC的每任务成本仅为20美分,远低于GPT-5Pro的超过7美元。NVARC的成功在于其零预训练深度学习方法,避免了预训练模型的领域偏见和数据依赖问题。

NVARC团队采用了改进版ARChitects方法,选用小参数模型Qwen3-4B,通过对话式模板简化谜题理解。训练时借助NeMoRL框架和Megatron后端进行监督微调。关键一步在于测试时微调(TTFT),针对ARC-AGI-2每个任务都是全新规则的特点,NVARC引入了LoRA微调技术,对每个问题都进行微调,让模型快速适应。同时,对ARChitects方法的改进在于解码阶段DFS算法做了批处理优化,修复结果非确定性问题。

NVARC团队还应用了“少即是多”的TRM方法,尝试与Qwen3-4B集成补充分数,虽有提升但未大幅优化。这一成果表明,在特定领域任务中,经过针对性优化的小模型性能并不逊色于全面发力的超级大模型。将正确的方法用在正确的地方,小模型也能实现更大的价值。

相关内容

热门资讯

长安汽车里程碑:阿维塔12下线... 今日,阿维塔科技总裁陈卓宣布,中国长安汽车集团在重庆阿维塔数智工厂下线了第3000万辆中国品牌汽车—...
腾讯AI大模型HY2.0发布:... 12月5日,腾讯公司发布了自研AI大模型混元2.0(TencentHY2.0),包括TencentH...
孔辉科技郭川:中国汽车产业未来... 近日,孔辉科技董事长、CEO郭川在《中国企业家》影响力企业家年会上分享了其对全球汽车产业未来的见解。...
OPPO与奥迪签署全球专利许可... 12月10日,OPPO宣布与奥迪公司签署全球专利许可协议,将包括5G在内的蜂窝通信标准必要专利授权给...
“尊界S800音响罩锋利如刀?... 日前,懂车帝在对尊界S800进行评测时发现,后排音响罩边缘过于锋利,能轻松刮破洋葱皮,存在安全隐患。...
深蓝G318追尾事故:AEB自... 12月10日,深蓝G318车主赵先生向媒体反映,其车辆在高速行驶中发生追尾事故,质疑车辆AEB自动紧...
日产携手Wayve打造下一代P... 12月10日,日产汽车宣布与英国自动驾驶技术企业Wayve达成最终协议,将Wayve的AI技术集成到...
人民日报刊发重点评论:广州蝶变... 城市是现代化建设的重要载体,也是观察中国式现代化的重要窗口。关于广州的两则新闻发人深思——今年前10...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
领克10EM-P销量破2万!新... 12月10日,领克品牌旗下中大型轿车10EM-P销量突破2万台,官方新增千里浩瀚H5版型,限时售价分...