英伟达小模型ARC-AGI2夺冠,成本仅GPT-5Pro的1/36
创始人
2025-12-08 16:10:58
0

近日,英伟达的ARC-AGI2竞赛中,NVARC小模型以27.64%的成绩超越GPT-5Pro的18.3%,成为榜首。NVARC的每任务成本仅为20美分,远低于GPT-5Pro的超过7美元。NVARC的成功在于其零预训练深度学习方法,避免了预训练模型的领域偏见和数据依赖问题。

NVARC团队采用了改进版ARChitects方法,选用小参数模型Qwen3-4B,通过对话式模板简化谜题理解。训练时借助NeMoRL框架和Megatron后端进行监督微调。关键一步在于测试时微调(TTFT),针对ARC-AGI-2每个任务都是全新规则的特点,NVARC引入了LoRA微调技术,对每个问题都进行微调,让模型快速适应。同时,对ARChitects方法的改进在于解码阶段DFS算法做了批处理优化,修复结果非确定性问题。

NVARC团队还应用了“少即是多”的TRM方法,尝试与Qwen3-4B集成补充分数,虽有提升但未大幅优化。这一成果表明,在特定领域任务中,经过针对性优化的小模型性能并不逊色于全面发力的超级大模型。将正确的方法用在正确的地方,小模型也能实现更大的价值。

相关内容

热门资讯

小米YU7新车型亮相:73kW... 近日,工信部最新一期减免车辆购置税的新能源汽车车型目录中出现了小米YU7新车型的申报信息。这款新车型...
阿维塔07L豪华SUV亮相:华... 5月10日,工信部第407批《道路机动车辆生产企业及产品公告》新产品公示中,阿维塔科技的全新车型阿维...
【“中国游记”第二季㉞】过境免... 在北京,有一条藏着近千年文脉的传奇中轴线。7.8公里纵贯古今——永定门的庄重、故宫的恢弘、天坛的灵秀...
【国际3分钟】80年后,日本军... 2026年是东京审判开庭80周年,然而日本部分势力仍在歪曲侵略历史、为战犯翻案,更借“安全威胁”推动...
奋斗的青春 | 张海光:一个农... 央广网大连5月9日消息(记者 易博闻)在大连海洋大学的实验水池边,总能看到一个蹲在地上、满手油污的身...
鸿蒙智行尊界S800高定版亮相... 5月10日,工信部最新一批新车申报目录中,鸿蒙智行尊界S800GrandDesign高定版亮相,定位...
游客称女士进入河南博物院卫生间... 近日,有游客发布视频“吐槽”河南博物院洗手间,女士进入洗手间会路过男士小便池,担心存在隐私被泄露的风...
记者帮丨广州一省道路口变露天车... “高架桥惊现神秘停车区,车停得比桥还稳……”近日,有网友在社交媒体发布消息,在广州科学城路口附近的一...
感恩母爱、健康睡眠,广州荔湾中... 5月9日上午,广州市荔湾中心医院花地湾院区门诊大厅内,一场“感恩母爱 健康睡眠”母亲节主题健康科普及...
龙舟侧翻、游客落水?飞行救生圈... 5月9日,聚焦汛期安全防控与夏季水上活动风险特点,广州市公安局在海珠湿地公园开展水上应急救援联合演练...