蚂蚁集团开源万亿参数强化学习框架,6秒同步TB级参数!
创始人
2025-11-20 16:36:02
0

今日,蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。该框架专为极致性能打造,旨在解决强化学习(RL)流程中训练权重参数同步到推理模型的核心难题。Awex能够在秒级完成TB级大规模参数交换,显著降低RL模型训练延迟,具备极速同步性能、统一模型适配层、零冗余Resharding传输与原地更新、多模式传输支持、异构部署兼容以及灵活可插拔架构等特点。

Awex框架由三个主要组件构成:WeightWriter、WeightReader和MetaServer。WeightWriter负责训练进程中的权重Shard元数据收集、权重转换和发送;WeightReader在推理实例的控制进程上运行,负责权重Shard的元数据收集、权重转换和接受;MetaServer作为全局Server,负责训推引擎的服务发现和权重元数据交换。框架的核心功能模块包括训推权重统一转换、全局权重元数据计算与交换、P2P权重传输执行计划、NCCL权重传输和RDMA权重传输等。

在千卡规模的集群上,Awex使用NCCL传输数据能在一秒内完成10B规模的模型权重交换,使用RDMA传输时,1T模型权重交换耗时可缩短至六秒。未来,蚂蚁集团计划开源ASystem的其他核心RL组件,进一步完善开源强化学习训练生态。目前,Awex开源版已支持Megatron和SGLang引擎。

相关内容

热门资讯

英特尔中国40周年:万亿市场下... 11月19日,英特尔在重庆举办的2025英特尔技术创新与产业生态大会上,中国区董事长王稚聪分享了英特...
极星2将搭载谷歌Gemini,... 11月20日,瑞典极星汽车宣布,从2026年起,极星2及后续车型将集成谷歌Gemini,作为现有Go...
用全运会金牌补全最后一块拼图,... 11月20日,十五运会羽毛球混双决赛,浙江组合郑思维/黄雅琼上演职业生涯“最后一舞”,他们最终以击败...
五位冠军共同启动!“广东健身地... 一键导航、无缝衔接各地体育场馆,打造“一站式”运动健身指南。11月20日,由广东省体育局主办的“广东...
特写 | 王欣瑜的“笑与累” 11月19日晚,当最后一分落地,珠海横琴国际网球中心球场的欢呼声冲破夜幕。王欣瑜和袁悦走上网前,笑着...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
华为乾崑生态大会今晚揭幕,阿维... 11月20日,阿维塔宣布与华为乾崑深化战略合作,具体合作细节将在今晚19:00的华为乾崑生态大会上公...
海珠民营经济服务周启动!国家级... 11月20日,广州海珠区举办民营经济服务周活动。该活动由海珠区委统战部、区科工商信局及区工商联共同组...
【2025打卡中国】在翰园碑林... 视频制作:焦炬凝11月19日,参加2025“打卡中国·潮涌东方——你好,河南!”网络国际传播活动的博...
视频丨中国游客赴日游锐减 日本... 日本首相高市早苗涉台错误言论所造成的负面影响持续发酵,日本旅游业及相关产业受到的冲击尤为严重。据日本...