蚂蚁集团开源万亿参数强化学习框架,6秒同步TB级参数!
创始人
2025-11-20 16:36:02
0

今日,蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。该框架专为极致性能打造,旨在解决强化学习(RL)流程中训练权重参数同步到推理模型的核心难题。Awex能够在秒级完成TB级大规模参数交换,显著降低RL模型训练延迟,具备极速同步性能、统一模型适配层、零冗余Resharding传输与原地更新、多模式传输支持、异构部署兼容以及灵活可插拔架构等特点。

Awex框架由三个主要组件构成:WeightWriter、WeightReader和MetaServer。WeightWriter负责训练进程中的权重Shard元数据收集、权重转换和发送;WeightReader在推理实例的控制进程上运行,负责权重Shard的元数据收集、权重转换和接受;MetaServer作为全局Server,负责训推引擎的服务发现和权重元数据交换。框架的核心功能模块包括训推权重统一转换、全局权重元数据计算与交换、P2P权重传输执行计划、NCCL权重传输和RDMA权重传输等。

在千卡规模的集群上,Awex使用NCCL传输数据能在一秒内完成10B规模的模型权重交换,使用RDMA传输时,1T模型权重交换耗时可缩短至六秒。未来,蚂蚁集团计划开源ASystem的其他核心RL组件,进一步完善开源强化学习训练生态。目前,Awex开源版已支持Megatron和SGLang引擎。

相关内容

热门资讯

4月新能源车销量逆势增长,比亚... 今日,乘联会发布了2026年4月份全国乘用车市场分析报告。报告显示,4月份全国乘用车市场零售量为13...
Vbot维他动力完成5亿Pre... 5月11日,Vbot维他动力宣布完成Pre-A轮融资,融资金额近5亿元人民币。本轮融资由东方嘉富、华...
广汽昊铂S600预售在即,4.... 今日,广汽昊铂官方宣布,昊铂S600预售发布会将于5月17日举行。广汽昊铂S600是一款定位为“新豪...
女子投诉演唱会座椅脏被文旅局官... 广西桂林市文化广电和旅游局5月11日通报:近日,有网友发布投诉桂林某演唱会座椅脏等相关信息,引起广泛...
全球媒体聚焦 | 外媒:美国与... 多家外媒近日注意到,美国发动的对伊战争,正给美国与北约、中东等盟友的关系带来深远且持久的负面影响,其...
视频丨城市打卡点上新 这些高颜... 乘地铁出行的同时,还能看到优美的景观,购买时尚的物品,这样的体验您享受过吗?跟随记者的镜头,走进各地...
提示!粤超第三轮比赛门票预约明... 2026年冠旭电子cleer·广东省城市足球超级联赛(粤超)本周回归。前两轮激战,精彩不断,名场面频...
2026国际青春诗会学术对话在... 2026国际青春诗会系列活动之“诗歌的传统与未来”中阿诗人学术对话在穗举行,逾百位诗人围绕多个议题展...
当粤剧遇见诗歌 中外诗人走进粤... 当粤剧遇见诗歌 当母亲节遇上国际青春诗会……不同语言,别样诗意;同一世界,同一“妈妈”文/羊城晚报全...