京东开源3B参数大模型JoyAI-LLM-Flash 强化学习新突破
创始人
2026-02-15 17:56:56
0

2月15日,京东宣布在HuggingFace平台开源了名为JoyAI-LLM-Flash的大模型,该模型拥有3B激活参数和48B总参数,经过20万亿文本Token的预训练,擅长前沿知识理解、推理能力、编程和智能体等方面。JoyAI-LLM-Flash采用了全新优化框架FiberPO,将纤维丛理论引入强化学习,并在训练中使用Muon优化器,通过微调SFT、DPO以及强化学习进一步训练。

JoyAI-LLM-Flash模型结合了Muon优化器和稠密MTP技术,有效解决了传统模型规模扩展时的不稳定问题,与非MTP版本相比,吞吐量提升了1.3x-1.7x。该模型的详细参数包括混合专家模型(MoE)总参数量48B、激活参数量3B、层数40(含Dense)、Dense层数量1、注意力隐藏维度2048、MoE隐藏维度768、多头注意力数量32、专家个数256、每Token专家数8、共享专家数1、词表大小129K、上下文长度128K、注意力机制MLA、激活函数SwiGLU。

相关内容

热门资讯

极氪009全新升级:900V高... 近日,极氪品牌旗下全新车型极氪009实车正式亮相,核心升级包括全栈900V高压架构与高阶智驾配置。新...
禾赛科技发布全球首款6D全彩激... 近日,禾赛科技发布了全球首款6D全彩激光雷达超感光芯片“毕加索SPAD-SoC”,并推出了搭载该芯片...
东风本田否认工厂关闭传闻,产能... 4月17日,东风本田对外界传言“明年关闭一家与东风汽车集团合资工厂”的消息作出回应,明确表示公司运营...
长城魏牌V9X豪华插混SUV开... 4月17日,长城汽车旗下魏牌V9X旗舰SUV正式开启预售,预售价区间为37.18-41.18万元。V...
问界M6预售破10万,4月22... 今日,鸿蒙智行宣布,问界M6将于4月22日19:00在春季新品发布会上正式上市。该车型自3月23日开...
2026车市降价潮:新能源车降... 2026年开年,车市降价潮持续,近70款车型集中降价,新能源车型平均降价3.8万元。这一价格战已持续...
灵光App豪掷1亿扶持创作者,... 今日,灵光App宣布启动“灵光闪应用创作者激励计划”,计划投入1亿元专项基金,旨在扶持优质闪应用和优...
微软33亿美元AI数据中心Fa... 4月20日,微软宣布其位于美国威斯康辛州Mount Pleasant的AI数据中心Fairwater...
索尼本田合资公司Afeela项... 4月20日,索尼集团与本田汽车宣布,将为合资公司索尼本田移动出行(SHM)探索新的业务方向。此前,S...
名创优品新设AI创新部,加速数... 近日,名创优品宣布成立AI创新部,该部门隶属于其数字科技中心,主要任务是构建智能体AI能力,以促进公...