英伟达发布60B参数双塔架构AI模型,性能提升2.42倍!
创始人
2026-07-03 13:47:58
0

7月2日,英伟达宣布推出Nemotron-Labs-TwoTower,这是一种基于预训练自回归骨干网络的离散扩散语言模型,旨在解决大模型Token生成速度的瓶颈问题。该模型在Huggingface平台以开源权重形式发布,采用NVIDIANemotronOpenModelLicense授权协议,总参数达到60B,采用双塔(TwoTower)架构,包括30B的自回归模型(AR)/contextTower和30B的扩散/降噪Tower,每个Tower激活3B模型,128个可路由专家。

TwoTower架构的核心优势在于将文本生成任务中的上下文表示与去噪过程分离到两个独立的神经网络“塔”中。上下文塔保持冻结,专注于维护文本的自回归上下文,而去噪器塔则经过训练,负责对噪声块进行去噪。两个塔通过逐层交叉注意力连接协作,从而提高性能。英伟达表示,双塔架构在综合基准测试质量上保留了98.7%的质量表现,而实际运行时间吞吐量提高了2.42倍。这一创新架构有望为大模型的语言生成任务带来效率上的显著提升。

相关内容

热门资讯

AI编程助手ClaudeCod... 7月2日,科技媒体TheDecoder报道了Anthropic公司对其AI模型ClaudeFable...
英伟达发布60B参数双塔架构A... 7月2日,英伟达宣布推出Nemotron-Labs-TwoTower,这是一种基于预训练自回归骨干网...
零跑B10新配色亮相,智能驾驶... 今日,零跑汽车宣布推出全新B10车型,同时预热了两款新配色:风禾青、液态银。虽然官方尚未披露新车的具...
宝马新纯电iX5搭载远景动力4... 7月3日,远景动力宣布其46120大圆柱电池产品已在沧州和无锡江阴超级工厂规模化量产,并将为宝马集团...
大众汽车拟将中国研发车型引入欧... 7月3日,大众汽车集团正在探讨将中国研发的车型引入欧洲市场的可能性。集团已启动可行性研究,评估从中国...
雷克萨斯销量暴跌26%,新能源... 7月3日,雷克萨斯在华销量遭遇挑战。2026年5月,该品牌国内单月销量仅为1.13万台,同比下滑26...
奇瑞汽车持股智界汽车降至85%... 近日,智界汽车股权结构发生重大调整。奇瑞汽车持股比例由100%降至85%,新增两名股东芜湖瑞启和芜湖...
AI智能体ElementsCl... 7月3日,阿里达摩院联合中国人民大学、中国科学院大学等机构发布了首个超导材料发现AI智能体Eleme...
深蓝S05销量飙升,新能源SU... 近日,深蓝汽车公布2026年6月全球销量数据,当月销量达33625辆,连续四个月单月销量突破3万辆。...
韩国豪掷5万亿韩元打造主权AI... 7月3日,韩国政府宣布将利用AI浪潮带来的税收红利加速发展主权人工智能。韩国两大半导体巨头三星电子和...