今日,亚马逊云科技(AWS)在AWS re:Invent 2025年度技术大会上宣布推出其最新一代人工智能(AI)训练芯片Trainium3及其配套的Trainium3 UltraServer系统。Trainium3芯片基于尖端3纳米制程技术,与上一代产品相比,在AI模型训练和推理性能方面实现了显著提升,训练和高负载推理场景下的速度提升超过4倍,内存容量增至4倍。AWS还透露了正在研发中的Trainium4芯片,该芯片将支持与英伟达(NVIDIA)芯片协同工作,预计将带来又一次显著的性能飞跃。
AWS强调,新一代芯片和系统在能效方面较前代提升了40%,符合全球建设耗电量高达数吉瓦的大型数据中心的趋势。数千台UltraServer可相互连接,构建出搭载最多100万颗Trainium3芯片的超大规模集群,规模是上一代系统的10倍。每台UltraServer最多可容纳144颗Trainium3芯片。AWS承诺,这些高效系统也将为使用其AI云服务的客户节省开支。包括Anthropic、日本大语言模型公司Karakuri、SplashMusic以及Decart在内的多家客户已率先采用第三代Trainium芯片及系统,并显著降低了推理成本。
