2月24日,专注于LLM(大型语言模型)工作负载的AI芯片企业MatX宣布完成了5亿美元的B轮融资。此次融资吸引了包括世芯AIchip和美满Marvell在内的行业参与者以及多家投资企业的参与。MatX由两位前谷歌TPU工程师创立,致力于开发高性能AI芯片。
MatX正在开发一款名为MatXOne的芯片,该芯片采用可分割的脉动阵列结构,旨在结合大型阵列的能效和面积效率以及小型阵列的灵活性和高利用率。MatXOne综合了SRAM设计的低延迟和HBM方案的长上下文,据称能够实现业界领先的LLM吞吐量和与SRAM优先芯片相当的延迟表现。这款芯片能够适应训练、预填充、推理解码、强化学习等多种场景,旨在降低LLM的使用成本。
