2月5日,AI推理芯片公司Positron宣布了其第二代ASIC设计Asimov,该芯片声称在Token能效和性价比上是英伟达Rubin GPU的五倍。Positron强调,Transformer推理的性能瓶颈在于内存而非算力,因此Asimov的设计以内存为中心,实现了90%的内存带宽利用率,并消除了不必要的远程数据移动。
Asimov芯片由两个计算模块组成,每个模块都内置了支持多种数据格式的脉动阵列,并连接到432GB的LPDDR5x内存。此外,芯片通过PCIe6.0/CXL3.0接口连接至最多720GB的KVCache缓存用内存。Asimov的整体TDP为400W,内存总容量达到2304GB,总带宽为2.76TB/s,并支持风冷冷却。该芯片还支持16Tbps的多样化拓扑结构芯片间互联。
Positron的Titan推理服务器系统采用19英寸4U机架规格,集成了4颗Asimov芯片,能够支持16T参数模型推理和10M上下文窗口,单系统最多可部署4096套Titan。公司计划在2026年底完成Asimov芯片的流片,并预计在2027年初开始生产。

