谷歌TurboQuant算法突破AI内存瓶颈,存储芯片股暴跌
创始人
2026-03-26 11:42:01
0

3月26日,谷歌研究院宣布推出一项名为TurboQuant的全新极端压缩算法,旨在解决AI大模型中的键值缓存(KVCache)内存瓶颈问题。该算法通过压缩高维向量数据,减少内存消耗,同时保持AI模型的预测性能。TurboQuant的核心底层技术包括量化Johnson-Lindenstrauss(QJL)和PolarQuant,这两项技术共同作用,能够在不牺牲性能的前提下,大幅降低键值缓存的内存占用。

TurboQuant的运行机制分为两个关键步骤:首先,利用PolarQuant方法进行主体压缩,将数据向量转换为极坐标,省去了数据归一化步骤,消除了传统方法的内存开销;其次,QJL算法处理微小误差,仅需1比特的残差压缩算力,确保模型计算出精准的注意力分数。在Gemma和Mistral等开源大模型上的基准测试显示,TurboQuant能将键值缓存压缩至3比特,实现零精度损失,并将内存占用降低至1/6。此外,在H100GPU加速器上,4比特TurboQuant的运行速度比未量化的32比特基准提升了8倍。

谷歌TurboQuant压缩算法的推出对存储芯片市场产生了影响,导致相关巨头股价全线飘绿,美光科技下跌4%,西部数据下跌4.4%,希捷下跌5.6%,闪迪下跌6.5%。

相关内容

热门资讯

伊朗:美国向伊朗提出的15点停... 据伊朗学生通讯社25日报道,对于美国方面被曝向伊朗提出停战协议,伊朗政府信息委员会主席哈兹拉蒂说,“...
“英雄花开英雄城”大篷车驶进广... 春和景明,木棉盛放。3月24日,在全市上下深入开展“英雄花开英雄城”2026广州红色文化系列活动之际...
自动驾驶迈入规模化商业运营竞速... 如今在广州街头,全无人驾驶的Robotaxi、Robobus往来穿梭,日渐成为市民出行的选择之一,这...
从文脉厚度与服务温度,读懂许何... 顶端新闻记者 王佳卉从历史文化的“软实力”,到民生服务的“暖实力”,再到特色产业的“硬实力”,许昌这...
“头”等大事,周六解决! 粤BA常规赛第二轮即将打响本周六,战火蔓延至河源3月28日,汕头阿兄要来了!带着他们的狮头鹅带着他们...
阿里千问AI首上车!红旗HS6... 今日,阿里巴巴宣布千问智能体首次应用于汽车领域。一汽红旗的“灵犀座舱”成功接入千问,首发搭载于红旗H...
斯柯达2026年退出中国市场:... 近日,斯柯达被爆将于2026年中期退出中国市场,但仍会提供售后服务。斯柯达表示,将与区域合作伙伴合作...
特斯拉加州Robotaxi业务... 3月26日,据外媒Electrek报道,特斯拉在美国加州的Robotaxi自动驾驶出租车业务被当地监...
谷歌TurboQuant算法突... 3月26日,谷歌研究院宣布推出一项名为TurboQuant的全新极端压缩算法,旨在解决AI大模型中的...
5款新能源车安全测评全优!蔚来... 今日,中国保险汽车安全指数(C-IASI)发布了2025年测评车型第三次结果,涉及5款新能源汽车,包...